不久前,我制作了一个视频,展示了如何使用Foxit Reader对 PDF 文件中的内容进行白化。
在白化内容后,我建议您可以通过使用“Microsoft Print to PDF”虚拟打印机将文档打印到新的 PDF 来阻止“该 PDF 的收件人”撤消您的白化(使用一些高级 PDF 编辑器)。
在我过去使用过的其他“打印到 PDF”虚拟打印机中,生成的文件是源文档中的所有文本都转换为图像的文件,并且新 PDF 中包含的唯一内容(生成) , 是文档在白化修改后外观的嵌入图像。在这种情况下,收件人无法撤消空白,因为 PDF 甚至不包含空白修改下的内容。
在最新的福昕阅读器中,白化内容的步骤发生了变化。而且,我想制作一个更新的视频。但是,在测试时,我注意到由“Microsoft Print to PDF”生成的 PDF 包含可以从 PDF 中突出显示、复制和粘贴的文本。由于 PDF不仅仅是一个嵌入的图像(没有文本),现在我不太确定高级 PDF 编辑器不能撤消白化。这对某些人来说可能非常重要,所以我想确保我对这个建议是正确的。
我没有高级 PDF 编辑器来确认这一点。所以,我希望有人(阅读本文)有知识(或资源)来明确确认这种技术是否确实是一种可靠的方法,以确保任何高级技术都不会泄露对 PDF 文档的私人编辑。
如果您使用的是专有工具,则无法保证这些工具将如何“优化”工作流程以及在转换中保留哪些元数据。
例如 1:如果图像层下方有文本层(以“帮助”文本 2 语音用户),则可以撤消白化。
例如 2:如果工具想要包含文本以启用图像的“文本搜索”,则文本可能存在于某些元数据中,如评论或注释。
例如 3:某些工具存储修订历史记录(以帮助“撤消和“审核”)&这些可能会泄漏不需要的文本。
例如 4:一些工具会生成缓存和索引(以帮助用户快速输出),这可能会显示不需要的文本。
最好的方法(保证内容“消失”)是:
(1)添加白色(通过在顶层放置正方形或通过使文本变黑)
(2)使用将白色页面转换为图像一些工具(偏执的用户可能想要(2A)检查生成的图像和(2B)消除所有不需要的元数据,尤其是评论和注释)
(3)将这些图像拼接成一组页面以共享和查看。
更新(包括支持材料):
因为有人认为这个答案有问题。
本文档第 11 页列出了几乎相同的过程:
我添加了一些文本和突出显示:
这 3 个阶段与我之前概述的过程相匹配。
提到的问题也是我之前列出的,即可搜索性和可访问性丢失。
虽然它说使用第三方工具来避免此类问题,但我认为使用此类第三方工具意味着将敏感内容包含在元数据中,一些用户可以并希望从中提取。我认为应该避免这些,即使失去可搜索性和可访问性,“仅图像”也是最安全的方式。
此处列出了“假设通过软件进行编辑”的陷阱:
(1)它列出了与(1A) Hillary Clinton / Sidney Blumenthal/利比亚、(1B) Apple / 美国地方法院、(1C) Citigroup / 社会安全号码和(1D) Paul Manafort / 俄罗斯相关的项目。
(2)它还说这些“明显”的方法不是有效的或万无一失的:
将所有这些放在一起,我认为此答案中列出的流程非常有效且万无一失!
对于可靠的编辑,我不知道有任何免费工具。所以,我有一些怀疑(不是个人的)你展示的方法真的足够可靠。
Acrobat Pro,如果我没记错的话,Foxit (Pro) 有编辑工具,可以真正删除内容以及任何相关的结构信息。然后是长期的行业标准,Appligent 的 Redax。使用此类工具。这可能远远超过它的价值……