AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / computer / 问题 / 1742542
Accepted
LonnieBest
LonnieBest
Asked: 2022-09-16 07:54:53 +0800 CST2022-09-16 07:54:53 +0800 CST 2022-09-16 07:54:53 +0800 CST

PDF中的白化可以撤消吗?

  • 772

不久前,我制作了一个视频,展示了如何使用Foxit Reader对 PDF 文件中的内容进行白化。

在白化内容后,我建议您可以通过使用“Microsoft Print to PDF”虚拟打印机将文档打印到新的 PDF 来阻止“该 PDF 的收件人”撤消您的白化(使用一些高级 PDF 编辑器)。

在我过去使用过的其他“打印到 PDF”虚拟打印机中,生成的文件是源文档中的所有文本都转换为图像的文件,并且新 PDF 中包含的唯一内容(生成) , 是文档在白化修改后外观的嵌入图像。在这种情况下,收件人无法撤消空白,因为 PDF 甚至不包含空白修改下的内容。

在最新的福昕阅读器中,白化内容的步骤发生了变化。而且,我想制作一个更新的视频。但是,在测试时,我注意到由“Microsoft Print to PDF”生成的 PDF 包含可以从 PDF 中突出显示、复制和粘贴的文本。由于 PDF不仅仅是一个嵌入的图像(没有文本),现在我不太确定高级 PDF 编辑器不能撤消白化。这对某些人来说可能非常重要,所以我想确保我对这个建议是正确的。

我没有高级 PDF 编辑器来确认这一点。所以,我希望有人(阅读本文)有知识(或资源)来明确确认这种技术是否确实是一种可靠的方法,以确保任何高级技术都不会泄露对 PDF 文档的私人编辑。

pdf adobe-acrobat
  • 2 2 个回答
  • 79 Views

2 个回答

  • Voted
  1. Best Answer
    Prem
    2022-09-16T12:20:50+08:002022-09-16T12:20:50+08:00

    如果您使用的是专有工具,则无法保证这些工具将如何“优化”工作流程以及在转换中保留哪些元数据。

    例如 1:如果图像层下方有文本层(以“帮助”文本 2 语音用户),则可以撤消白化。

    例如 2:如果工具想要包含文本以启用图像的“文本搜索”,则文本可能存在于某些元数据中,如评论或注释。

    例如 3:某些工具存储修订历史记录(以帮助“撤消和“审核”)&这些可能会泄漏不需要的文本。

    例如 4:一些工具会生成缓存和索引(以帮助用户快速输出),这可能会显示不需要的文本。

    最好的方法(保证内容“消失”)是:
    (1)添加白色(通过在顶层放置正方形或通过使文本变黑)
    (2)使用将白色页面转换为图像一些工具(偏执的用户可能想要(2A)检查生成的图像和(2B)消除所有不需要的元数据,尤其是评论和注释)
    (3)将这些图像拼接成一组页面以共享和查看。

    更新(包括支持材料):
    因为有人认为这个答案有问题。

    本文档第 11 页列出了几乎相同的过程:

    ...
    PDF 中的编辑过程包括:
    • 用黑色矩形或使用黑色文本突出显示[[ Whiteout ]]每项机密信息 • 将[[ Image generation ]] PDF 文档转换为多个 TIFF 图像文件 •将[[ Stitching ]]文件转换并重新组合成一个 PDF 文档。 ... 注意:转换为 TIFF 并返回 PDF 的不幸后果是 该文件将不再可搜索,并且 由于文档结构和标签在此过程中丢失,因此丢失了可访问性。







    使用第三方编辑插件可以避免此类问题。
    ...
    重要提示:此时,您所做的只是
    掩盖机密信息。
    要删除信息,
    您需要通过转换为 TIFF 图像来“拼合”文件
    ...

    我添加了一些文本和突出显示:
    这 3 个阶段与我之前概述的过程相匹配。
    提到的问题也是我之前列出的,即可搜索性和可访问性丢失。
    虽然它说使用第三方工具来避免此类问题,但我认为使用此类第三方工具意味着将敏感内容包含在元数据中,一些用户可以并希望从中提取。我认为应该避免这些,即使失去可搜索性和可访问性,“仅图像”也是最安全的方式。

    此处列出了“假设通过软件进行编辑”的陷阱:

    (1)它列出了与(1A) Hillary Clinton / Sidney Blumenthal/利比亚、(1B) Apple / 美国地方法院、(1C) Citigroup / 社会安全号码和(1D) Paul Manafort / 俄罗斯相关的项目。

    (2)它还说这些“明显”的方法不是有效的或万无一失的:

    (2A)将文本的颜色更改为白色。这可能使它看起来好像要编辑的选定单词是隐藏的,但剩余的元数据可以显示隐藏的文本。
    (2B)使用评论工具涂黑:这些工具所做的编辑可以被删除以显示底层文本。
    (2C)删除词或节:元数据包含文档修订历史,可用于查看已删除的信息。
    (2D)使用深色胶带或不透明标记:通常的做法是用深色胶带或标记覆盖这些信息,然后将其扫描成 PDF 格式,而不是物理地剪掉敏感信息。然而,许多扫描仪足够灵敏,可以查看这些被覆盖的单词,即使它们看起来不可见。

    将所有这些放在一起,我认为此答案中列出的流程非常有效且万无一失!

    • 1
  2. Max Wyss
    2022-09-17T00:47:17+08:002022-09-17T00:47:17+08:00

    对于可靠的编辑,我不知道有任何免费工具。所以,我有一些怀疑(不是个人的)你展示的方法真的足够可靠。

    Acrobat Pro,如果我没记错的话,Foxit (Pro) 有编辑工具,可以真正删除内容以及任何相关的结构信息。然后是长期的行业标准,Appligent 的 Redax。使用此类工具。这可能远远超过它的价值……

    • 1

相关问题

  • Chrome 一直要求保存 PDF 并且从不打开它

  • 是否可以将保存为 PDF 文件的网页还原为网页?

  • CMYK 打印

  • 将双面扫描的 A3 pdf 裁剪并重新排列为 A4 格式

  • WebBrowser 刷新不会刷新 PDF 缩放级别

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    如何减少“vmmem”进程的消耗?

    • 11 个回答
  • Marko Smith

    从 Microsoft Stream 下载视频

    • 4 个回答
  • Marko Smith

    Google Chrome DevTools 无法解析 SourceMap:chrome-extension

    • 6 个回答
  • Marko Smith

    Windows 照片查看器因为内存不足而无法运行?

    • 5 个回答
  • Marko Smith

    支持结束后如何激活 WindowsXP?

    • 6 个回答
  • Marko Smith

    远程桌面间歇性冻结

    • 7 个回答
  • Marko Smith

    子网掩码 /32 是什么意思?

    • 6 个回答
  • Marko Smith

    鼠标指针在 Windows 中按下的箭头键上移动?

    • 1 个回答
  • Marko Smith

    VirtualBox 无法以 VERR_NEM_VM_CREATE_FAILED 启动

    • 8 个回答
  • Marko Smith

    应用程序不会出现在 MacBook 的摄像头和麦克风隐私设置中

    • 5 个回答
  • Martin Hope
    Saaru Lindestøkke 为什么使用 Python 的 tar 库时 tar.xz 文件比 macOS tar 小 15 倍? 2021-03-14 09:37:48 +0800 CST
  • Martin Hope
    CiaranWelsh 如何减少“vmmem”进程的消耗? 2020-06-10 02:06:58 +0800 CST
  • Martin Hope
    Jim Windows 10 搜索未加载,显示空白窗口 2020-02-06 03:28:26 +0800 CST
  • Martin Hope
    v15 为什么通过电缆(同轴电缆)的千兆位/秒 Internet 连接不能像光纤一样提供对称速度? 2020-01-25 08:53:31 +0800 CST
  • Martin Hope
    andre_ss6 远程桌面间歇性冻结 2019-09-11 12:56:40 +0800 CST
  • Martin Hope
    Riley Carney 为什么在 URL 后面加一个点会删除登录信息? 2019-08-06 10:59:24 +0800 CST
  • Martin Hope
    zdimension 鼠标指针在 Windows 中按下的箭头键上移动? 2019-08-04 06:39:57 +0800 CST
  • Martin Hope
    jonsca 我所有的 Firefox 附加组件突然被禁用了,我该如何重新启用它们? 2019-05-04 17:58:52 +0800 CST
  • Martin Hope
    MCK 是否可以使用文本创建二维码? 2019-04-02 06:32:14 +0800 CST
  • Martin Hope
    SoniEx2 更改 git init 默认分支名称 2019-04-01 06:16:56 +0800 CST

热门标签

windows-10 linux windows microsoft-excel networking ubuntu worksheet-function bash command-line hard-drive

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve