很多时候,如果我遇到一些有趣的内容、辩论等,其中涉及一些 pdf,我很幸运,通常我会让作者将内容/pdf 邮寄给我,或者在 IM 上给我发送相同的内容或其他. 随着时间的推移,我忘记了上下文或谁将内容发送给我。虽然我不知道限制,但我很确定至少可以添加几个字段。例如,这里是我正在查看的 pdf 文件的元数据。
File Size : 3.6 MB
File Modification Date/Time : 2019:11:24 01:11:52+05:30
File Access Date/Time : 2019:11:24 01:12:00+05:30
File Inode Change Date/Time : 2019:11:24 01:11:54+05:30
File Permissions : rw-r--r--
File Type : PDF
File Type Extension : pdf
MIME Type : application/pdf
PDF Version : 1.4
Linearized : No
Page Count : 54
Producer : Mac OS X 10.11.6 Quartz PDFContext
Creator : LaTeX with hyperref package
Create Date : 2018:05:01 19:56:31Z
Modify Date : 2018:05:01 19:56:31Z
现在我问一种方法,我可以添加诸如超链接之类的字段(这样我就可以记住我从哪里下载了特定文件),或者from : [email protected]
我总是可以知道/参考或在以后找出谁共享了内容/pdf文件与我一起。我确实看到了 pdftk 的手册页,或者更确切地说是 Debian 中的 pdftk-java。有一个东西叫update_info
,但共享的例子并没有让我很容易理解一个人应该如何使用它。有人可以帮忙吗?
首先,您必须导出相关文件的元数据。命令
pdftk file.pdf dump_data output metadata
将生成
metadata
一个包含所有元数据的文件file.pdf
。在此文件中,您将找到以下形式的结构:您可以通过添加行来创建自己的元数据密钥
到文件。最后,您需要更新
file.pdf
with的元数据请注意,后者会生成一个新文件
file2.pdf
。现在,您有两个文件:file1.pdf
没有添加的元数据和file2.pdf
您的自定义元数据键。exiftool
您可以使用返回的命令检查一切是否顺利您可以使用 pdftk 通过将文档的页面复制到新的 PDF 中来去除文档中的所有 Info 和 XMP 元数据,如下所示:
pdftk A=mydoc.pdf cat A 输出 mydoc.no_metadata.pdf