Lo Scrondo Asked: 2018-12-19 15:19:31 +0800 CST2018-12-19 15:19:31 +0800 CST 2018-12-19 15:19:31 +0800 CST 在带注释的 PDF 文件中搜索文本字符串 772 不仅需要在 PDF 文件正文中搜索文本字符串,还需要在评论中搜索文本字符串,我在 Ubuntu 18.04 LTS 上安装了 Acrobat Reader。它的搜索功能工作正常,但我想知道是否有另一种方法来完成该任务(pdfgrep?) software-recommendation command-line pdf 18.04 pdfgrep 1 个回答 Voted Best Answer Kurt Pfeifle 2018-12-26T16:36:47+08:002018-12-26T16:36:47+08:00 1. PDF 源代码中注释中的字符串 对于 PDF 源代码中注释中的字符串,您可以放心地假设这些字符串未编码并显示为纯 ASCII 或 UTF-8 文本。 因此,以下命令应该可以工作: strings my.pdf | grep -i 'searchstring' 我应该补充一点,PDF 源代码中的注释将%在每个注释行的开头用 - 字符标记。 此外,当您在评论中搜索字符串时,Adobe Acrobat 和 Adobe Reader 都不会显示任何结果。 2. PDF 文本内容中的字符串 您不能假设在 PDF 中查找文本如此容易。但是,您可以执行以下操作以查找某个字符串: pdftotext -layout my.pdf - | grep -i 'searchstring' 不过,还有很多其他命令行方法(您自己提到过pdfgrep)。采取pdfgrep: pdfgrep -n -i 'searchstring' my.pdf (这里,-n打印与字符串匹配的页码,-i使搜索不区分大小写。)
1. PDF 源代码中注释中的字符串
对于 PDF 源代码中注释中的字符串,您可以放心地假设这些字符串未编码并显示为纯 ASCII 或 UTF-8 文本。
因此,以下命令应该可以工作:
我应该补充一点,PDF 源代码中的注释将
%
在每个注释行的开头用 - 字符标记。此外,当您在评论中搜索字符串时,Adobe Acrobat 和 Adobe Reader 都不会显示任何结果。
2. PDF 文本内容中的字符串
您不能假设在 PDF 中查找文本如此容易。但是,您可以执行以下操作以查找某个字符串:
不过,还有很多其他命令行方法(您自己提到过
pdfgrep
)。采取pdfgrep
:(这里,
-n
打印与字符串匹配的页码,-i
使搜索不区分大小写。)