我想从 X 网站保存/下载 pdf,然后将所有这些 pdf 合并为一个,这样我就很容易一次看到所有这些。
我做了什么,
从网站获取 pdf
wget -r -l1 -A.pdf --no-parent http://linktoX
将pdf合并为一个
gs -dNOPAUSE -sDEVICE=pdfwrite -sOUTPUTFILE=Combined_`date +%F`.pdf -dBATCH file1.pdf file2.pdf file3.pdf
我的问题/问题是,我想在一个脚本中将整个过程自动化,这样我就不必每天都这样做了。这里每天在 X 中添加新的 pdf。
那么,我该如何执行上面的第 2 步,而不提供所有 pdf 的完整列表,我尝试在第 2 步中执行file*.pdf
;但它以随机顺序组合了所有pdf。
下一个问题是,文件*.pdf 的总数每天都不相同,有时 5 个 pdf 有时 10 个......但好的是它按 file1.pdf file2.pdf 的顺序命名......
所以,我需要一些帮助来完成上述第 2 步,以便所有 pdf 都按顺序组合,我不必明确给出每个 pdf 的名称
谢谢。
更新:这解决了问题
pdftk `ls -rt kanti*.pdf` cat output Kanti.pdf
我ls -rt
按照file1.pdf
首先下载的方式进行操作,然后file2.pdf
以此类推...只是ls -t
在file20.pdf
开始和file1.pdf
最后...
尝试pdftk并使用如下排序:
代替 file*.pdf,您可以使用反引号使用另一个命令输出您想要的文件列表,例如
ls ...
在 chmeee 的答案中。您应该可以像这样使用原始的 ghostscript 命令:这将按修改日期对文件进行排序,最早的在前:
这将对它们进行数字排序,从第 5 个字符开始: