我想用 wget 下载这个站点,为此我使用以下命令:
wget.exe --no-clobber --no-parent -r --convert-links --page-requisites -U Mozilla "http://www.s-manuals.com/smd/"
这对我来说没问题,但链接的 PDF 文件位于我的 URL 示例同一级别的文件夹中:
http://www.s-manuals.com/pdf/datasheet/a/f/afn3400_alpha-mos.pdf
所以我也需要下载/pdf/
文件夹。问题是,如果它在同一级别的目录中,--no-parent
选项会避免这个目录,但是如果我删除--no-parent
整个站点将被下载,所以我想知道是否有一个选项允许我只下载这 2 个文件夹?
您可以使用该
--include
选项而不是--no-parent
指定要包含在下载中的特定目录:有关更多详细信息,请参阅有关基于目录的限制的文档。