有人知道我必须用来下载包含多个页面(使用 wget)的网站的一部分的确切命令吗?例子:
我想下载论坛中存在的某个页面。在这个论坛中有一篇关于“stderr”的文章。
地址是:“ https://forum.ubuntuusers.de/topic/stderr-umleitungen/ ”和“ https://forum.ubuntuusers.de/topic/stderr-umleitungen/2/ ”,因为它由两页组成。
我想要做的是用一个命令下载两个页面,而不是整个论坛。我该如何输入正确的命令?
系统:Linux/Lubuntu 16.04.2 LTS,64bit
最后一位
{,2}
是指示 wget 下载的大括号扩展:要下载第 3 页到第 6 页,请使用以下任一命令:
还有几个非常有用的wget 选项:-E 和 -k。
-E:如果下载了“text/html”类型的文件,并且 URL 不以正则表达式 `\.[Hh][Tt][Mm][Ll]?' 结尾,则该选项将导致后缀“. html" 附加到本地文件名。
-k:下载完成后,对文档中的链接进行转换,使其适合本地查看(即,将相对链接转换为绝对链接)。
请阅读 wget 手册页和手册以获取更多信息。