我正在尝试下载整个网站以供离线查看
wget --mirror -p --convert-links https://www.example.com
但完成后,某些 HTML 文档没有扩展名。Windows 只是声明它们的文件类型是File
. .html
我可以通过添加到文件名(我在命令提示符中使用)将它们更改为 HTML 文档ren *.* *.html
,但是链接无法正常工作。我如何让 wget 将 HTML 文档下载为 HTML 或自动重组链接以使用新文件?有超过 10,000 个单独的 HTML 文件,所以我不想手动完成。
我正在运行 Windows 10 并通过适用于 Linux 的 Windows 子系统使用 Ubuntu 18.04 终端。
所以我想通了。我必须添加选项
-E
, or--html-extension
,以使其强制文件成为.html
文件,从而使整个字符串成为: