你能推荐一个好的现代 GUI 下载管理器（wget 包装器吗？）[关闭]

Question

yukashima huksay

Asked: 2018-02-09 01:18:05 +0800 CST2018-02-09 01:18:05 +0800 CST 2018-02-09 01:18:05 +0800 CST

wget 卡在镜像网页的中间

772

我正在使用以下命令镜像一个网站：

wget -m -nc -p -E -k -np -e robots=off https://www.somesite.com/ & disown

一切都很好，直到我看到它卡在了

Reusing existing connection to www.somesite.com:443.

我关闭了那个tty。

我应该怎么做才能让它继续？

这是 wget 输出的一部分：

www.somesite.com/.../sport.html       [   <=>                                           ] 833.32K  1.53MB/s    in 0.5s    
Last-modified header missing -- time-stamps turned off.
2018-02-10 16:34:23 (1.53 MB/s) - ‘www.somesite.com/.../sport.html’ saved [853319]

--2018-02-10 16:34:23--  http://www.somesite.com/.../social
Reusing existing connection to www.somesite.com:80.
HTTP request sent, awaiting response... 200 OK
Length: unspecified [text/html]
Saving to: ‘www.somesite.com/.../social.html’

www.somesite.com/.../social.html      [ <=>                                             ] 141.35K   816KB/s    in 0.2s    

Last-modified header missing -- time-stamps turned off.
2018-02-10 16:34:24 (816 KB/s) - ‘www.somesite.com/.../social.html’ saved [144747]

--2018-02-10 16:34:24--  http://www.somesite.com/.../parliament
Reusing existing connection to www.somesite.com:80.
HTTP request sent, awaiting response... 200 OK
Length: unspecified [text/html]
Saving to: ‘www.somesite.com/.../parliament.html’

我使用的命令是：

wget -m -c -p -E -k -np -e robots=off https://www.somesite.com

有没有办法指示 wget 不下载它之前已经下载的相同 url？

1 个回答

Voted

Melebius · Answer 1 · 2018-02-09T02:51:38+08:00

只需再次运行该命令。wget足够聪明，可以继续下载。但是，您必须指定正确的选项。

例如，-nc如果您想重新下载更改的文件，请删除该选项（另请参阅如果 wget 中存在文件，则跳过下载？）：

-nc
--no-clobber
(...) 指定 -nc 时，(...) Wget 将拒绝下载较新的文件副本。因此，""no-clobber"" 在这种模式下实际上是用词不当——它不是阻止破坏（因为数字后缀已经阻止了破坏），而是阻止了多版本保存。

当使用 -r 或 -p 但没有 -N、-nd 或 -nc 运行 Wget 时，重新下载文件将导致新副本简单地覆盖旧副本。添加 -nc 将阻止此行为，而是导致保留原始版本并忽略服务器上的任何较新副本。

如果在下载大文件期间下载中断，您可能需要添加-c选项：

-c
--continue
继续获取部分下载的文件。当您想要完成由 Wget 的前一个实例或另一个程序启动的下载时，这很有用。

报价来源：man wget

您还应该考虑使用screenortmux而不是disown能够检查后台进程的状态和输出。

wget 卡在镜像网页的中间

如何运行 .sh 脚本？

如何安装 .tar.gz（或 .tar.bz2）文件？

如何列出所有已安装的软件包

无法锁定管理目录 (/var/lib/dpkg/) 是另一个进程在使用它吗？

wget 卡在镜像网页的中间

1 个回答

相关问题