AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / ubuntu / 问题 / 1004146
Accepted
yukashima huksay
yukashima huksay
Asked: 2018-02-09 01:18:05 +0800 CST2018-02-09 01:18:05 +0800 CST 2018-02-09 01:18:05 +0800 CST

wget 卡在镜像网页的中间

  • 772

我正在使用以下命令镜像一个网站:

wget -m -nc -p -E -k -np -e robots=off https://www.somesite.com/ & disown

一切都很好,直到我看到它卡在了

Reusing existing connection to www.somesite.com:443.

我关闭了那个tty。

我应该怎么做才能让它继续?

这是 wget 输出的一部分:

www.somesite.com/.../sport.html       [   <=>                                           ] 833.32K  1.53MB/s    in 0.5s    
Last-modified header missing -- time-stamps turned off.
2018-02-10 16:34:23 (1.53 MB/s) - ‘www.somesite.com/.../sport.html’ saved [853319]

--2018-02-10 16:34:23--  http://www.somesite.com/.../social
Reusing existing connection to www.somesite.com:80.
HTTP request sent, awaiting response... 200 OK
Length: unspecified [text/html]
Saving to: ‘www.somesite.com/.../social.html’

www.somesite.com/.../social.html      [ <=>                                             ] 141.35K   816KB/s    in 0.2s    

Last-modified header missing -- time-stamps turned off.
2018-02-10 16:34:24 (816 KB/s) - ‘www.somesite.com/.../social.html’ saved [144747]

--2018-02-10 16:34:24--  http://www.somesite.com/.../parliament
Reusing existing connection to www.somesite.com:80.
HTTP request sent, awaiting response... 200 OK
Length: unspecified [text/html]
Saving to: ‘www.somesite.com/.../parliament.html’

我使用的命令是:

wget -m -c -p -E -k -np -e robots=off https://www.somesite.com

有没有办法指示 wget 不下载它之前已经下载的相同 url?

wget downloads
  • 1 1 个回答
  • 3287 Views

1 个回答

  • Voted
  1. Best Answer
    Melebius
    2018-02-09T02:51:38+08:002018-02-09T02:51:38+08:00

    只需再次运行该命令。wget足够聪明,可以继续下载。但是,您必须指定正确的选项。

    例如,-nc如果您想重新下载更改的文件,请删除该选项(另请参阅如果 wget 中存在文件,则跳过下载?):

    -nc
    --no-clobber
    

    (...) 指定 -nc 时,(...) Wget 将拒绝下载较新的文件副本。因此,""no-clobber"" 在这种模式下实际上是用词不当——它不是阻止破坏(因为数字后缀已经阻止了破坏),而是阻止了多版本保存。

    当使用 -r 或 -p 但没有 -N、-nd 或 -nc 运行 Wget 时,重新下载文件将导致新副本简单地覆盖旧副本。添加 -nc 将阻止此行为,而是导致保留原始版本并忽略服务器上的任何较新副本。

    如果在下载大文件期间下载中断,您可能需要添加-c选项:

    -c
    --continue
    

    继续获取部分下载的文件。当您想要完成由 Wget 的前一个实例或另一个程序启动的下载时,这很有用。

    报价来源:man wget

    您还应该考虑使用screenortmux而不是disown能够检查后台进程的状态和输出。

    • 1

相关问题

  • 你能推荐一个好的现代 GUI 下载管理器(wget 包装器吗?)[关闭]

  • 9.10 中下载管理器的视频下载问题

  • PPA 软件包下载分析?[复制]

  • 在哪里可以找到 Ubuntu ISO 映像的校验和?[复制]

  • 为什么应用系统范围的网络代理设置只影响超级用户(root)?[关闭]

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    如何运行 .sh 脚本?

    • 16 个回答
  • Marko Smith

    如何安装 .tar.gz(或 .tar.bz2)文件?

    • 14 个回答
  • Marko Smith

    如何列出所有已安装的软件包

    • 24 个回答
  • Marko Smith

    无法锁定管理目录 (/var/lib/dpkg/) 是另一个进程在使用它吗?

    • 25 个回答
  • Martin Hope
    Flimm 如何在没有 sudo 的情况下使用 docker? 2014-06-07 00:17:43 +0800 CST
  • Martin Hope
    Ivan 如何列出所有已安装的软件包 2010-12-17 18:08:49 +0800 CST
  • Martin Hope
    La Ode Adam Saputra 无法锁定管理目录 (/var/lib/dpkg/) 是另一个进程在使用它吗? 2010-11-30 18:12:48 +0800 CST
  • Martin Hope
    David Barry 如何从命令行确定目录(文件夹)的总大小? 2010-08-06 10:20:23 +0800 CST
  • Martin Hope
    jfoucher “以下软件包已被保留:”为什么以及如何解决? 2010-08-01 13:59:22 +0800 CST
  • Martin Hope
    David Ashford 如何删除 PPA? 2010-07-30 01:09:42 +0800 CST

热门标签

10.10 10.04 gnome networking server command-line package-management software-recommendation sound xorg

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve