我正在尝试从该网站下载整个目录:https ://data.geobasis-bb.de/geobasis/daten/dgm/xyz/
我尝试的是:
wget --show-progress -A 'dgm_*.zip' https://data.geobasis-bb.de/geobasis/daten/dgm/xyz/ -P /run/media/usr1/exthdd/dgm
据我了解,它应该做的是下载所有符合名称 schmea dgm_ .zip* 的文件。但是它只返回:
--2020-01-13 14:50:11-- https://data.geobasis-bb.de/geobasis/daten/dgm/xyz/
CA-Zertifikat »/etc/ssl/certs/ca-certificates.crt« wurde geladen
Auflösen des Hostnamens data.geobasis-bb.de (data.geobasis-bb.de)… 194.99.76.18, 194.76.232.112
Verbindungsaufbau zu data.geobasis-bb.de (data.geobasis-bb.de)|194.99.76.18|:443 … verbunden.
HTTP-Anforderung gesendet, auf Antwort wird gewartet … 200 OK
Länge: nicht spezifiziert [text/html]
Wird in »/run/media/lgoldmann/lg_backup_diss/dgm/index.html.tmp.2« gespeichert.
index.html.tmp.2 [ <=> ] 2,65M 4,69MB/s in 0,6s
2020-01-13 14:50:15 (4,69 MB/s) - »/run/media/lgoldmann/lg_backup_diss/dgm/index.html.tmp.2« gespeichert [2778920]
该网站还为 curl 提供了一个预先输入的命令,它工作得很好,但我试图找出我的 wget 命令出了什么问题。
您需要使用该
-r
选项来获取页面上的所有链接,否则,wget
将仅获取 Web 服务器提供的第一个页面(即默认或索引)并退出。-r
使用-np
用于排除父链接并确保wget
不跟随上一级或更高级别的链接是明智的。此外,您可能不想
wget
在本地重建站点的目录结构而只下载文件,因此也可以使用如下-nd
选项: