因此,当我尝试使用 wget 下载此网页时,文本和样式效果很好,但缺少一些图像。经过进一步研究,文件无法下载,因为 wget 尝试从中检索它们的 url 无效,如控制台输出所示:
URL transformed to HTTPS due to an HSTS policy
--2021-07-13 21:53:51-- https://www.inhaltsangabe.de/autoren/%7B%7B%20data.avatar_url%20%7D%7D
Reusing existing connection to [www.inhaltsangabe.de]:443.
HTTP request sent, awaiting response... 301 Moved Permanently
Location: https://www.inhaltsangabe.de/autoren/%7B%7B%20data.avatar_url%20%7D%7D/ [following]
--2021-07-13 21:53:52-- https://www.inhaltsangabe.de/autoren/%7B%7B%20data.avatar_url%20%7D%7D/
Reusing existing connection to [www.inhaltsangabe.de]:443.
HTTP request sent, awaiting response... 404 Not Found
2021-07-13 21:53:53 ERROR 404: Not Found.
网站上的实际图像是可访问的,并且具有以下 url:
https://www.inhaltsangabe.de/wp-content/themes/yootheme/cache/brecht-276fafb8.jpeg
其他图像在下载的文件中工作正常。这似乎与url编码有关,但我不知道如何解决这个问题。
我的命令:
wget -p www.inhaltsangabe.de/autoren/brecht
(也请温柔,因为这是我在这里提出的第一个问题)