这是我需要为https://www.gutenberg.org/cache/epub/100/pg100.txt上的分配 pg100.txt 获取的文件 我登录到 Linux 机器 ssh user@machine
wget https://www.gutenberg.org/cache/epub/100/pg100.txt
我得到了文件,但得到的文件是乱码。我想知道 1)我怎样才能得到正确的文本文件 2)为什么我做 wget 时文本会乱码,它在浏览器中正常打开。我通过putty从我的Windows 10机器登录到远程服务器(CentoS7)。
我尝试询问 SO 但机器人将我重定向到这里。如果这不是问的正确地方,请告诉我在哪里问。
Web 服务器在响应标头中提供有关响应主体的信息。
要仅查看标题,我们可以运行:
一旦我们看到内容实际上是用 gzip 压缩的,我们就可以使用 gunzip 来解压它:
当页面显示在现代浏览器中时,您会发现浏览器已经为我们完成了这项工作。