从终端检查 URL 重定向

Question

aborruso

Asked: 2019-02-02 03:04:59 +0800 CST2019-02-02 03:04:59 +0800 CST 2019-02-02 03:04:59 +0800 CST

如何保存网络资源，对 URL 编码字符应用解码？

772

我想用这个 URL “ http://pti.regione.sicilia.it/portal/page/portal/PIR_PORTALE/PIR_LaStrutturaRegionale/PIR_AssessoratoEconomia/PIR_DipBilancioTesoro/PIR_Areetematiche/PIR_ServizioStatistica/PIR_1839271.4501140784/PIR_idatidellaS %20settore%20sanit%E0.csv " 使用它的源名称，但保存它，将解码应用到它拥有的 URL 编码字符。

我们在 URL 中的名称是spesa%20del%20settore%20sanit%E0.csv，我想以编程方式将其转换为spesa del settore sanità.csv. 在源名称中，我们有%20一个空格，%E0即à.

如何进行此名称转换？

我可以从这个表开始创建一个搜索和替换列表，但我想有一个实用程序，一个可以为我做的库。但是，我没有找到简单的 wget 或 curl 的正确方法。

谢谢

2 个回答

Voted

JdeBP · Answer 1 · 2019-02-02T05:56:02+08:00

JdeBP

2019-02-02T05:56:02+08:002019-02-02T05:56:02+08:00

更普遍的不仅仅是wget：

该unvis工具执行此操作，-h并可选择指定百分比编码。（请注意，该工具的 OpenBSD 和 MacOS 版本没有此功能。）

请注意，您的百分比编码名称不是 UTF-8。

% printf '%s' 'spesa%20del%20settore%20sanit%E0.csv' | unvis -h | 十六进制转储 -C
00000000 73 70 65 73 61 20 64 65 6c 20 73 65 74 74 6f 72 |spesa del settor|
00000010 65 20 73 61 6e 69 74 e0 2e 63 73 76 |e sanit..csv|
0000001c
% printf '%s\n' 'spesa%20del%20settore%20sanit%E0.csv' | unvis -h | iconv -f latin1
spesa del settore sanità.csv
%

进一步阅读

unvis. FreeBSD 通用命令手册。2010 年 11 月 27 日。
unvis. OpenBSD 通用命令手册。2013-08-12。

2

darnir · Answer 2 · 2019-02-02T04:57:00+08:00

Best Answer

darnir

2019-02-02T04:57:00+08:002019-02-02T04:57:00+08:00

如果您的 Wget 是使用 IRI 支持构建的，那么它将自动处理这种情况。

看看你的wget --version。我的显示这个：

GNU Wget 1.20.1.7-5dce-dirty built on linux-gnu.

-cares +digest +gpgme +https +ipv6 +iri +large-file +metalink +nls 
+ntlm +opie +psl +ssl/gnutls

对你来说重要的部分是+iri. 大多数发行版应该在默认启用 IRI 的情况下编译它。

编辑：在这种情况下，服务器似乎发送了以 latin-1 编码的文件名。虽然默认假设始终是 utf-8。理想情况下，服务器应该发送一个Content-Disposition标头来提及这一点。--remote-encoding=latin1但是，如果您将选项传递给它，它可以由 Wget 处理。

1

如何保存网络资源，对 URL 编码字符应用解码？

进一步阅读

模块 i915 可能缺少固件 /lib/firmware/i915/*

无法获取 jessie backports 存储库

如何将 GPG 私钥和公钥导出到文件

我们如何运行存储在变量中的命令？

如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域？

dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

如何从 systemctl 服务日志中查看最新的 x 行

Nano - 跳转到文件末尾

grub 错误：你需要先加载内核

如何下载软件包而不是使用 apt-get 命令安装它？

如何保存网络资源，对 URL 编码字符应用解码？

2 个回答

进一步阅读

相关问题