我托管了一个 URL 中包含“”的网页,与托管静态文件project²
的磁盘目录相匹配。project²
基于 java 的客户端使用此页面从 URL(生物信息学软件IGV)加载数据。我的页面以http://localhost:60151/load?file=http://example.org/project²/some/data/file.bam
. 在浏览器中单击这些链接将导致 IGV 客户端(在 localhost 上运行)向GET http://example.org/project²/some/data/file.bam
我的服务器请求。
✅ Linux/Mac 上的 IGV 通过将此 URL 请求为 UTF-8 编码²
=来响应%C2%B2
,一切正常。
❌我新获得的Win-10用户的客户端请求²
= %B2
(windows-1252编码),导致404-not-found。
在尝试了几十件事之后,我对如何帮助这个用户束手无策。
我的印象是我应该能够在服务器端动态重写错误编码的 URL,以便它们最终仍然提供所需的数据,但我不知道使规则模式匹配的神奇字符组合转义字符。
我已经尝试过的事情
- 仔细检查 404 不是网络问题;我看到
GET %B2
我ssl_access_log
的 with404
作为返回的状态码,所以它确实是服务器在做它。 - “正确”方式:在将 URL 提供给客户端之前对 URL 进行 UrlEncoding。Perl
URI::Encode
encode_uri
将²
变成%C3%82%C2%B2
(显然ò
?)不知何故更错误? - 三重检查提供加载 URL 的网页是否为 utf-8
- 它提供标题
Content-Type: text/html; charset=UTF-8
- 设置
AddDefaultCharset UTF-8
在httpd.conf
- 似乎编码信息没有从 webbrowser API-link-click 传输到 Java 程序中
- 它提供标题
- 通过符号链接将目录“加倍”
并且projectª -> project²
project%B2 -> project²
(编辑:ª 没有任何关系;不知道我从哪里得到的ª
是 UTF8 匹配%B2
) - 试图以
mod_rewrite
几种不同的方式将“坏”的 URL 变成好的 URL,但似乎都没有:
RewriteEngine on
# RewriteRule Pattern Substitution [flags]
RewriteRule (.*)project%B2/(.*) $1project²/$2 [NE] # encoded 'bad' request, unencoded redirect
RewriteRule (.*)²(.*) $1%C2%B2$2 [B,NE] # config file is utf-8 encoded, so this is senseless.
RewriteRule (.*)%B2(.*) $12$2 [B,NE] # doesn't match?
RewriteRule (.*)TZZT(.*) $1test$2 # works, so RewriteEngine is working
RewriteRule和RewriteRuleFlags文档也不能帮助我理解我应该如何编码Pattern
-part 以便它可以工作:-(
类似的问题在这里
- Apache .htaccess 能否将编码 URI 中的百分比编码从 Win-1252 转换为 UTF-8?-> 外部编码程序
rewritemap
似乎有点矫枉过正,因为它实际上只有一个文件夹project²
,所以我的范围更小。 - 在 NGinX 中将ASCII 百分比编码的位置重写为其 UTF-8 编码的等效相同问题,指向上述 Apache 问题。