使用 Cloudflare 时，.htaccess 重定向到 www 仅适用于 HTTP（不适用于 HTTPS）

Question

v3ntus

Asked: 2024-01-30 01:16:03 +0800 CST2024-01-30 01:16:03 +0800 CST 2024-01-30 01:16:03 +0800 CST

.htaccess 重定向以删除带有查询的重复字符串

772

假设我有以下网址：

https://mywebsite.com/pages.html?limit=24&start=7440&t=3349.html.html.html

https://mywebsite.com/pages.html.html.html?limit=24&start=8136&t=3358

https://mywebsite.com/pages.html.html?limit=24&start=8136&t=3358.html.html.html.html

如何去掉重复的“.html”部分，只留下一个？

这是一个复杂的情况，经过两个小时的努力，我仍然找不到使用正确的正则表达式来使其工作的方法。

这是我尝试过的：

RewriteEngine On
RewriteBase /
RewriteCond %{QUERY_STRING} ^(.*)((.html){2,})(.*)$
RewriteRule ^(.*)$ https://mywebsite.com/%1%4 [QSA,R=302,L]

我使用 302，因为它是一个临时解决方法，直到我找到解决此问题根源的可行解决方案，但我不断遇到重定向循环。

我想只保留一个 .html，删除所有多次出现的 .html。

示例1：

https://mywebsite.com/pages.html?limit=24&start=7440&t=3349.html.html.html

should redirect to:

https://mywebsite.com/pages.html?limit=24&start=7440&t=3349.html

和

https://mywebsite.com/pages.html.html?limit=24&start=8136&t=3358.html.html.html.html

should redirect to:

https://mywebsite.com/pages.html?limit=24&start=8136&t=3358.html

很抱歉提出这个问题，但这对我来说特别棘手，我找不到解决方案。

提前致谢。

1 个回答

Voted

MrWhite · Answer 1 · 2024-01-30T02:22:56+08:00

RewriteCond %{QUERY_STRING} ^(.*)((.html){2,})(.*)$
RewriteRule ^(.*)$ https://mywebsite.com/%1%4 [QSA,R=302,L]

这里有几个问题：

您正在丢弃原始 URL 路径（即。/pages.html）
您正在将更正后的查询字符串（即%1%4）移动到 URL 路径（而不是查询字符串）中。如果应该的话?%1%4。
然后再次附加原始的“不正确”查询字符串（无论标志如何QSA）。这最终会导致重定向循环。
.html如果在查询字符串中仅重复一次，则会失败。（这会发生吗，就像 URL 路径中出现的那样？）

在您的示例中，倍数.html始终出现在 URL 末尾和/或查询字符串末尾。因此，正则表达式中的尾随(.*)似乎是不必要的（因为在重复的.html序列之后没有发生任何事情）。

请尝试以下方法：

# Multiple ".html" at end of query string
# (Also resolves multiple ".html" at end of URL-path - if any)
RewriteCond %{QUERY_STRING} (.+?\.html)(\.html)+$
RewriteRule (.+?\.html)(\.html)*$ /$1?%1 [NE,R,L]

# Multiple ".html" at end of the URL-path only
# (Query string + URL-path already handled by the above rule.)
RewriteRule (.+?\.html)(\.html)+$ /$1 [R,L]

通过这 2 条规则，最多只有 1 个重定向。第一条规则处理.html查询字符串中的错误倍数，同时更正 URL 路径。第二条规则仅处理 URL 路径（当查询字符串已经正确时）。

请注意，尾随(?的.+?一部分(.+?\.html)(\.html)*$) 使前面的量词变得非贪婪，因此我们消耗尽可能少的量。换句话说，我们只消耗.html第一个捕获组中的一个实例，而不是所有内容.html（或除了第二个规则中的最后一个实例之外的所有内容）。

只是第一条规则和第二条规则之间的正则表达式存在细微差别：(.+?\.html)(\.html)*$和(.+?\.html)(\.html)+$。在第一个 ( *) 中，附加尾随.html是可选的，但在第二个 ( +) 中，附加尾随是强制性的。

QSA任一规则都不需要该标志。在第一条规则中，我们重建查询字符串，因此原始查询字符串被丢弃（默认情况下）。在第二条规则中，默认情况下会传递查询字符串（已经正常）。

该NE标志在第一条规则中使用，因为反向引用（从QUERY_STRING服务器变量捕获）已经经过 URL 编码。

单个R标志默认为 302（临时），但为了可读性，明确显示可能会有所帮助。

.htaccess 重定向以删除带有查询的重复字符串

Vue 3：创建时出错“预期标识符但发现‘导入’”[重复]

为什么这个简单而小的 Java 代码在所有 Graal JVM 上的运行速度都快 30 倍，但在任何 Oracle JVM 上却不行？

具有指定基础类型但没有枚举器的“枚举类”的用途是什么？

如何修复未手动导入的模块的 MODULE_NOT_FOUND 错误？

`(表达式，左值) = 右值` 在 C 或 C++ 中是有效的赋值吗？为什么有些编译器会接受/拒绝它？

何时应使用 std::inplace_vector 而不是 std::vector？

在 C++ 中，一个不执行任何操作的空程序需要 204KB 的堆，但在 C 中则不需要

PowerBI 目前与 BigQuery 不兼容：Simba 驱动程序与 Windows 更新有关

AdMob：MobileAds.initialize() - 对于某些设备，“java.lang.Integer 无法转换为 java.lang.String”

我正在尝试仅使用海龟随机和数学模块来制作吃豆人游戏

.htaccess 重定向以删除带有查询的重复字符串

1 个回答

相关问题