Alex O Asked: 2020-09-13 08:45:20 +0800 CST2020-09-13 08:45:20 +0800 CST 2020-09-13 08:45:20 +0800 CST 正则表达式无法匹配 Notepad++ 中的 UTF-8 字符 772 给定 Notepad++ 中的以下 UTF-8 文本: ? 1 ☺ ☺️ 2 ? 3 两者都只匹配第二行^[^ ]+。^[\S]+ 相同的表达式匹配 Visual Studio 2019 中的所有 3 行。 我错过了什么? regex notepad++ 1 个回答 Voted Best Answer Alex O 2020-09-16T09:15:37+08:002020-09-16T09:15:37+08:00 事实证明,NP++ 在搜索基本多语言平面 (BMP) 之外的 Unicode 字符时存在问题,这些字符的代码点介于\x{10000}和\x{10FFFF}(大于\x{FFFF})之间。 一种解决方法是使用代理对。 显然是 Boost Regex 的一个限制。 来源:https ://community.notepad-plus-plus.org/topic/19990/regexp-fails-to-match-utf-8-characters/
事实证明,NP++ 在搜索基本多语言平面 (BMP) 之外的 Unicode 字符时存在问题,这些字符的代码点介于
\x{10000}
和\x{10FFFF}
(大于\x{FFFF}
)之间。一种解决方法是使用代理对。
显然是 Boost Regex 的一个限制。
来源:https ://community.notepad-plus-plus.org/topic/19990/regexp-fails-to-match-utf-8-characters/