正则表达式：匹配直到“，”，但如果“，”在括号内则不匹配

Question

mon

Asked: 2023-10-08 09:01:07 +0800 CST2023-10-08 09:01:07 +0800 CST 2023-10-08 09:01:07 +0800 CST

sed - 为什么 '[.]' 与行的开头和结尾匹配？[复制]

772

为什么行的开头和结尾是匹配的[.]*以及如何避免它？

看起来模式与单词边界匹配，但不确定它是否按照设计以及它实现了哪个规范。

$ echo " a " | sed -n 's/[.]*/X/pg'
X XaX X

$ echo " a " | sed -n 's/[\b]*/X/pg'
X XaX X

1 个回答

Voted

jhnc · Answer 1 · 2023-10-08T14:32:19+08:00

请注意，\b括号内没有特殊含义。它只是一个字符列表。

[.]*并[\b]*匹配括号中的零个或多个字符。

因此，它们匹配一个或多个字符的任何运行，其中紧邻字符运行之前和之后的空字符串只是该运行的一部分。

它们还匹配任何前面或后面不是连续字符的空字符串。

用更明显的东西替换空间，您的输入是：sas

字符串中没有出现.任何字符\, 。b因此不存在长度为 1 或更长的游程。通过此输入，和都[.]*相当于[\b]*“匹配空字符串”。

行首和第一个s匹配之间的空字符串
sfirst和amatches之间的空字符串
a和第二个s匹配之间的空字符串
s第二行和行尾之间的空字符串匹配

这 4 个匹配解释了X添加到示例输出中的 s。

用于\b表示单词边界并不标准，尽管某些版本sed接受它（或相关的\<and \>）。

不使用此扩展更安全，当然也不使用*.

即使它的版本sed似乎支持它，也会产生不直观且不一致的结果。

例如，对于 GNU sed 4.8：

$ echo ,aa, | sed 's/\b/x/g'
,xaax,
$ echo ,aa, | sed 's/\b*/x/g'
,aa,
$ echo ,aa, | sed 's/\b\{1,\}/x/g'
sed: -e expression #1, char 14: Invalid preceding regular expression
$ echo ,aa, | sed 's/\(\b\)\{1,\}/x/g'
,xaax,

对于 busybox sed 1.30.1：

$ echo ,aa, | busybox sed 's/\b/x/g'
,xaxa,
$ echo ,aa, | busybox sed 's/\b*/x/g'
,aa,
$ echo ,aa, | busybox sed 's/\b\{1,\}/x/g'
sed: bad regex '\b\{1,\}': Invalid preceding regular expression
$ echo ,aa, | busybox sed 's/\(\b\)\{1,\}/x/g'
,xaxa,

甚至像 Perl 这样的其他程序也需要小心：

$ echo ,aa, | perl -ple 's/\b/x/g'
,xaax,
$ echo ,aa, | perl -ple 's/\b*/x/g'
x,xaxax,x
$ echo ,aa, | perl -ple 's/\b{1,}/x/g'
'1,' is an unknown bound type in regex; marked by <-- HERE in m/\b{1, <-- HERE }/ at -e line 1.
$ echo ,aa, | perl -ple 's/(\b){1,}/x/g'
,xaax,
$ echo ,aa, | perl -ple 's/\b+/x/g'
,xaax,

sed - 为什么 '[.]' 与行的开头和结尾匹配？[复制]

使用 <font color="#xxx"> 突出显示 html 中的代码

为什么在传递 {} 时重载解析更喜欢 std::nullptr_t 而不是类？

您可以使用花括号初始化列表作为（默认）模板参数吗？

为什么列表推导式在内部创建一个函数？

我正在尝试仅使用海龟随机和数学模块来制作吃豆人游戏

java.lang.NoSuchMethodError: 'void org.openqa.selenium.remote.http.ClientConfig.<init>(java.net.URI, java.time.Duration, java.time.Duratio

为什么 'char -> int' 是提升，而 'char -> Short' 是转换（但不是提升）？

为什么库中不调用全局变量的构造函数？

std::common_reference_with 在元组上的行为不一致。哪个是对的？

C++17 中 std::byte 只能按位运算？

sed - 为什么 '[.]' 与行的开头和结尾匹配？[复制]

1 个回答

相关问题