Linux grep文件1中的内容在文件2中[重复]

Question

user2153235

Asked: 2023-03-08 00:19:13 +0800 CST2023-03-08 00:19:13 +0800 CST 2023-03-08 00:19:13 +0800 CST

sed 的贪婪匹配不应该匹配这个字符串，但是

772

从我在网上阅读的内容来看，很难理解sed. 我对这似乎是一场懒惰的比赛感到困惑。

在中~/tmp/tmp.txt，我有一行由 2 个制表符分隔的 3 个字母数字字符串：TheQuick<TAB>BrownFox<TAB>JumpedOver。如果我发出sed -n -E '/^.+\t.+\t.+$/p' ~/tmp/tmp.txt，该行将打印出来。

在我看来它不应该因为即使正则表达式匹配由 2 个制表符分隔的 3 个字符串，这些字符串也不是字母数字。所以第一个字符串应该贪婪地吞噬掉行中的所有字符，不留下任何与第一个制表符匹配的字符。

我怎样才能理解这种行为，以便我可以制作可靠的正则表达式？我正在使用 GNU sed。

1 个回答

Voted

terdon · Answer 1 · 2023-03-08T00:58:10+08:00

一个贪婪的匹配系统只是意味着它会尝试找到最大的匹配字符串（意思是第一个最大的，它将在整个正则表达式的第一个匹配处停止搜索），而不是即使匹配字符串也会在不匹配的字符串处停止存在。将其视为“为我找到最大可能的匹配项，但请务必为我找到匹配项！”的命令。由于允许第一个.\+吃掉整个字符串意味着正则表达式不匹配，引擎将返回并尝试其他内容。

在你的情况下，它更简单，因为你将正则表达式锚定到行的开头和结尾（^和$），所以.+永远不会到达行尾，因为它后面的正则表达式中还有其他内容。

这是一个可能有助于解释贪婪匹配的示例：

$ echo aaaaaaa | sed 's/a*/B/'
B

这里，由于正则表达式的a*意思是“匹配0个或多个连续a字符”，贪婪匹配会寻找最大可能的匹配字符串。非贪婪匹配，例如使用 PCRE，将返回：

$ echo aaaaaaa | perl -pe 's/a*?/B/'
Baaaaaaa

那是因为非贪婪会找到最短的匹配字符串而不是最长的。

我不明白你为什么提到字母数字或它有何相关性。也许您误解了.并认为它只匹配字母数字字符串，但事实并非如此；.将匹配所有内容（取决于您使用的正则表达式的风格以及您提供的选项，它甚至可以匹配换行符）。如果你想要字母数字字符串，你可以使用[[:alnum:]]匹配[a-zA-Z0-9].

sed 的贪婪匹配不应该匹配这个字符串，但是

模块 i915 可能缺少固件 /lib/firmware/i915/*

无法获取 jessie backports 存储库

如何将 GPG 私钥和公钥导出到文件

我们如何运行存储在变量中的命令？

如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域？

dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

如何从 systemctl 服务日志中查看最新的 x 行

Nano - 跳转到文件末尾

grub 错误：你需要先加载内核

如何下载软件包而不是使用 apt-get 命令安装它？

sed 的贪婪匹配不应该匹配这个字符串，但是

1 个回答

相关问题