在非 root 用户上用 bash 替换 zsh

Question

Asked: 2024-01-23 01:21:09 +0800 CST2024-01-23 01:21:09 +0800 CST 2024-01-23 01:21:09 +0800 CST

Bash [[ test =~ regex ]] 与 perl 命令结果

772

bash 运算符=~相当于perl调用吗？

filename="test-33.csv"
regex="([^.]+)(-\d{1,5})(\.csv)"

通过 bash 测试：

if [[ "$filename" =~ $regex ]]; then echo "it matches"; else echo "doesn't match"; fi
# doesn't match

if [[ "$filename" =~ ([^.]+)(-\d{1,5})(\.csv) ]]; then echo "matches"; else echo "doesn't match"; fi
# doesn't match

和perl：

result="$(perl -e "if ('$filename' =~ /$regex/) { exit 0;} else { exit 1;} ")"
if [[ result ]]; then echo "it matches"; else echo "doesn't match"; fi
# it matches

我对 bash 操作符有什么遗漏吗=~？这与贪婪与非贪婪迭代器 ( ) 有关系吗[^.]+？

3 个回答

Voted

Chris Davies · Answer 1 · 2024-01-23T05:45:00+08:00

有几种不同类型的正则表达式，每种类型都添加更多运算符（因此如果要将它们视为文字，则需要转义更多字符）。

操作=~员在文档中进行了描述（请参阅man bash您的系统或在线），如下所示，

另外还有一个二元运算符 ,=~可用，其优先级与==和相同!=。使用时，运算符右侧的字符串被视为POSIX 扩展正则表达式并进行相应匹配

grep -E扩展正则表达式 (ERE) 可以与(以前的)匹配egrep。您的示例是 Perl 兼容正则表达式 (PCRE)，它是 ERE 的超集，不能与=~. 但是，可以通过替换为进行简单\d调整[[:digit:]]：

echo abc-123.csv | grep -E '([^.]+)(-\d{1,5})(\.csv)'             # ERE fails
echo abc-123.csv | grep -P '([^.]+)(-\d{1,5})(\.csv)'             # PCRE matches with GNU grep

echo abc-123.csv | grep -E '([^.]+)(-[[:digit:]]{1,5})(\.csv)'    # ERE matches modified expression

因此，鉴于这grep -E相当于=~我们可以这样写，

if [[ "$filename" =~ ([^.]+)(-[[:digit:]]{1,5})(\.csv) ]]
then
    echo "matches"
else
    echo "doesn't match"
fi

请注意，您的 ERE 可能应该以为前缀^和后缀$，并[^.]+调整为[^-.]+以确保您无法匹配诸如之类的字符串abc-def-12345678-123.csv.txt：

^[^-.]+-[[:digit:]]{1,5}\.csv$

如果您绝对决定使用 PCRE 而不是 ERE，则必须使用外部工具（例如 GNU 实现）grep来执行匹配。但这效率较低，并且与上面给出的有关边界的相同建议也适用于此处：

if echo "$filename" | grep -qP '([^.]+)(-\d{1,5})(\.csv)'
then
    echo "matches"
else
    echo "doesn't match"
fi

基本 RE（RE 或 BRE）和 ERE 的 POSIX 参考位于https://pubs.opengroup.org/onlinepubs/9699919799/basedefs/V1_chap09.html，Perl RE (PCRE) 的参考位于https:// www.pcre.org/original/doc/html/pcrepattern.html。请注意，这两种文档都不是最容易理解的。

最后你问，

这与贪婪与非贪婪迭代器有关吗([^.]+)？

这不是贪婪/非贪婪迭代器。[^.]+是贪婪的，意味着“除了点 ( .)之外的一个或多个”。ERE 没有非贪婪运算符。PCRE 可以定义非贪婪运算符，例如*或+通过在其后面添加?。例如对比度a*和a*?；第一个将匹配a尽可能多的字符，第二个将匹配尽可能少的字符。

括号( … )是分组，而不是贪婪指标。

hidigoudi · Answer 2 · 2024-01-23T03:24:38+08:00

运算符=~inBash shell相当于grep -EGNU 命令。Perl正则表达式不被它识别。你需要做类似的事情：

~$ [ $(echo "$filename" | grep -Po "$regex") ] && echo "it matches" || echo "does not match"
it matches

拥有同等的。

关于grep使用的选项：

-o, --only-matching       show only the part of a line matching PATTERN
-P, --perl-regexp         PATTERN is a Perl regular expression

使用您的原始形式，这看起来像：

if [[ $(echo "$filename" | grep -Po "$regex") ]]; then echo "it matches"; else echo "does not match"; fi

这也有效：

if [ $(echo "$filename" | grep -Po "$regex") ]; then echo "it matches"; else echo "does not match"; fi

您还可以执行以下操作：

yyy@xxx:~$ filename="test-33.csv"
yyy@xxx:~$ regex="([^.]+)(-\d{1,5})(\.csv)"
yyy@xxx:~$ result=$(echo "$filename" | grep -Po "$regex")
yyy@xxx:~$ if [[ $result ]]; then echo "it matches"; else echo "does not match"; fi
it matches
yyy@xxx:~$

glenn jackman · Answer 3 · 2024-01-23T06:32:03+08:00

Bash扩展了 glob 模式，更接近正则表达式。[[...]]在运算符内==进行全局样式模式匹配。

filename=test-33.csv
# one or more non-dots, a hyphen, a digit, optionally 4 more digits, the extension
pattern='+([^.])-[0-9]?([0-9])?([0-9])?([0-9])?([0-9]).csv'
[[ $filename == $pattern ]] && echo Y || echo N

如果您使用正则表达式来过滤文件名列表，请在 for 循环中使用 glob 模式。

shopt -s extglob
for file in $pattern; do
    # do something with the file.
    echo "$file"
done

笔记

命令shopt：扩展的 glob 会在其中自动启用[[...]]，但在其他情况下不会自动启用。
$pattern在这些代码片段中特别未加引号，以便将其作为模式而不是文字字符串进行处理。

Bash [[ test =~ regex ]] 与 perl 命令结果

如何减少“vmmem”进程的消耗？

从 Microsoft Stream 下载视频

Google Chrome DevTools 无法解析 SourceMap：chrome-extension

Windows 照片查看器因为内存不足而无法运行？

支持结束后如何激活 WindowsXP？

远程桌面间歇性冻结

子网掩码 /32 是什么意思？

鼠标指针在 Windows 中按下的箭头键上移动？

VirtualBox 无法以 VERR_NEM_VM_CREATE_FAILED 启动

应用程序不会出现在 MacBook 的摄像头和麦克风隐私设置中

Bash [[ test =~ regex ]] 与 perl 命令结果

3 个回答

相关问题