我对 Linuxfind
命令的正则表达式用法感到很困惑。
我知道有一个 option regextype
,但是没有那个,根据当前的手册页,它应该使用 Emacs 正则表达式。 这个页面似乎说支持字符类(“这是一个 POSIX 功能”),但我的实验似乎表明没有任何东西像或[[:ascii:]]
永远不会起作用,除了这些是处理字符类的真正古老方法这一事实之外。相反,您似乎必须使用它,除了其他任何东西之外,它对于 Unicode 字符是无用的。[[:digit:]]
[[:alnum:]]
[a-zA-Z]
所以我转向regextype
:我发现你可以通过去获得一个可能的设置列表find -regextype help
。这给出了:
find: Unknown regular expression type ‘help’; valid types are ‘findutils-default’, ‘awk’, ‘egrep’, ‘ed’, ‘emacs’, ‘gnu-awk’, ‘grep’, ‘posix-awk’, ‘posix-basic’, ‘posix-egrep’, ‘posix-extended’, ‘posix-minimal-basic’, ‘sed’.
...所以我假设通过包含-regextype posix-basic
,例如,我可以运行这样的东西:
find . -maxdepth 1 -regextype posix-basic -regex .*\d.*
这会产生结果,但不是我希望的结果:当前目录中的所有文件和文件夹的名称都带有小写字母“d”!我期待所有名称至少有一个数字。
我find
在 Stack Exchange 上查看了很多 Linux 正则表达式问题,但我认为我没有看到一个展示“现代”字符类处理的问题。是否有任何regextype
选项能够处理这样的事情:
find . -maxdepth 1 -regextype ??? -regex '.*\d{3}\s+.*'
我的意思是“包含三位数字,后跟一个或多个空格字符”。即像 Java、Python、Javascript 等普通语言的正则表达式规则之类的东西......?
后来,以下评论
这是一个练习:创建一个目录并将一些随机名称的文件放入其中。然后添加具有以下名称的文件:“ctb117b”、“ctb117c”、“trt117a”。
然后我想隔离“117”文件。可能有名为“xxx0009333qqq”的文件。因此,例如,使用现代正则表达式引擎我会这样(允许前面的 ./):
find . -regex './\w{3}\d\{3}.*'
使用这些更古老的 Linux 正则表达式规则,我该怎么做?
find . -regextype posix-basic -regex '.*[[:digit:]]{3}.*'
什么都不生产。'.*[[:digit:]]+.*'
例如,也没有。如果有人有足够的兴趣,请给我看一些对你有用的东西(列出上面的文件)。
我建议使用这个: