Neo_Returns Asked: 2018-05-25 04:56:03 +0800 CST2018-05-25 04:56:03 +0800 CST 2018-05-25 04:56:03 +0800 CST $ grep '[^az]\{22\}' /usr/share/dict/words 没有输出 772 执行后 grep '[a-z]\{22\}' /usr/share/dict/words 输出是 counterrevolutionaries electroencephalographs 但是在执行时 grep '[^a-z]\{22\}' /usr/share/dict/words 没有输出。 我期待它会产生与 grep -v '[a-z]\{22\}' /usr/share/dict/words 我的问题是出了什么问题,为什么? grep shell 2 个回答 Voted Best Answer Stéphane Chazelas 2018-05-25T05:31:52+08:002018-05-25T05:31:52+08:00 [specification]匹配指定集合中的排序元素(可以是语言环境排序算法中定义的字符或字符序列(例如,在 GNU 系统上的匈牙利语言环境中,dzs排序元素介于d和之间e))。 该规范可以包括 范围如a-z(or [.dzs.]-z) 用于整理在aand之间整理的元素z(请注意,它通常包括 abcdefghijklmnoprstuvwxyz 但在大多数语言环境中,它包括更多)。此外,由于 POSIX 未针对 POSIX 语言环境以外的语言环境指定它,因此这些范围在多大程度上基于排序规则,在不同实现之间存在显着差异。 单个字符或整理元素 ( x, [.dsz.]) POSIX 字符类[:alpha:],[:digit:] 等效类,例如[=e=]所有具有相同主要整理权重的整理元素e(可能包括类似的东西 é) 因此,例如,[acd[=e=]h-k[:digit:][.dzs.]]匹配一个整理元素,前提是它是a, c, d, dzsor 等价于e或整理于hand kor 被归类为digit。 如果规范以 开头^,那么它仍然匹配一个整理元素,但集合是互补的。这是除指定元素外的任何整理元素。 因此[^a-z]匹配任何不在a和之间排序的排序元素z。例如,它可能会匹配 on1和ẑ,可能会匹配X或DSZ取决于语言环境和grep实现,但不会匹配 on a,x也可能不会匹配zon é。 因此,grep '[^a-z]\{22\}'匹配包含在 before或 after排序的22排序元素序列的行。az Whilegrep -v '[a-z]\{22\}'匹配不包含 22 个整理元素序列的行,这些元素在 和 之间进行a整理z。 几乎不可能实现相同的匹配,您需要在两个元素之间-v包含不超过 21 个整理元素的行上进行匹配。但是如果语言环境支持多字符整理元素,那是不可能的。例如,在那些匈牙利语言环境中,匹配 on也匹配, ,所以你会发现那里,会匹配 on但也会匹配。[a-z][^a-z][a-z]dszdsz[a-z]{0,21}dszxxxyyyxxxyyyxxxyyyx[a-z]{22} 对于没有多字符整理元素的语言环境,您可以执行以下操作: grep '^[^a-z]*\([a-z]\{1,21\}[^a-z]\{1,\}\)*[a-z]\{0,21\}$' 现在,也有一些grep实现支持更高级的正则语法,带有一些否定运算符的选项。 例如,GNU 或 ast-open 实现grep支持类 perl(在 GNU grep 中使用 libpcre,ast-open 自己的 ast-open grep 实现)正则表达式,带有带有负前瞻运算符-P的选项。(?!pattern) (?!pattern)如果模式从那里开始不匹配,则在主题字符串的任何点与零宽度匹配。所以可以使用: grep -P '^(?!.*[a-z]{22})' 在行首匹配,前提是它后面没有任何数量的字符和 22[a-z]秒。但是请注意,在 PCRE 中(不是在 ast-open 中),[a-z]仅匹配 abcdefghijklmnopqrstuvwxyz 而与语言环境无关。 ast-open 还-X为他们所谓的增强正则表达式提供了一个选项。那些增强的正则表达式有一个!否定事物的运算符。x!将匹配除x(包括空字符串)以外的任何内容。 因此,使用 ast-open grep,您还可以执行以下操作: grep -X '^(.*[a-z]{22}.*)!$' AlexP 2018-05-25T05:23:54+08:002018-05-25T05:23:54+08:00 grep '[^a-z]\{22\}' /usr/share/dict/words 在文件中查找/usr/share/dict/words包含非小写字母的 22 个字符的字符串的行。该文件很可能不包含任何此类行。(为什么该文件会包含 22 个非字母的字符串?) grep -v '[a-z]\{22\}' /usr/share/dict/words 查找不包含 22 个字母的字符串的行。可能会有很多这样的行。(因为大多数单词都少于 22 个字母。)
[specification]
匹配指定集合中的排序元素(可以是语言环境排序算法中定义的字符或字符序列(例如,在 GNU 系统上的匈牙利语言环境中,dzs
排序元素介于d
和之间e
))。该规范可以包括
a-z
(or[.dzs.]-z
) 用于整理在a
and之间整理的元素z
(请注意,它通常包括 abcdefghijklmnoprstuvwxyz 但在大多数语言环境中,它包括更多)。此外,由于 POSIX 未针对 POSIX 语言环境以外的语言环境指定它,因此这些范围在多大程度上基于排序规则,在不同实现之间存在显着差异。x
,[.dsz.]
)[:alpha:]
,[:digit:]
[=e=]
所有具有相同主要整理权重的整理元素e
(可能包括类似的东西é
)因此,例如,
[acd[=e=]h-k[:digit:][.dzs.]]
匹配一个整理元素,前提是它是a
,c
,d
,dzs
or 等价于e
或整理于h
andk
or 被归类为digit。如果规范以 开头
^
,那么它仍然匹配一个整理元素,但集合是互补的。这是除指定元素外的任何整理元素。因此
[^a-z]
匹配任何不在a
和之间排序的排序元素z
。例如,它可能会匹配 on1
和ẑ
,可能会匹配X
或DSZ
取决于语言环境和grep
实现,但不会匹配 ona
,x
也可能不会匹配z
oné
。因此,
grep '[^a-z]\{22\}'
匹配包含在 before或 after排序的22
排序元素序列的行。a
z
While
grep -v '[a-z]\{22\}'
匹配不包含 22 个整理元素序列的行,这些元素在 和 之间进行a
整理z
。几乎不可能实现相同的匹配,您需要在两个元素之间
-v
包含不超过 21 个整理元素的行上进行匹配。但是如果语言环境支持多字符整理元素,那是不可能的。例如,在那些匈牙利语言环境中,匹配 on也匹配, ,所以你会发现那里,会匹配 on但也会匹配。[a-z]
[^a-z]
[a-z]
dsz
d
s
z
[a-z]{0,21}
dszxxxyyyxxxyyyxxxyyyx
[a-z]{22}
对于没有多字符整理元素的语言环境,您可以执行以下操作:
现在,也有一些
grep
实现支持更高级的正则语法,带有一些否定运算符的选项。例如,GNU 或 ast-open 实现
grep
支持类 perl(在 GNU grep 中使用 libpcre,ast-open 自己的 ast-open grep 实现)正则表达式,带有带有负前瞻运算符-P
的选项。(?!pattern)
(?!pattern)
如果模式从那里开始不匹配,则在主题字符串的任何点与零宽度匹配。所以可以使用:在行首匹配,前提是它后面没有任何数量的字符和 22
[a-z]
秒。但是请注意,在 PCRE 中(不是在 ast-open 中),[a-z]
仅匹配 abcdefghijklmnopqrstuvwxyz 而与语言环境无关。ast-open 还
-X
为他们所谓的增强正则表达式提供了一个选项。那些增强的正则表达式有一个!
否定事物的运算符。x!
将匹配除x
(包括空字符串)以外的任何内容。因此,使用 ast-open
grep
,您还可以执行以下操作:grep '[^a-z]\{22\}' /usr/share/dict/words
在文件中查找
/usr/share/dict/words
包含非小写字母的 22 个字符的字符串的行。该文件很可能不包含任何此类行。(为什么该文件会包含 22 个非字母的字符串?)grep -v '[a-z]\{22\}' /usr/share/dict/words
查找不包含 22 个字母的字符串的行。可能会有很多这样的行。(因为大多数单词都少于 22 个字母。)