grep --line-buffered 直到 X 行？

Question

user9371654

Asked: 2019-04-22 11:28:50 +0800 CST2019-04-22 11:28:50 +0800 CST 2019-04-22 11:28:50 +0800 CST

提取具有两个或更多点的线

我需要提取（或计算）具有两个或多个点的行（在文件中）。行不应该以点开头（如果以点结尾也可以），并且不能有两个点连续（即点都用非点字符分隔）。

输出示例：

a.b.
a.b.com
a.b.c.
a.b.c.com

但不是：

a.com
a..b
a.b.c..d

我做了这个命令：

grep -P '^[^.]+\.([^.]+\.)+[.]+' file.txt | wc -l

但它没有找到任何匹配的行。我该怎么做？

G-Man Says 'Reinstate Monica' · Answer 1 · 2019-04-22T12:16:02+08:00

Best Answer

G-Man Says 'Reinstate Monica'

\.并且[.]是等价的——它们都匹配一个文字点，而不是任何其他字符。作为风格问题，选择一个并始终如一地使用它。
您的问题是您的正则表达式（即模式）([^.]+\.)+后跟 [.]+. 这实际上（有点）等同于[^.]+\.， [.]结果是您的 grep 正在寻找包含的行，即连续两个点。如果你检查，你会看到你的命令匹配。text.text..a.b..
好的，我相信修复相当简单：
```
grep -P '^[^.]+\.([^.]+\.)+[ ^ .] *$ '
```
即，将 to 更改[.]为[^.]（也许这就是您最初的意思？），将以下内容更改+为 an *，然后添加 a $。在一定数量的组之后，要求/允许除点之外的任何数量（零个或多个）字符，直到行尾。text.
一个更简单的方法（更容易理解）是
```
grep -P '^[^.]+\..*\.' 文件.txt | grep -v '\.\.'
```
第一个grep查找以非点字符开头并包含至少两个点的行。第二个grep删除具有两个连续点的线。
grep … | wc -l与其做，不如做grep -c …。

Kusalananda · Answer 2 · 2019-04-23T08:45:14+08:00

Kusalananda

使用awk：

$ cat file
.com
.c.c.c.c
a.b.
a.b.com
a.b.c.
a.b.c.com
a.com
a..b
a.b.c..d

$ awk -F . 'NF > 2 && !/^\./ && !/\.\./' file
a.b.
a.b.com
a.b.c.
a.b.c.com

这里的awk程序使用点作为字段分隔符。具有两个或更多点的线与具有多于两个场的线相同。这就是NF > 2测试测试的内容。第一个正则表达式丢弃以点开头的行，第二个正则表达式丢弃连续包含两个或多个点的行。其余的行被打印。

同样的事情grep：

grep '\..*\.' file | grep -v -e '^\.' -e '\.\.'

第一个表达式提取至少包含两个点的行，另外两个删除以点开头或包含两个连续点的行。

或与sed,

sed -n '/^\./d; /\.\./d; /\..*\./p' file

Rakesh Sharma · Answer 3 · 2019-04-23T23:57:56+08:00

Rakesh Sharma

您可以使用环视来做到这一点，如下所示：

$ grep -Pc '^(?!\.)(?!.*\.\..*)(?=.*\..*\.)' file.txt

读作：