如何让 grep 只显示匹配的正则表达式？

Question

deepblue_86

Asked: 2016-08-18 00:57:43 +0800 CST2016-08-18 00:57:43 +0800 CST 2016-08-18 00:57:43 +0800 CST

对文本文件中的特定行使用 grep

772

     2              METEOROLOGICAL DATA                         VERSION /      
     8    PR    TD    HR    ZW    ZT    WD    WS    RI      # / TYPES OF   MOD/TYPE/ACC 
  3979316.8350  1050313.7180  4857065.7030      592.1910 PR SENSOR POS XYZ/H           
                                                            END OF HEADER 
 10  1  1  0  0 15  927.9    4.3   99.1                
 10  1  1  0  1 15  927.9    4.3   99.1                
 10  1  1  0  2 15  927.9    4.3   99.1                
 10  1  1  0 15 15  927.9    4.2   99.1               
 10  1  1  0 16 15  927.9    4.2   99.0                
 10  1  1  0 30 15  927.7    4.1   99.1                
 10  1  1  0 31 15  927.7    4.1   99.1                
 10  1  1  0 45 15  927.5    4.1   99.1                
 10  1  1  0 46 15  927.5    4.0   99.1                
 10  1  1  1  0 15  927.4    4.1   99.1                
 10  1  1  1  1 15  927.4    4.1   99.1

在这个文本数据示例中，如何在“ END OF HEADER”部分之后按顺序提取数字数据第 5 列中的所有 0、15、30、45；

10  1  1  0  0 15  927.9    4.3   99.1  
10  1  1  0 15 15  927.9    4.2   99.1 
10  1  1  0 30 15  927.7    4.1   99.1 
10  1  1  0 45 15  927.5    4.1   99.1
10  1  1  1  0 15  927.4    4.1   99.1

3 个回答

Voted

L. D. James · Answer 1 · 2016-08-18T02:20:44+08:00

L. D. James

2016-08-18T02:20:44+08:002016-08-18T02:20:44+08:00

一个快速的班轮将是：

$ awk '$5 == '0' || $5 == '15' ||  $5 == '30' ||  $5 == '45' {print}' test.txt

正如 fedorqui 在下面的评论中提到的，甚至更快的一个班轮是：

$ awk '$5 ~ /^(0|15|30|45)$/' test.txt

语法解释：

$5  - the desired column from the text.
~   - the match symbol... matching was between the two slashes (/).
^/$ - the regex symbols indicating the beginning and end of the field.
|   - the or specifier for either item in the "()" group.

通过仅接受与符合匹配~ 条件的项目匹配的行来过滤掉标题。

4

heemayl · Answer 2 · 2016-08-18T02:30:59+08:00

尽管它是字段分隔数据的首选工具grep，但它在中是完全可行的。awk

与grep：

grep -E '^10[[:blank:]]+([^[:blank:]]+[[:blank:]]+){3}(0|15|30|45)[[:blank:]]' file.txt

10在开始时匹配，匹配([^[:blank:]]+[[:blank:]]+){3}接下来的 3 个字段，然后匹配所需字段的第 5 个字段

如果你使用 PCRE ( -P)，你可以替换[:blank:]为\s，看起来不错：

grep -P '^10\s+([^\s]+\s+){3}(0|15|30|45)\s' file.txt

例子：

$ cat file.txt                                        
    2              METEOROLOGICAL DATA                         VERSION /      
    8    PR    TD    HR    ZW    ZT    WD    WS    RI      # / TYPES OF   MOD/TYPE/ACC 
 3979316.8350  1050313.7180  4857065.7030      592.1910 PR SENSOR POS XYZ/H           
                                                           END OF HEADER 
10  1  1  0  0 15  927.9    4.3   99.1                
10  1  1  0  1 15  927.9    4.3   99.1                
10  1  1  0  2 15  927.9    4.3   99.1                
10  1  1  0 15 15  927.9    4.2   99.1               
10  1  1  0 16 15  927.9    4.2   99.0                
10  1  1  0 30 15  927.7    4.1   99.1                
10  1  1  0 31 15  927.7    4.1   99.1                
10  1  1  0 45 15  927.5    4.1   99.1                
10  1  1  0 46 15  927.5    4.0   99.1                
10  1  1  1  0 15  927.4    4.1   99.1                
10  1  1  1  1 15  927.4    4.1   99.1    

$ grep -E '^10[[:blank:]]+([^[:blank:]]+[[:blank:]]+){3}(0|15|30|45)[[:blank:]]' file.txt
10  1  1  0  0 15  927.9    4.3   99.1                
10  1  1  0 15 15  927.9    4.2   99.1               
10  1  1  0 30 15  927.7    4.1   99.1                
10  1  1  0 45 15  927.5    4.1   99.1                
10  1  1  1  0 15  927.4    4.1   99.1                

$ grep -P '^10\s+([^\s]+\s+){3}(0|15|30|45)\s' file.txt                         
10  1  1  0  0 15  927.9    4.3   99.1                
10  1  1  0 15 15  927.9    4.2   99.1               
10  1  1  0 30 15  927.7    4.1   99.1                
10  1  1  0 45 15  927.5    4.1   99.1                
10  1  1  1  0 15  927.4    4.1   99.1

the_velour_fog · Answer 3 · 2016-08-18T01:56:52+08:00

Best Answer

the_velour_fog

2016-08-18T01:56:52+08:002016-08-18T01:56:52+08:00

您可以使用sedand来执行此操作awk：（
假设您的主题文本位于名为的文件中example.txt）

sed -n '/END OF HEADER/,${
/END OF HEADER/d
p
}' example.txt | awk '($5 == 0 || $5 == 15 || $5 == 30 || $5 == 45)'

_{归属 - awk 命令取自 steeldriver 的评论}

解释

赛德

忽略一切/END OF HEADER/
/END OF HEADER/d意味着删除包含/END OF HEADER/模式空间之外的行，因为它不再在模式空间中，下一个命令p将不会做任何事情
p - 打印每一行，因为它被拉入模式空间

awk

如果第 5 列是 0 或 15 或 30 或 45 则打印它

2

对文本文件中的特定行使用 grep

解释

如何运行 .sh 脚本？

如何安装 .tar.gz（或 .tar.bz2）文件？

如何列出所有已安装的软件包

无法锁定管理目录 (/var/lib/dpkg/) 是另一个进程在使用它吗？

对文本文件中的特定行使用 grep

3 个回答

解释

相关问题

如何让 grep 只显示匹配的正则表达式？

如何 grep 字符串变量的内容？

拖尾两个日志文件

如何运行 .sh 脚本？

如何安装 .tar.gz（或 .tar.bz2）文件？

如何列出所有已安装的软件包

无法锁定管理目录 (/var/lib/dpkg/) 是另一个进程在使用它吗？