AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / ubuntu / 问题 / 1026045
Accepted
Socrates
Socrates
Asked: 2018-04-19 00:19:10 +0800 CST2018-04-19 00:19:10 +0800 CST 2018-04-19 00:19:10 +0800 CST

将 grep 输出限制为短行

  • 772

我经常使用 grep 来查找具有特定条目的文件,如下所示:

grep -R 'MyClassName'

好消息是它返回文件及其内容并将找到的字符串标记为红色。坏事是我也有巨大的文件,其中整个文本都写在一个大的单行中。现在 grep 在那些大文件中查找文本时输出太多。有没有办法将输出限制为例如左右 5 个单词?或者可能将输出限制为左右 30 个字母?

command-line grep text-processing
  • 2 2 个回答
  • 9333 Views

2 个回答

  • Voted
  1. Best Answer
    muru
    2018-04-19T00:32:00+08:002018-04-19T00:32:00+08:00

    grep本身只有基于线条的上下文选项。这个 SU 帖子提出了一个替代方案:

    一种解决方法是启用“仅匹配”选项,然后使用 RegExp 的功能来 grep 比您的文本多一点:

    grep -o ".\{0,50\}WHAT_I_M_SEARCHING.\{0,50\}" ./filepath
    

    当然,如果你使用颜色高亮,你总是可以再次 grep 只为真正的匹配着色:

    grep -o ".\{0,50\}WHAT_I_M_SEARCHING.\{0,50\}"  ./filepath | grep "WHAT_I_M_SEARCHING"
    

    作为另一种选择,我建议folding 文本然后 grepping 它,例如:

    fold -sw 80 input.txt | grep ...
    

    该-s选项会将fold单词推送到下一行,而不是介于两者之间。

    或者使用其他方式根据输入的结构将输入分成几行。(例如,SU 帖子处理 JSON,因此使用jqetc. 来漂亮打印和grep......或者只是使用jq自己进行过滤......会比上面给出的两种选择中的任何一种都要好。)


    这种 GNU awk 方法可能更快:

    gawk -v n=50 -v RS='MyClassName' '
      FNR > 1 { printf "%s: %s\n",FILENAME, p prt substr($0, 0, n)}
      {p = substr($0, length - n); prt = RT}
    ' input.txt
    
    • 告诉 awk 拆分我们感兴趣的模式上的记录 ( -v RS=...),以及上下文中的字符数 ( -v n=...)
    • 第一条记录 ( FNR > 1) 之后的每条记录都是 awk 找到与该模式匹配的记录。
    • 因此,我们打印n上一行的尾随字符 ( p) 和n当前行的前导字符 ( substr($0, 0, n)),以及前一行的匹配文本 (即prt)
      • 我们设置p和打印prt 后,所以我们设置的值被下一行使用
      • RT是 GNU 主义,这就是为什么这是 GNU awk 特定的。

    对于递归搜索,也许:

    find . -type f -exec gawk -v n=50 -v RS='MyClassName' 'FNR>1{printf "%s: %s\n",FILENAME, p prt substr($0, 0, n)} {p = substr($0, length-n); prt = RT}' {} +
    
    • 16
  2. Robert Riedl
    2018-04-19T01:29:54+08:002018-04-19T01:29:54+08:00

    将仅匹配与其他一些选项结合使用(见下文),可能非常接近您正在寻找的内容,而没有其他答案中提到的正则表达式的处理开销

    grep -RnHo 'MyClassName'
    
    • n数值输出,显示匹配的行号
    • H文件名,显示匹配行首的文件名
    • o只匹配,只显示匹配的字符串,而不是整行
    • 3

相关问题

  • 如何从命令行仅安装安全更新?关于如何管理更新的一些提示

  • 如何从命令行刻录双层 dvd iso

  • 如何从命令行判断机器是否需要重新启动?

  • 文件权限如何工作?文件权限用户和组

  • 如何在 Vim 中启用全彩支持?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    如何运行 .sh 脚本?

    • 16 个回答
  • Marko Smith

    如何安装 .tar.gz(或 .tar.bz2)文件?

    • 14 个回答
  • Marko Smith

    如何列出所有已安装的软件包

    • 24 个回答
  • Marko Smith

    无法锁定管理目录 (/var/lib/dpkg/) 是另一个进程在使用它吗?

    • 25 个回答
  • Martin Hope
    Flimm 如何在没有 sudo 的情况下使用 docker? 2014-06-07 00:17:43 +0800 CST
  • Martin Hope
    Ivan 如何列出所有已安装的软件包 2010-12-17 18:08:49 +0800 CST
  • Martin Hope
    La Ode Adam Saputra 无法锁定管理目录 (/var/lib/dpkg/) 是另一个进程在使用它吗? 2010-11-30 18:12:48 +0800 CST
  • Martin Hope
    David Barry 如何从命令行确定目录(文件夹)的总大小? 2010-08-06 10:20:23 +0800 CST
  • Martin Hope
    jfoucher “以下软件包已被保留:”为什么以及如何解决? 2010-08-01 13:59:22 +0800 CST
  • Martin Hope
    David Ashford 如何删除 PPA? 2010-07-30 01:09:42 +0800 CST

热门标签

10.10 10.04 gnome networking server command-line package-management software-recommendation sound xorg

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve