AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / server / 问题 / 51014
Accepted
Alex L
Alex L
Asked: 2009-08-07 08:34:18 +0800 CST2009-08-07 08:34:18 +0800 CST 2009-08-07 08:34:18 +0800 CST

不需要整行,只需要正则表达式的匹配

  • 772

我只需要从正则表达式中获取匹配项:

$ cat myfile.txt | SOMETHING_HERE "/(\w).+/"

输出只能是括号内匹配的内容。

不要认为我可以使用grep因为它匹配整行。

请让我知道如何做到这一点。

bash shell regex grep
  • 7 7 个回答
  • 86981 Views

7 个回答

  • Voted
  1. Amandasaurus
    2009-08-07T08:36:48+08:002009-08-07T08:36:48+08:00

    使用 中的-o选项grep。

    例如:

    $ echo "foobarbaz" | grep -o 'b[aeiou]r'
    bar
    
    • 24
  2. Best Answer
    DrYak
    2015-01-21T05:21:08+08:002015-01-21T05:21:08+08:00

    2件事:

    • 正如@Rory 所说,您需要该-o选项,因此只打印匹配项(而不是整行)
    • 此外,您需要-P选择使用 Perl 正则表达式,其中包括有用的元素,例如Look ahead (?= )和Look behind (?<= ),它们查找部分,但实际上并不匹配和打印它们。

    如果您只想匹配括号内的部分,请执行以下操作:

    grep -oP '(?<=\/\()\w(?=\).+\/)' myfile.txt
    

    如果文件包含 sting /(a)5667/,则 grep 将打印 'a',因为:

    • /(被 找到\/\(,但由于它们处于后视状态, (?<= )因此未报告
    • a被匹配\w并因此被打印(因为-o)
    • )5667/由 找到\).+\/,但由于它们处于前瞻 (?= )中,因此未报告
    • 23
  3. Joshua
    2016-04-23T07:58:03+08:002016-04-23T07:58:03+08:00
        sed -n "s/^.*\(captureThis\).*$/\1/p"
    
    -n      don't print lines
    s       substitute
    ^.*     matches anything before the captureThis 
    \( \)   capture everything between and assign it to \1 
    .*$     matches anything after the captureThis 
    \1      replace everything with captureThis 
    p       print it
    
    • 18
  4. DrYak
    2015-01-21T05:47:54+08:002015-01-21T05:47:54+08:00

    因为除了shell之外,您还将问题标记为bash ,所以除了grep之外还有另一个解决方案:

    Bash 从 3.0 版开始就有自己的正则表达式引擎,使用=~运算符,就像 Perl 一样。

    现在,给定以下代码:

    #!/bin/bash
    DATA="test <Lane>8</Lane>"
    
    if [[ "$DATA" =~ \<Lane\>([[:digit:]]+)\<\/Lane\> ]]; then
            echo $BASH_REMATCH
            echo ${BASH_REMATCH[1]}
    fi
    
    • 请注意,您必须调用它,bash而不仅仅是sh为了获取所有扩展
    • $BASH_REMATCH将给出与整个正则表达式匹配的整个字符串,所以<Lane>8</Lane>
    • ${BASH_REMATCH[1]}将给出与第一组匹配的部分,因此只有8
    • 8
  5. Kyle Brandt
    2009-08-07T09:38:10+08:002009-08-07T09:38:10+08:00

    如果您只想要括号中的内容,则需要支持捕获子匹配项(命名或编号捕获组)的内容。我不认为 grep 或 egrep 可以做到这一点, perl 和 sed 可以。例如,使用 perl:

    如果名为 foo 的文件中有一行如下所示:

    /adsdds      /
    

    你也是:

    perl -nle 'print $1 if /\/(\w).+\//' foo
    

    返回字母 a。不过,这可能不是您想要的。如果您告诉我们您要匹配的内容,您可能会得到更好的帮助。$1 是第一组括号中捕获的任何内容。$2 将是第二套等。

    • 4
  6. user427450
    2017-07-23T00:01:51+08:002017-07-23T00:01:51+08:00

    假设文件包含:

    $ cat file
    Text-here>xyz</more text
    

    >并且您想要and之间的字符</,您可以使用:

    grep grep -oP '.*\K(?<=>)\w+(?=<\/)' file
    sed sed -nE 's:^.*>(\w+)</.*$:\1:p' file
    awk awk '{print(gensub("^.*>(\\w+)</.*$","\\1","g"))}' file
    perl perl -nle 'print $1 if />(\w+)<\//' file

    所有将打印一个字符串“xyz”。

    如果要捕获此行的数字:

    $ cat file
    Text-<here>1234</text>-ends
    

    grep grep -oP '.*\K(?<=>)[0-9]+(?=<\/)' file
    sed sed -E 's:^.*>([0-9]+)</.*$:\1:' file
    awk awk '{print(gensub(".*>([0-9]+)</.*","\\1","g"))}' file
    perl perl -nle 'print $1 if />([0-9]+)<\//' file

    • 4
  7. Chad Huneycutt
    2009-08-07T10:02:20+08:002009-08-07T10:02:20+08:00

    这将完成您的要求,但我认为这不是您真正想要的。我把 放在.*正则表达式的前面是为了在比赛前吃掉任何东西,但这是一个贪婪的操作,所以这只匹配字符串中的倒数第二个\w字符。

    请注意,您需要转义括号和+.

    sed 's/.*\(\w\).\+/\1/' myfile.txt
    
    • 0

相关问题

  • Mac OS X:从 python 脚本中更改 $PATH

  • Bash 脚本:要求脚本以 root 身份运行(或使用 sudo)

  • crontab ifconfig 什么都不输出

  • 使用命令行工具按排序顺序计算重复项

  • 是否有 bash 等效于 ruby​​ 的“一些内容#{foo}”?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    SFTP 使用什么端口?

    • 6 个回答
  • Marko Smith

    从 IP 地址解析主机名

    • 8 个回答
  • Marko Smith

    如何按大小对 du -h 输出进行排序

    • 30 个回答
  • Marko Smith

    命令行列出 Windows Active Directory 组中的用户?

    • 9 个回答
  • Marko Smith

    Windows 中执行反向 DNS 查找的命令行实用程序是什么?

    • 14 个回答
  • Marko Smith

    如何检查 Windows 机器上的端口是否被阻塞?

    • 4 个回答
  • Marko Smith

    我应该打开哪个端口以允许远程桌面?

    • 9 个回答
  • Marko Smith

    什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同?

    • 3 个回答
  • Marko Smith

    如何确定bash变量是否为空?

    • 15 个回答
  • Martin Hope
    MikeN 在 Nginx 中,如何在维护子域的同时将所有 http 请求重写为 https? 2009-09-22 06:04:43 +0800 CST
  • Martin Hope
    Tom Feiner 如何按大小对 du -h 输出进行排序 2009-02-26 05:42:42 +0800 CST
  • Martin Hope
    0x89 bash中的双方括号和单方括号有什么区别? 2009-08-10 13:11:51 +0800 CST
  • Martin Hope
    kch 如何更改我的私钥密码? 2009-08-06 21:37:57 +0800 CST
  • Martin Hope
    Kyle Brandt IPv4 子网如何工作? 2009-08-05 06:05:31 +0800 CST
  • Martin Hope
    Noah Goodrich 什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同? 2009-05-19 18:24:42 +0800 CST
  • Martin Hope
    Brent 如何确定bash变量是否为空? 2009-05-13 09:54:48 +0800 CST
  • Martin Hope
    cletus 您如何找到在 Windows 中打开文件的进程? 2009-05-01 16:47:16 +0800 CST

热门标签

linux nginx windows networking ubuntu domain-name-system amazon-web-services active-directory apache-2.4 ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve