AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / server / 问题 / 109586
Accepted
ChrisR
ChrisR
Asked: 2010-02-05 06:18:15 +0800 CST2010-02-05 06:18:15 +0800 CST 2010-02-05 06:18:15 +0800 CST

ubuntu 上的非贪婪 grep 命令?

  • 772

我正在构建一个脚本,它会从我们的模板系统中过滤掉所有可翻译的内容。我面临的问题是 2 个可翻译文本在一条线上的情况。

这些是模板文件中的 2 行示例,它们都包含一个或多个可翻译

<img src="/captcha/generate.jpg" alt="[#Captcha#]" />
<span>[#Velden met een * zijn verplicht in te vullen#]</span> <button type="submit" name="frm_submit" class="right">[#Verzend#]

当我放开以下正则表达式时

egrep "\[#(.*)#\]" . -Rohis

我得到这个输出

[#Captcha#]"
[#Velden met een * zijn verplicht in te vullen#]</span> <button type="submit" name="frm_submit" class="right">[#Verzend#]

虽然所需的输出是

[#Captcha#]
[#Velden met een * zijn verplicht in te vullen#]
[#Verzend#]
linux grep regular-expressions
  • 4 4 个回答
  • 6520 Views

4 个回答

  • Voted
  1. Kyle Brandt
    2010-02-05T06:20:56+08:002010-02-05T06:20:56+08:00

    尝试使用正则表达式解析 HTML 会很痛苦,只是不要这样做。Jeff 在Parsing Html The Cthulhu Way中写道。“但我只想______”,没关系,认真的,别做。花点时间学习一些旨在解析 html 的东西。

    我个人会为此推荐一个 Perl 模块(例如HTML::TreeBuilder),但是您知道哪些语言?其他选项是:tidy+ xmlstarlet xmlgawk xpath xml2。

    如果您只想要文本中的“渲染”html,您可以使用链接之类的东西:links -dump www.google.com

    • 2
  2. Best Answer
    Bill Weiss
    2010-02-05T06:38:53+08:002010-02-05T06:38:53+08:00

    同意凯尔。但是,在这种情况下,您可以这样做:egrep "\[#([^]])*)#\]" . -Rohis得到您正在寻找的东西。

    [^]]*匹配非]字符,所以它会在第一个命中]时停止。

    • 1
  3. Dan Andreatta
    2010-02-05T06:52:38+08:002010-02-05T06:52:38+08:00

    借调凯尔的评论。

    无论如何,如果模式足够统一,你可以实现你想要的我匹配除了结束字符之外的任何东西,即

    egrep "\[#([^]]*)#\]" ...
    

    如果您在文本中关闭 ],则此模式将不起作用,例如 [#xyz]#] 将不匹配。

    • 1
  4. Andy Lester
    2010-05-04T09:07:31+08:002010-05-04T09:07:31+08:00

    使用 Perl,它可以让您进行非贪婪匹配。对于您观看多场比赛的情况,请使用 /g 修饰符。我们添加了 -l 开关,因为我们必须自己处理换行:

    perl -lne'while(/\[#(.*?)#\]/g) {print $&}' filename
    
    • 0

相关问题

  • 多操作系统环境的首选电子邮件客户端

  • 你最喜欢的 Linux 发行版是什么?[关闭]

  • 更改 PHP 的默认配置设置?

  • 保护新的 Ubuntu 服务器 [关闭]

  • (软)Ubuntu 7.10 上的 RAID 6,我应该迁移到 8.10 吗?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    新安装后 postgres 的默认超级用户用户名/密码是什么?

    • 5 个回答
  • Marko Smith

    SFTP 使用什么端口?

    • 6 个回答
  • Marko Smith

    从 IP 地址解析主机名

    • 8 个回答
  • Marko Smith

    如何按大小对 du -h 输出进行排序

    • 30 个回答
  • Marko Smith

    命令行列出 Windows Active Directory 组中的用户?

    • 9 个回答
  • Marko Smith

    什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同?

    • 3 个回答
  • Marko Smith

    如何确定bash变量是否为空?

    • 15 个回答
  • Martin Hope
    MikeN 在 Nginx 中,如何在维护子域的同时将所有 http 请求重写为 https? 2009-09-22 06:04:43 +0800 CST
  • Martin Hope
    Tom Feiner 如何按大小对 du -h 输出进行排序 2009-02-26 05:42:42 +0800 CST
  • Martin Hope
    0x89 bash中的双方括号和单方括号有什么区别? 2009-08-10 13:11:51 +0800 CST
  • Martin Hope
    Kyle Brandt IPv4 子网如何工作? 2009-08-05 06:05:31 +0800 CST
  • Martin Hope
    Noah Goodrich 什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同? 2009-05-19 18:24:42 +0800 CST
  • Martin Hope
    Brent 如何确定bash变量是否为空? 2009-05-13 09:54:48 +0800 CST
  • Martin Hope
    cletus 您如何找到在 Windows 中打开文件的进程? 2009-05-01 16:47:16 +0800 CST

热门标签

linux nginx windows networking ubuntu domain-name-system amazon-web-services active-directory apache-2.4 ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve