多操作系统环境的首选电子邮件客户端

Question

ChrisR

Asked: 2010-02-05 06:18:15 +0800 CST2010-02-05 06:18:15 +0800 CST 2010-02-05 06:18:15 +0800 CST

ubuntu 上的非贪婪 grep 命令？

772

我正在构建一个脚本，它会从我们的模板系统中过滤掉所有可翻译的内容。我面临的问题是 2 个可翻译文本在一条线上的情况。

这些是模板文件中的 2 行示例，它们都包含一个或多个可翻译

<img src="/captcha/generate.jpg" alt="[#Captcha#]" />
<span>[#Velden met een * zijn verplicht in te vullen#]</span> <button type="submit" name="frm_submit" class="right">[#Verzend#]

当我放开以下正则表达式时

egrep "\[#(.*)#\]" . -Rohis

我得到这个输出

[#Captcha#]"
[#Velden met een * zijn verplicht in te vullen#]</span> <button type="submit" name="frm_submit" class="right">[#Verzend#]

虽然所需的输出是

[#Captcha#]
[#Velden met een * zijn verplicht in te vullen#]
[#Verzend#]

4 个回答

Voted

Kyle Brandt · Answer 1 · 2010-02-05T06:20:56+08:00

Kyle Brandt

2010-02-05T06:20:56+08:002010-02-05T06:20:56+08:00

尝试使用正则表达式解析 HTML 会很痛苦，只是不要这样做。Jeff 在Parsing Html The Cthulhu Way中写道。“但我只想______”，没关系，认真的，别做。花点时间学习一些旨在解析 html 的东西。

我个人会为此推荐一个 Perl 模块（例如HTML::TreeBuilder），但是您知道哪些语言？其他选项是：tidy+ xmlstarlet xmlgawk xpath xml2。

如果您只想要文本中的“渲染”html，您可以使用链接之类的东西：links -dump www.google.com

2

Bill Weiss · Answer 2 · 2010-02-05T06:38:53+08:00

Best Answer

Bill Weiss

2010-02-05T06:38:53+08:002010-02-05T06:38:53+08:00

同意凯尔。但是，在这种情况下，您可以这样做：egrep "\[#([^]])*)#\]" . -Rohis得到您正在寻找的东西。

[^]]*匹配非]字符，所以它会在第一个命中]时停止。

1

Dan Andreatta · Answer 3 · 2010-02-05T06:52:38+08:00

Dan Andreatta

2010-02-05T06:52:38+08:002010-02-05T06:52:38+08:00

借调凯尔的评论。

无论如何，如果模式足够统一，你可以实现你想要的我匹配除了结束字符之外的任何东西，即

egrep "\[#([^]]*)#\]" ...

如果您在文本中关闭 ]，则此模式将不起作用，例如 [#xyz]#] 将不匹配。

1

Andy Lester · Answer 4 · 2010-05-04T09:07:31+08:00

Andy Lester

2010-05-04T09:07:31+08:002010-05-04T09:07:31+08:00

使用 Perl，它可以让您进行非贪婪匹配。对于您观看多场比赛的情况，请使用 /g 修饰符。我们添加了 -l 开关，因为我们必须自己处理换行：

perl -lne'while(/\[#(.*?)#\]/g) {print $&}' filename

0

ubuntu 上的非贪婪 grep 命令？

新安装后 postgres 的默认超级用户用户名/密码是什么？

SFTP 使用什么端口？

从 IP 地址解析主机名

如何按大小对 du -h 输出进行排序

命令行列出 Windows Active Directory 组中的用户？

什么是 Pem 文件，它与其他 OpenSSL 生成的密钥文件格式有何不同？

如何确定bash变量是否为空？

ubuntu 上的非贪婪 grep 命令？

4 个回答

相关问题