AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / computer / 问题

问题[regex](computer)

Martin Hope
Kevin Davis
Asked: 2025-01-09 05:51:35 +0800 CST

如何使用 macOS 正则表达式进行查找?

  • 8

我正在尝试将脚本从 Ubuntu Linux 机器移植到 macOS 笔记本电脑,但无法find正确设置正则表达式。

在目录中,我有以下文件。

/Users/kevin/Documents/Audio/arn/2400/Report2400.clip.mp3
/Users/kevin/Documents/Audio/arn/2400/Report2400.clip1.mp3
/Users/kevin/Documents/Audio/arn/2400/Report2400.clip2.mp3
/Users/kevin/Documents/Audio/arn/2400/Report2400.clip3.mp3
/Users/kevin/Documents/Audio/arn/2400/Report2400.clip4.mp3
/Users/kevin/Documents/Audio/arn/2400/Report2400.clip5.mp3
/Users/kevin/Documents/Audio/arn/2400/Report2400.clip6.mp3
/Users/kevin/Documents/Audio/arn/2400/Report2400.clip7.mp3
/Users/kevin/Documents/Audio/arn/2400/Report2400.clip8.mp3

运行此命令:

find . -regex 'Report2400\.clip[0-9]+\.mp3'

我希望获得 8 个文件,“clip”后面跟着一个数字“8”,但却没有返回任何内容。

我错过了什么?我知道这很基本,但我差点就进精神病院了。

regex
  • 1 个回答
  • 251 Views
Martin Hope
Zsar
Asked: 2025-01-04 00:33:28 +0800 CST

GNU Awk 如何匹配表达式与捕获组?

  • 8

我正在一个相当老的 Debian 10 系统上测试这个

GNU Awk 4.2.1, API: 2.0 (GNU MPFR 4.0.2, GNU MP 6.1.2)

在

GNU bash, version 5.0.3(1)-release (x86_64-pc-linux-gnu)

awk和命令都gawk调用相同的 GNU Awk 版本。

使用这些答案[1] [2] [3]我尝试编写一个脚本来检测 msgcat 发出的 gettext 合并冲突。

明文测试输入,下文称为merged_file.po:

"#-#-#-#-#  de.po (Application Library)  #-#-#-#-#\n"
"#-#-#-#-#  de.po (Middleware Library)  #-#-#-#-#\n"
"#-#-#-#-#  de.po  #-#-#-#-#\n"

我选择 awk 而不是 grep 和 sed 来跳过标题NR > <line number>。由于这没有问题,为了简洁起见,我在这里省略了它。

行语法:

  1. "#-#-#-#-#
  2. 源文件名
  3. ()如果在源文件中设置,则Project-Id-Version
  4. #-#-#-#-#\n"

使用RegExr构建的正则表达式,并在regex101支持的所有形式中得到验证:(#-#-#-#-#\s+\S+\s+(?:\(([^()]+)\)\s+)?#-#-#-#-#
请注意,这假定文件名不包含空格 - 目前我不介意。)

预期效果有两方面:

  1. 查找输出 .po 文件中出现的所有情况以发出错误消息
  2. 在捕获组 1 中捕获库名称,使错误消息更易于阅读(特别是对于不太熟悉 gettext 的人)

这些是我尝试过的调用:

  • 工作基线awk '/#-#-#-#-#\s+\S+\s+(?:\(([^()]+)\)\s+)?/ { print NR, $0 }' merged_file.po查找所有出现的情况并打印整行。
  • awk '/#-#-#-#-#\s+\S+\s+(?:\(([^()]+)\)\s+)?#/ { print NR, $0 }' merged_file.po删除所有与 Project-Id-Version 相关的条目
  • awk 'match($0, /#-#-#-#-#\s+\S+\s+(?:\(([^()]+)\)\s+)?/, library_name) { print NR, "from library \047"library_name[1]"\047" }' merged_file.po打印空字符串,而不是<Project-Id-Version>
    • library_name[0]包含直到非捕获组的行,因此显然match根本不会发出捕获组 - 如果有的话,library_name[0]则会包含整行。
  • awk '/#-#-#-#-#\s+\S+\s+(?:\(([^()]+)\)\s+)?/ { library_name = gensub(/#-#-#-#-#\s+\S+\s+(?:\(([^()]+)\)\s+)?/, "\\1", "g"); print NR, "from library \047"library_name"\047" }' merged_file.po打印"(<Project-Id-Version>) #-#-#-#-#\n"而不是<Project-Id-Version>
    • \\0确实包含了整行。
    • \\2包含与虽然相同的字符串\\1。(预期:空)

相关工具(例如 grep 或 sed)对 RegEx 的支持通常令人惊讶地不尽如人意,因此,与其询问为什么我的特定调用不起作用,我宁愿更笼统地问:

GNU Awks 的正则表达式匹配与“常态”有何不同?

(绝对)有效的 X/Y 答案:

  • 我使用的版本太旧了。(如果是,我至少需要哪一个?)
  • 我瞎了,我的 RegEx 也坏了。(如果是这样:怎么办?)
  • 应该怪罪 Bash,我需要一些神秘的逃脱方法。(如果是的话:哪些方法以及为什么?)
  • Baeldung 有一次是错的,毕竟,还有一个更简单的解决方案,而不是使用 Awk。(如果有:哪一个?)
    • 为了避免将来再次遇到同样的问题,我只希望除了 之外还能收到这封邮件,而不是代替问题本身的答案。我真的想更好地了解我对 Awk 有什么期望,以及什么不是。
regex
  • 1 个回答
  • 59 Views
Martin Hope
Rbvys Punka
Asked: 2024-07-10 18:50:24 +0800 CST

正则表达式模式查找字符串中符合条件的所有匹配项

  • 5

我目前被一个正则表达式问题困扰。我有一个字符串:

Take dog, dog, dog, cat, dog;
Dont dog, dog, cat, dog;

我如何使用 pcre2 正则表达式引擎匹配所有“dog”并跳过“cat”。我想要的输出是:

dog, dog, dog, dog;

这将从第一行开始,因为它以“Take”开头,而“Take”是静态的。我无法在回溯中使用任何 \s*,因为这不支持无限回溯。

正则表达式将在另一个工具中使用,因此只允许使用纯正则表达式(无脚本)。

regex
  • 1 个回答
  • 21 Views
Martin Hope
Shahid
Asked: 2024-06-24 22:08:03 +0800 CST

使用正则表达式在特定单词集之前插入一个字符

  • 5

我想在 Adob​​e InDesign 中使用 GREP/Regex。以下是示例数据:

老鼠:哺乳动物。骆驼:生活在沙漠中的动物。飞机:飞行的机器。浑水:充满泥土和污垢的水。也指肮脏的水。四个字母的单词:包含四个字母的单词。测试:一种证明你价值的方式。

我想在粗体标记的单词前立即放置一个管道符“|”或我选择的unicode字符。

例如:|老鼠:老鼠的描述。|骆驼:骆驼的描述。|飞机:飞机的描述。|浑水:描述......等等。

如何在 Adob​​e InDesign 中使用 Regex/Grep 实现这一点。

regex
  • 1 个回答
  • 43 Views
Martin Hope
pmor
Asked: 2024-05-08 21:28:08 +0800 CST

如何仅通过一次调用来提取两个模式之间的文本(可能包含浮动后视)?

  • 5

xxx<1+ whitespaces>"我试图匹配和之间的任何字符(换行符除外)whitespace。

输入字符串的格式如下:

xxx<1+ whitespaces>"yyy<1+ whitespaces>zzz"

我尝试使用以下 PCRE:

$ echo 'xxx  "yyy zzz"' | grep -Po '(?<=\xxx\s+").*?(?=\s)'
grep: lookbehind assertion is not fixed length

然而,正如我们所看到的,PCRE 不支持浮动lookbehind,因为它可能会导致重大的性能问题。

这是解决方法:

$ echo 'xxx  "yyy zzz"' | grep xxx | grep -Po '(?<=").*?(?=\s)'
yyy

在这里我们看到它可以工作,但是grep被调用了两次,这可能被认为是次优的。

是否有可能仅通过一次调用就获得相同的结果grep?

如果不是,那么是否可以实现相同的结果,但只需一次<toolname>(也许awk)调用?

regex
  • 1 个回答
  • 34 Views
Martin Hope
nexdev
Asked: 2024-04-02 11:05:08 +0800 CST

自定义 Fail2Ban 正则表达式未按预期工作

  • 4

使用下面的正则表达式过滤器:

[Definition]
failregex = ^<HOST>.*Priority: 0
ignoreregex =

Fail2Ban 不会检测到以下任何日志条目。

Mon Apr  1 21:11:29 2024 [**] [1:1000002:1] SSH attempt [**] [Priority: 0] {TCP} 192.x.x.x:58867 -> 192.168.x.x:22
Mon Apr  1 21:11:29 2024 [**] [1:1000002:1] SSH attempt [**] [Priority: 0] {TCP} 192.x.x.x:58914 -> 192.168.x.x:22 

但上面的正则表达式过滤器可以准确地检测 Fail2Ban 下面的日志行,日志条目中的唯一区别是日期格式。

03/26-10:57:44.146011  [**] [1:1000002:1] SSH attempt [**] [Priority: 0] {TCP} 192.x.x.x:58867 -> 192.168.x.x:22
03/26-11:23:52.317989  [**] [1:1000002:1] SSH attempt [**] [Priority: 0] {TCP} 192.x.x.x:58914 -> 192.168.x.x:22

请紧急帮助我让这个正则表达式过滤器正常工作,因为它适用于我的项目工作,而我的时间表非常有限。

regex
  • 1 个回答
  • 31 Views
Martin Hope
Rob
Asked: 2024-03-11 04:11:44 +0800 CST

NotePad++ 中的正则表达式替换

  • 6

我需要替换 html 文件中的许多不同行,其中行如下所示:

<span lang="en-ca">random string</span>

只用

random string

例如

my<span lang="en-ca"> dog</span> likes<span lang="en-ca"> ice cream</span>.

将更新为

my dog likes ice cream.

我发现我可以使用

<span lang="en-ca">.*</span>

匹配查找参数中的一般模式,但不匹配替换参数中使用的内容。

如果可以的话,如何做到这一点?

注意:我不能简单地替换所有

<span lang="en-ca">

和

</span>

分开,因为不是每个

</span>

与一个配对

<span lang="en-ca">

regex
  • 1 个回答
  • 14 Views
Martin Hope
Vegetable New Man
Asked: 2024-01-27 11:05:00 +0800 CST

如何匹配任意相邻的相同字符串?

  • 4

所以,我的数据中有一些重复的字符串。它们有一个重复两次的模式,并且重复是相邻的,之间没有空格。它们可以具有任意长度(一行内),并且可以包含字母、数字和空格。如何使用正则表达式来匹配此类字符串?谢谢。

我想要匹配的示例:

FooFoo
Bar 1Bar 1
X1 Y2 Z3X1 Y2 Z3
regex
  • 1 个回答
  • 25 Views
Martin Hope
Jeff Taylor
Asked: 2023-11-19 10:31:53 +0800 CST

正则表达式查找文本加上最多 6 个数字

  • 6

[使用记事本**]

寻求正则表达式来查找以下所有包含单词“SEQ”、空格以及 3 到 6 位数字的以下行:

SEQ 123
SEQ 1234
SEQ 12345
SEQ 123456

我尝试过这样的模式:

SEQ \d\d\d

..但我会错过包含 4、5、6 占位符的数字。

此外,我还需要在 3-6 个字符的搜索中不包含任何空格。有时一行看起来像这样:

SEQ 456 13

在这种情况下,我不想选择数字“6”之外的任何数字。查看正则表达式教程链接后,我尝试了以下操作:

SEQ \d{3,6}/\s/g

...但是出错了。

regex
  • 1 个回答
  • 79 Views
Martin Hope
Mike
Asked: 2023-10-13 17:05:47 +0800 CST

正则表达式在 GrepWin 中查找多个匹配项

  • 5

h1我想在多个文件中找到多次出现的标记。

以下正则表达式会带来出现次数超过 2 次的文件,效果非常好:

/(h1.*){2}/

但是,如果我想查找 2 个或更多出现的情况该怎么办?(在 GrepWin 中,它显示 1 场比赛,但是当我需要查看有多少场比赛超过 1 场比赛时该怎么办?)

我尝试过类似/(h1.*){2+}/,/(h1.*){2}+/或 之类的东西/(h1.*){2,}/,但它们不起作用。

我正在使用 GrepWin 2.0.15。

或者您是否建议使用任何其他 Windows 工具来显示这一点?

regex
  • 1 个回答
  • 20 Views

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    如何减少“vmmem”进程的消耗?

    • 11 个回答
  • Marko Smith

    从 Microsoft Stream 下载视频

    • 4 个回答
  • Marko Smith

    Google Chrome DevTools 无法解析 SourceMap:chrome-extension

    • 6 个回答
  • Marko Smith

    Windows 照片查看器因为内存不足而无法运行?

    • 5 个回答
  • Marko Smith

    支持结束后如何激活 WindowsXP?

    • 6 个回答
  • Marko Smith

    远程桌面间歇性冻结

    • 7 个回答
  • Marko Smith

    子网掩码 /32 是什么意思?

    • 6 个回答
  • Marko Smith

    鼠标指针在 Windows 中按下的箭头键上移动?

    • 1 个回答
  • Marko Smith

    VirtualBox 无法以 VERR_NEM_VM_CREATE_FAILED 启动

    • 8 个回答
  • Marko Smith

    应用程序不会出现在 MacBook 的摄像头和麦克风隐私设置中

    • 5 个回答
  • Martin Hope
    Vickel Firefox 不再允许粘贴到 WhatsApp 网页中? 2023-08-18 05:04:35 +0800 CST
  • Martin Hope
    Saaru Lindestøkke 为什么使用 Python 的 tar 库时 tar.xz 文件比 macOS tar 小 15 倍? 2021-03-14 09:37:48 +0800 CST
  • Martin Hope
    CiaranWelsh 如何减少“vmmem”进程的消耗? 2020-06-10 02:06:58 +0800 CST
  • Martin Hope
    Jim Windows 10 搜索未加载,显示空白窗口 2020-02-06 03:28:26 +0800 CST
  • Martin Hope
    andre_ss6 远程桌面间歇性冻结 2019-09-11 12:56:40 +0800 CST
  • Martin Hope
    Riley Carney 为什么在 URL 后面加一个点会删除登录信息? 2019-08-06 10:59:24 +0800 CST
  • Martin Hope
    zdimension 鼠标指针在 Windows 中按下的箭头键上移动? 2019-08-04 06:39:57 +0800 CST
  • Martin Hope
    jonsca 我所有的 Firefox 附加组件突然被禁用了,我该如何重新启用它们? 2019-05-04 17:58:52 +0800 CST
  • Martin Hope
    MCK 是否可以使用文本创建二维码? 2019-04-02 06:32:14 +0800 CST
  • Martin Hope
    SoniEx2 更改 git init 默认分支名称 2019-04-01 06:16:56 +0800 CST

热门标签

windows-10 linux windows microsoft-excel networking ubuntu worksheet-function bash command-line hard-drive

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve