grep 从 $START 到 $END 的一组行并且在 $MIDDLE 中包含匹配项

Question

Ray Andrews

Asked: 2024-04-20 08:42:24 +0800 CST2024-04-20 08:42:24 +0800 CST 2024-04-20 08:42:24 +0800 CST

是否可以对一行文本中的单词中的字母进行排序？

772

因此，我有一个充满测试命令的文件，我喜欢对我的一些函数运行这些命令，以确保它们正确处理所有可能的情况。虽然有重复的命令是没有意义的。以下是一些示例：

rap ,Xflg MIT X11           
rap ,XPBfl 'MITER'
rap ,Bflg share git-grep    
rap ,bfl X11
rap ,Bfl xzfgrep
rap ,Bf X11

...我的函数“rap”使用逗号而不是破折号来指示字母选项的开头，然后是一些参数。由于这些选项的顺序并不重要：

rap ,Bf X11
rap ,fB X11

...是完全相同的命令。当然，很容易从文件中删除重复行，但是为了避免上述问题，我想要做的是按字母顺序对选项进行排序，以便上面的结果：

rap ,Bf X11
rap ,Bf X11

...然后我就可以删除重复项。没有英雄气概就能完成这样的事吗？请注意，这不是对选项列表进行排序，而是对选项本身进行排序。

3 个回答

Voted

steeldriver · Answer 1 · 2024-04-20T09:44:31+08:00

Best Answer

steeldriver

2024-04-20T09:44:31+08:002024-04-20T09:44:31+08:00

您可以使用 perl 捕获逗号后面的单词字符序列，将结果拆分为数组，对其进行排序并替换结果：

$ perl -pe 's{(?<=,)(\w+)}{join "", sort split(//, $1)}e' yourfile 
rap ,Xfgl MIT X11           
rap ,BPXfl 'MITER'
rap ,Bfgl share git-grep    
rap ,bfl X11
rap ,Bfl xzfgrep
rap ,Bf X11

根据要求，这是一种（可能不是最佳的）方法，可以将所有小写字母选项排序在所有大写字母选项之前：

$ perl -pe 's{(?<=,)(\w+)}{@opts = split(//,$1); join "", 
    (sort grep /[[:lower:]]/,@opts), (sort grep /[[:upper:]]/, @opts)
  }e' yourfile 
rap ,fglX MIT X11           
rap ,flBPX 'MITER'
rap ,fglB share git-grep    
rap ,bfl X11
rap ,flB xzfgrep
rap ,fB X11

3

Stéphane Chazelas · Answer 2 · 2024-04-20T22:08:32+08:00

Stéphane Chazelas

2024-04-20T22:08:32+08:002024-04-20T22:08:32+08:00

另一种perl变体：

$ perl -pe 's{^rap ,\K\S+}{join "", sort split //, $&}e' file
rap ,Xfgl MIT X11
rap ,BPXfl 'MITER'
rap ,Bfgl share git-grep
rap ,bfl X11
rap ,Bfl xzfgrep
rap ,Bf X11

对于在大写字母之前有小写字母的额外要求，您可以依靠以下事实：在 ASCII 中，'x'is 'X' ^ 32（和'X'is 'x' ^ 32）：

$ perl -pe 's{^rap ,\K\S+}{join "", sort {(ord($a)^32) <=> (ord($b)^32)} split //, $&}e' file
rap ,fglX MIT X11
rap ,flBPX 'MITER'
rap ,fglB share git-grep
rap ,bfl X11
rap ,flB xzfgrep
rap ,fB X11

1

jubilatious1 · Answer 3 · 2024-04-21T03:01:12+08:00

使用Raku（以前称为 Perl_6）

~$ raku -pe 's{ <?after \, > (\w+) } = "{$0.comb.sort.join}";'  file

Raku 是 Perl 系列中的一种编程语言，具有对内置 Unicode 的高级支持。上面是 @steeldriver 对优秀 Perl 代码的 Raku 翻译（向 @StéphaneChazelas 致敬）。

形式s///可以写成s{ … } = " … "。替换部分中的花括号（双引号内）表示在捕获上运行的代码块。
Raku 中的正向回顾“Y-after-X”被写入<?after X > Y（负向使用!a 代替 a ?）。
此外，Raku 中的捕获从$0、和
Raku 实现了一个正向（全局）选择器函数comb，在没有正则表达式参数的情况下，它会在每个字符上中断。

输入示例：

rap ,Xflg MIT X11           
rap ,XPBfl 'MITER'
rap ,Bflg share git-grep    
rap ,bfl X11
rap ,Bfl xzfgrep
rap ,Bf X11

示例输出：

rap ,Xfgl MIT X11           
rap ,BPXfl 'MITER'
rap ,Bfgl share git-grep    
rap ,bfl X11
rap ,Bfl xzfgrep
rap ,Bf X11

按字母顺序排列字母选项，小写在前：

~$ raku -pe 's{ <?after \, > (\w+) } = "{ 
               my (@l,@u); 
               $0.comb.map({ /<:Ll>/ ?? @l.push($_) !! @u.push($_) });  
               join "", @l.sort,@u.sort }";'  file

rap ,fglX MIT X11           
rap ,flBPX 'MITER'
rap ,fglB share git-grep    
rap ,bfl X11
rap ,flB xzfgrep
rap ,fB X11

上面使用小写字母的 Unicode 表示形式<:Ll>（详细信息请参阅下面的第一个链接）。同时展出的还有 Raku 的三元运算符：Test ?? True !! False（有关详细信息，请参阅下面的第二个链接）。

https://docs.raku.org/language/regexes#Predefined_character_classes
https://docs.raku.org/language/operators#infix_??_！！
https://docs.raku.org/language/regexes
https://raku.org

是否可以对一行文本中的单词中的字母进行排序？

模块 i915 可能缺少固件 /lib/firmware/i915/*

无法获取 jessie backports 存储库

如何将 GPG 私钥和公钥导出到文件

我们如何运行存储在变量中的命令？

如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域？

dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

如何从 systemctl 服务日志中查看最新的 x 行

Nano - 跳转到文件末尾

grub 错误：你需要先加载内核

如何下载软件包而不是使用 apt-get 命令安装它？

是否可以对一行文本中的单词中的字母进行排序？

3 个回答

相关问题