在awk中的两行之间减去相同的列

Question

Dave

Asked: 2023-06-15 21:38:01 +0800 CST2023-06-15 21:38:01 +0800 CST 2023-06-15 21:38:01 +0800 CST

如何使用 awk 使用另一个文件中的数字从文件中正确提取行？

772

我正在使用 bash 外壳。如果我有行号文件

和另一个行文件，其中第一个元素是一个数字，后跟一串文本

1,Michael Jordan
2,Karl Malone,
3,Charles Barkley
4,Greg Anthony
5,Chris Mullen
6,Reggie Miller
7,Billy Owens
8,David Robinson
9,Shaquille O'Neal
10,John Stockton

awk仅当第一个数字属于第一个文件时，如何编写命令从第二个文件中提取行？在上面的例子中，我希望这个结果

1,Michael Jordan
4,Greg Anthony
7,Billy Owens
9,Shaquille O'Neal

我试过这个

awk 'FNR==NR{a[$1];next} $1 in a' /tmp/first_file /tmp/second_file > /tmp/third_file

但它在第三个文件中什么也没有产生。

2 个回答

Voted

steeldriver · Answer 1 · 2023-06-15T22:06:36+08:00

Best Answer

steeldriver

2023-06-15T22:06:36+08:002023-06-15T22:06:36+08:00

由于您的第二个文件是逗号分隔的，因此您需要将 awk 字段分隔符设置为,- 全局使用-F命令行选项：

awk -F, 'FNR==NR{a[$1];next} $1 in a' /tmp/first_file /tmp/second_file > /tmp/third_file

或者通过FS内置变量：

awk 'FNR==NR{a[$1];next} $1 in a' /tmp/first_file FS=, /tmp/second_file > /tmp/third_file

后一种方法允许您处理第一个文件不是逗号分隔（并且有多个字段）的情况。

4

jubilatious1 · Answer 2 · 2023-06-17T13:50:06+08:00

使用Raku（以前称为 Perl_6）

~$ raku -ne 'BEGIN my @a = "nbr_list.txt".IO.lines.map: *.Int;  \
             .put if $_.split(",")[0] == any(@a);'  file.csv

#OR

~$ raku -ne 'BEGIN my @a = "nbr_list.txt".IO.lines.map: *.Int;  \
             .put if $_.split(",")[0] ~~ any(@a);'  file.csv

Raku 是 Perl 家族中的一种编程语言。正如您一样BEGIN，获取数字列表并将其存储在数组中，@a。然后标志-ne从命令行读取文件而不自动打印（awk类似行为）。

此处，该行被读入逗号上的主题变量 ( $_)，并采用split第一个元素 ( )。[0]这些元素使用==数值相等运算符（第一个代码示例）或 Raku 的~~智能匹配运算符进行比较。在运算符的 RHS 上，@a数组变成了一个any()结点。如果满足条件，则条件输出if行。put

示例输入：

1,Michael Jordan
2,Karl Malone,
3,Charles Barkley
4,Greg Anthony
5,Chris Mullen
6,Reggie Miller
7,Billy Owens
8,David Robinson
9,Shaquille O'Neal
10,John Stockton

示例输出（使用nbr_list.txt由 1、4、7、9 组成的文件）：

1,Michael Jordan
4,Greg Anthony
7,Billy Owens
9,Shaquille O'Neal

连接点很有趣，因为它们会自动穿线。对于上述问题，one()联结也有效，甚至可能更有效率。

另一种方法是使用 Sets：行号被转换为 a Setof Ints。数据按行读取，每个第一列都被强制转换为Int，并检查它是否是(elem)集合中的一个元素。请注意，可以在以下代码中使用infix(elem)或 infix , （Unicode 符号）：∈

~$ raku -ne 'BEGIN my $set1 = Set.new("nbr_list.txt".IO.lines.map: *.Int);  \
             .put if $_.split(",").[0].Int (elem) $set1;'  file

https://docs.raku.org/type/Junction
https://docs-stage.raku.org/type/Junction
https://raku.org

如何使用 awk 使用另一个文件中的数字从文件中正确提取行？

模块 i915 可能缺少固件 /lib/firmware/i915/*

无法获取 jessie backports 存储库

如何将 GPG 私钥和公钥导出到文件

我们如何运行存储在变量中的命令？

如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域？

dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

如何从 systemctl 服务日志中查看最新的 x 行

Nano - 跳转到文件末尾

grub 错误：你需要先加载内核

如何下载软件包而不是使用 apt-get 命令安装它？

如何使用 awk 使用另一个文件中的数字从文件中正确提取行？

2 个回答

相关问题