在另一个文件之后逐行追加行

Question

Kalpesh Bhoj

Asked: 2019-08-31 03:44:24 +0800 CST2019-08-31 03:44:24 +0800 CST 2019-08-31 03:44:24 +0800 CST

准确的差异

772

我有两个文本文件，例如

一个

1111|100|11/11/1111|a
2222|200|11/11/1111|a
3333|300|11/11/1111|a
4444|400|11/11/1111|a

b

1111|100|11/11/1111|a
1111|100|11/11/1111|a
2222|200|11/11/1111|a
3333|300|11/11/1111|a
5555|500|11/11/1111|a

我用过下面的命令

awk -F"|" '{ printf "%4s|%3s|\n",$1,$2 }' a | grep -v -f /dev/stdin b

哪个输出....

5555|500|11/11/1111|a

预期产出是

1111|100|11/11/1111|a
5555|500|11/11/1111|a

我怎样才能做到这一点grep或awk

2 个回答

Voted

Kusalananda · Answer 1 · 2019-08-31T03:52:24+08:00

Kusalananda

2019-08-31T03:52:24+08:002019-08-31T03:52:24+08:00

grep在这里不适合，因为它用于提取与某种形式的正则表达式匹配的单个行（实际上不用于比较文件）。它将无法返回一个匹配项并丢弃另一个匹配项（文件的前两行b）。

你可以使用comm：

$ comm -13 a b
1111|100|11/11/1111|a
5555|500|11/11/1111|a

请注意，这comm依赖于已排序的输入数据。

上面的comm命令-13用于丢弃其默认输出中的第一列和第三列。默认情况下，它将输出仅在第 1 列的第一个文件中找到的行，仅在第 2 列的第二个文件中找到的行和最后一列中的公共行（请参阅comm您系统上的手册，它是一个标准实用程序）：

$ comm a b
                1111|100|11/11/1111|a
        1111|100|11/11/1111|a
                2222|200|11/11/1111|a
                3333|300|11/11/1111|a
4444|400|11/11/1111|a
        5555|500|11/11/1111|a

2

Ed Morton · Answer 2 · 2019-09-02T10:52:05+08:00

Best Answer

Ed Morton

2019-09-02T10:52:05+08:002019-09-02T10:52:05+08:00

使用 GNU awk 对数组和 ARGIND 比较任意数量的未排序文件的更通用方法：

$ cat tst.awk
BEGIN { OFS="\t" }
{ cnt[$0][ARGIND]++ }
END {
    for (str in cnt) {
        for (fileNr=1; fileNr<=ARGIND; fileNr++) {
            printf "%d%s", cnt[str][fileNr], OFS
        }
        print str
    }
}

$ awk -f tst.awk a b
1       2       1111|100|11/11/1111|a
1       1       2222|200|11/11/1111|a
1       1       3333|300|11/11/1111|a
1       0       4444|400|11/11/1111|a
0       1       5555|500|11/11/1111|a

上面显示了所有文件中的每个唯一字符串，以及给定字符串在第一个文件中出现的次数，在第二个文件中出现的次数等。

要获得您想要的输出，那么可以简单地是：

$ awk -f tst.awk a b | awk '$2>$1' | cut -f3-
1111|100|11/11/1111|a
5555|500|11/11/1111|a

0

准确的差异

模块 i915 可能缺少固件 /lib/firmware/i915/*

无法获取 jessie backports 存储库

如何将 GPG 私钥和公钥导出到文件

我们如何运行存储在变量中的命令？

如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域？

dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

如何从 systemctl 服务日志中查看最新的 x 行

Nano - 跳转到文件末尾

grub 错误：你需要先加载内核

如何下载软件包而不是使用 apt-get 命令安装它？

准确的差异

2 个回答

相关问题