打印文件行及其长度的脚本[关闭]

Question

Gavriel

Asked: 2022-06-22 04:49:34 +0800 CST2022-06-22 04:49:34 +0800 CST 2022-06-22 04:49:34 +0800 CST

如何根据一列的值聚合 CSV 中的行

772

我的输入是以下排序的 CSV 文件（:用作字段分隔符而不是通常的逗号）：

version:device
1.0.0:dev1
1.0.0:dev2
1.2.3:dev3
1.3.4:dev4
1.3.4:dev5

我想聚合它，以便每个版本都在 1 行：

version:devices
1.0.0:dev1,dev2
1.2.3:dev3
1.3.4:dev4,dev5

7 个回答

Voted

Kusalananda · Answer 1 · 2022-06-22T07:19:35+08:00

Best Answer

Kusalananda

2022-06-22T07:19:35+08:002022-06-22T07:19:35+08:00

使用 GNUdatamash按第一个冒号分隔的字段分组，折叠第二个字段：

$ datamash -t : groupby 1 collapse 2 <file
version:device
1.0.0:dev1,dev2
1.2.3:dev3
1.3.4:dev4,dev5

4

glenn jackman · Answer 2 · 2022-06-22T06:57:23+08:00

glenn jackman

2022-06-22T06:57:23+08:002022-06-22T06:57:23+08:00

miller是一个非常了不起的工具：

mlr --csv --fs : group-by version then nest --ivar , -f device file.csv

version:device
1.0.0:dev1,dev2
1.2.3:dev3
1.3.4:dev4,dev5

2

Archemar · Answer 3 · 2022-06-22T05:36:37+08:00

Archemar

2022-06-22T05:36:37+08:002022-06-22T05:36:37+08:00

尝试

awk -F: '$1 == before { printf ",%s",$2 ; } 
         $1 != before { printf "%s%s",nl,$0 ; before=$1 ; nl="\n" } 
         END {printf nl ; }'

在哪里

-F:告诉 awk:用作分隔符
printf不要打印换行符，除非 tol ( "\n")
这可以是单行的（例如awk -F: '....' file），为了便于阅读，我将行分开。

这使用两个变量来保存新行 ( nl) 和上一个$1的值。

1

ralz · Answer 4 · 2022-06-22T05:31:24+08:00

ralz

2022-06-22T05:31:24+08:002022-06-22T05:31:24+08:00

像这样的东西应该做你想做的事。

awk -F':' 'OFS=""; NR == 1; NR > 1 {x=$1;$1="";a[x]=a[x]$0","}END{for(x in a)print x":"a[x]}' file

0

DanieleGrassini · Answer 5 · 2022-06-22T07:01:01+08:00

DanieleGrassini

2022-06-22T07:01:01+08:002022-06-22T07:01:01+08:00

awk -F: -v OFS=: '
    NR == 1{print;next} 
    !v {v=$1;d=$2;next} 
    v == $1 {d = d","$2}
    v != $1 {print v,d;v=$1;d=$2}
    END{print v,d}
' file

0

Ed Morton · Answer 6 · 2022-06-22T08:14:04+08:00

Ed Morton

2022-06-22T08:14:04+08:002022-06-22T08:14:04+08:00

$ cat tst.awk
BEGIN { FS=OFS=":" }
$1 != prev {
    if ( NR == 1 ) {
        devs = $2 "s"
    }
    else {
        print prev, devs
        devs = $2
    }
    prev = $1
    next
}
{ devs = devs "," $2 }
END { print prev, devs }

$ awk -f tst.awk file
version:devices
1.0.0:dev1,dev2
1.2.3:dev3
1.3.4:dev4,dev5

0

r_31415 · Answer 7 · 2022-06-22T17:38:48+08:00

r_31415

2022-06-22T17:38:48+08:002022-06-22T17:38:48+08:00

csvkit 的另一个解决方案：

csvsql -d ':' --query \
    'SELECT version, GROUP_CONCAT(device) as devices FROM file GROUP BY version' file.txt \
    | csvformat -D ':'
version:devices
1.0.0:dev1,dev2
1.2.3:dev3
1.3.4:dev4,dev5

0

如何根据一列的值聚合 CSV 中的行

模块 i915 可能缺少固件 /lib/firmware/i915/*

无法获取 jessie backports 存储库

如何将 GPG 私钥和公钥导出到文件

我们如何运行存储在变量中的命令？

如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域？

dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

如何从 systemctl 服务日志中查看最新的 x 行

Nano - 跳转到文件末尾

grub 错误：你需要先加载内核

如何下载软件包而不是使用 apt-get 命令安装它？

如何根据一列的值聚合 CSV 中的行

7 个回答

相关问题