如何从命令行仅安装安全更新？关于如何管理更新的一些提示

Question

αғsнιη

Asked: 2016-01-04 00:44:36 +0800 CST2016-01-04 00:44:36 +0800 CST 2016-01-04 00:44:36 +0800 CST

使用 `awk` 打印唯一单词、出现次数和总和

772

如何使用 in 中的单个数组打印唯一单词、它们出现的次数以及它们在相关列中的值的总和awk？

我正在使用awk：

awk -F, '{sum[$1]+=$2} END{for (x in sum) print x, sum[x]}' inFile

我可以修改上面的命令来打印唯一单词的总出现次数吗？以下示例输入的结果类似于以下结果：

结果（打印结果的顺序无关紧要）：

A 2 25 
B 1 12 
C 3 18

输入：

A,15
C,13
C,4
A,10
B,12
C,1

我可以添加另一个数组来分别计算它们，但我认为应该有另一种方法来使用相同的数组打印它。

数组中是否有任何索引sum来存储看到的总单词？

2 个回答

Voted

terdon · Answer 1 · 2016-01-04T01:40:18+08:00

terdon

2016-01-04T01:40:18+08:002016-01-04T01:40:18+08:00

不，没有这样的索引。数组值不计算它们增加了多少次。这里最自然的做法是使用第二个数组：

$ awk -F, '{sum[$1]+=$2;seen[$1]++} END{for(x in sum) print x,seen[x],sum[x]}' file
A 2 25
B 1 12
C 3 18

您也可以使用 Kos 的答案中所示的二维数组，但是正如您所看到的，这实际上并没有以任何方式简化事情。或者，您可以使用一些 perl 魔法：

$ perl -F, -lane 'push @{$k{$F[0]}},${$k{$F[0]}}[-1]+$F[1]; 
            END{print "$_ ",$#{$k{$_}}+1," ${$k{$_}}[-1]" for keys(%k)}' file
C 3 18
B 1 12
A 2 25

不，这不是线路噪音，是的，它使用单个阵列来打印所有内容。

6

kos · Answer 2 · 2016-01-04T01:22:26+08:00

Best Answer

kos

2016-01-04T01:22:26+08:002016-01-04T01:22:26+08:00

这应该这样做：

awk -F, '{x[$1]["count"]++;x[$1]["sum"]+=$2}END{for(y in x){print y,x[y]["count"],x[y]["sum"]}}' in

基本上，您将数组替换为多维数组，以便存储每个唯一第一个字段的出现次数及其相关第二个字段的总和。

% cat in
A,15
C,13
C,4
A,10
B,12
C,1
% awk -F, '{x[$1]["count"]++;x[$1]["sum"]+=$2}END{for(y in x){print y,x[y]["count"],x[y]["sum"]}}' in
A 2 25
B 1 12
C 3 18

2

使用 `awk` 打印唯一单词、出现次数和总和

如何运行 .sh 脚本？

如何安装 .tar.gz（或 .tar.bz2）文件？

如何列出所有已安装的软件包

无法锁定管理目录 (/var/lib/dpkg/) 是另一个进程在使用它吗？

使用 `awk` 打印唯一单词、出现次数和总和

2 个回答

相关问题