重新排列字母并比较两个单词

Question

Bharat

Asked: 2018-04-12 10:50:31 +0800 CST2018-04-12 10:50:31 +0800 CST 2018-04-12 10:50:31 +0800 CST

打印具有重复值计数的某些列数据的唯一值的最简单命令

772

具有 3 列的示例输入数据，第 1 列和第 3 列具有重复值，需要使用它们的重复计数唯一地打印它们。

sort -u 在某种意义上确实有帮助，但无法打印与第一列和第三列相关的重复值的出现。

Input :

3210 -06:00
5172 -06:00
3335 -07:00
3258 -05:00
B 3322 -05:00
B 5097 -05:00
C 3238 -06:00
C 5364 -05:00
C 3366 -06:00
C 3293 -06:00

输出：

A(2) -06:00
A(1) -07:00
A(1) -05:00
乙(2) -05:00
C(3) -06:00
C(1) -05:00

或者

输出：

A 2 -06:00
1 -07:00
1 -05:00
乙 2 -05:00
C 3 -06:00
C 1 -05:00

3 个回答

Voted

hhoke1 · Answer 1 · 2018-04-12T11:03:00+08:00

hhoke1

2018-04-12T11:03:00+08:002018-04-12T11:03:00+08:00

不完全是您想要的格式，但符合所有其他要求：

awk '{print $1" "$3}' <inFile> | sort | uniq -c

在英语中，使用 awk 仅打印第一列和第三列，然后排序，然后使用 count 进行 uniq。

3

Kusalananda · Answer 2 · 2018-04-12T11:13:10+08:00

$ awk '{ count[$1,$3]++ } END { for (i in count) { split(i, field, SUBSEP); printf("%s(%d)%s%s\n", field[1], count[i], OFS, field[2]) } }' file
A(1) -07:00
B(2) -05:00
A(2) -06:00
A(1) -05:00
C(3) -06:00
C(1) -05:00

请注意，输出可能未排序。sort如果需要，请通过它。

代码将输入的第一个和第三个字段作为一对一起出现的次数存储在count数组中（第一个和第三个字段作为索引）。最后，我们循环遍历数组的索引，将它们分成原始的第一个和第三个字段（分别为 asfield[1]和第三个字段field[2]），并将它们与所需格式的计数一起输出。

在替代格式中：

如果输入文件使用单个空格作为字段分隔符（否则使用awk '{ print $1,$3 }'代替cut）：

$ cut -d ' ' -f 1,3 file | sort | uniq -c
   1 A -05:00
   2 A -06:00
   1 A -07:00
   2 B -05:00
   1 C -05:00
   3 C -06:00

要交换前两列：

$ cut -d ' ' -f 1,3 file | sort | uniq -c | awk '{ print $2, $1, $3 }'
A 1 -05:00
A 2 -06:00
A 1 -07:00
B 2 -05:00
C 1 -05:00
C 3 -06:00

agc · Answer 3 · 2018-04-12T11:11:28+08:00

Best Answer

agc

2018-04-12T11:11:28+08:002018-04-12T11:11:28+08:00

给定输入使用cut,sort和uniq:sed

cut -d ' ' -f1,3 Input | 
sort | uniq -c | 
sed 's/^ *//;s/^\([0-9]*\) \([^ ]*\)/\2 \1/'

使用datamash和sed：

datamash -t ' ' -g1,3 -s countunique 2 < Input | 
sed 's/\(.*\) \(.*\) \(.*\)/\1 \3 \2/'

输出：

A 1 -05:00
A 2 -06:00
A 1 -07:00
B 2 -05:00
C 1 -05:00
C 3 -06:00

2

打印具有重复值计数的某些列数据的唯一值的最简单命令

如何将 GPG 私钥和公钥导出到文件

ssh 无法协商：“找不到匹配的密码”，正在拒绝 cbc

我们如何运行存储在变量中的命令？

如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域？

如何卸载内核模块“nvidia-drm”？

dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

如何从 systemctl 服务日志中查看最新的 x 行

Nano - 跳转到文件末尾

grub 错误：你需要先加载内核

如何下载软件包而不是使用 apt-get 命令安装它？

打印具有重复值计数的某些列数据的唯一值的最简单命令

3 个回答

相关问题