AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / unix / 问题 / 705694
Accepted
Renga
Renga
Asked: 2022-06-11 05:31:17 +0800 CST2022-06-11 05:31:17 +0800 CST 2022-06-11 05:31:17 +0800 CST

使第二列唯一并在第一列中添加它们的各自值

  • 772

我的输入如下所示,我只需要保留第二列中的唯一字符串,其中第一列将成为每个唯一字符串的所有值的总和。

例如:取OIA第二列中的 并从第一列添加 OIA 的相应值并在之前打印OIA。

输入:

1079 OIA
1079 OIA
975  OIA
975  OIA
372  CLN
243  TLN
224  TLN
224  TLN
224  TLN
224  TLN
224  TLN
224  TLN
224  TLN
224  TLN
224  TLN
224  TLN

预期输出:

4108    OIA
372     CLN
2483    TLN
awk text-processing
  • 3 3 个回答
  • 138 Views

3 个回答

  • Voted
  1. Best Answer
    DanieleGrassini
    2022-06-11T05:42:00+08:002022-06-11T05:42:00+08:00
    awk '{m[$2]+=$1}END{for(i in m)print m[i],i}' file
    

    对于大多数使用空格分隔的列的情况,这应该可以正常工作。

    • 3
  2. Ed Morton
    2022-06-11T09:40:56+08:002022-06-11T09:40:56+08:00

    假设您的输入始终按示例输入中所示的第二列值分组:

    $ awk '$2!=prev{if (NR>1) print sum, prev; sum=0; prev=$2} {sum+=$1} END{print sum, prev}' file
    4108 OIA
    372 CLN
    2483 TLN
    

    上面的内容几乎不会在内存中保留任何内容,因此适用于任意大的文件,并且将以与输入 $2 值相同的顺序生成输出。

    • 3
  3. Kusalananda
    2022-08-18T11:00:24+08:002022-08-18T11:00:24+08:00

    假设数据在第二列上排序,使用 GNU datamash:

    datamash -W groupby 2 sum 1 <file
    

    这会将输入读取为空格分隔的字段,按第二个字段对数据进行分组,并对每个组的第一个字段求​​和。

    给定问题中数据的输出将以制表符分隔:

    CLN     372
    OIA     4108
    TLN     2483
    

    请注意,这些字段与问题中的预期内容交换。要解决此问题,并对第二个字段上的输入数据进行排序(以防它可能不像问题中那样整齐地排序):

    sort -b -k 2,2 file | datamash -W groupby 2 sum 1 | awk -v OFS='\t' '{ print $2, $1 }'
    
    • 1

相关问题

  • 重新排列字母并比较两个单词

  • 在awk中的两行之间减去相同的列

  • 多行文件洗牌

  • 如何更改字符大小写(从小到大,反之亦然)?同时[重复]

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    模块 i915 可能缺少固件 /lib/firmware/i915/*

    • 3 个回答
  • Marko Smith

    无法获取 jessie backports 存储库

    • 4 个回答
  • Marko Smith

    如何将 GPG 私钥和公钥导出到文件

    • 4 个回答
  • Marko Smith

    我们如何运行存储在变量中的命令?

    • 5 个回答
  • Marko Smith

    如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域?

    • 3 个回答
  • Marko Smith

    dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

    • 2 个回答
  • Marko Smith

    如何从 systemctl 服务日志中查看最新的 x 行

    • 5 个回答
  • Marko Smith

    Nano - 跳转到文件末尾

    • 8 个回答
  • Marko Smith

    grub 错误:你需要先加载内核

    • 4 个回答
  • Marko Smith

    如何下载软件包而不是使用 apt-get 命令安装它?

    • 7 个回答
  • Martin Hope
    user12345 无法获取 jessie backports 存储库 2019-03-27 04:39:28 +0800 CST
  • Martin Hope
    Carl 为什么大多数 systemd 示例都包含 WantedBy=multi-user.target? 2019-03-15 11:49:25 +0800 CST
  • Martin Hope
    rocky 如何将 GPG 私钥和公钥导出到文件 2018-11-16 05:36:15 +0800 CST
  • Martin Hope
    Evan Carroll systemctl 状态显示:“状态:降级” 2018-06-03 18:48:17 +0800 CST
  • Martin Hope
    Tim 我们如何运行存储在变量中的命令? 2018-05-21 04:46:29 +0800 CST
  • Martin Hope
    Ankur S 为什么 /dev/null 是一个文件?为什么它的功能不作为一个简单的程序来实现? 2018-04-17 07:28:04 +0800 CST
  • Martin Hope
    user3191334 如何从 systemctl 服务日志中查看最新的 x 行 2018-02-07 00:14:16 +0800 CST
  • Martin Hope
    Marko Pacak Nano - 跳转到文件末尾 2018-02-01 01:53:03 +0800 CST
  • Martin Hope
    Kidburla 为什么真假这么大? 2018-01-26 12:14:47 +0800 CST
  • Martin Hope
    Christos Baziotis 在一个巨大的(70GB)、一行、文本文件中替换字符串 2017-12-30 06:58:33 +0800 CST

热门标签

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve