AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / ubuntu / 问题 / 1280837
Accepted
Emma Vaze
Emma Vaze
Asked: 2020-10-08 06:18:03 +0800 CST2020-10-08 06:18:03 +0800 CST 2020-10-08 06:18:03 +0800 CST

合并两个文件并聚合另一列

  • 772

我正在尝试根据 id 列比较两个文件,

A.txt 包含 ID、NAME 字段。

B.csv 包含 ID、NAME、PLACE、DATE、

我想从 a.txt 中找出哪个月份的 ID 最多

我正在尝试在 shell 命令中执行此操作。

command-line bash awk powershell
  • 1 1 个回答
  • 291 Views

1 个回答

  • Voted
  1. Best Answer
    steeldriver
    2020-10-08T06:59:06+08:002020-10-08T06:59:06+08:00

    您可以使用csvsql(来自基于 Python 的csvkit包):

    $ csvsql --query '
      SELECT strftime("%m",[ DATE]) AS [month], COUNT(*) AS [count]
      FROM A INNER JOIN B ON A.[ID ] = B.[ID]
      GROUP BY [month] ORDER BY [count] DESC LIMIT 1
    ' A.txt B.CSV
    month,count
    11,3
    

    请注意,LIMIT 1如果超过一个月具有相同的高计数,则可能不会返回您想要的结果。

    另请注意,您的字段名称似乎具有不一致数量的前导/尾随空格。


    恕我直言,它不是那么优雅,但你当然可以使用 awk ex。:

    awk -F, '
      NR==FNR {a[$1]; next} 
      $1 in a {
        # NB not as robust as the csvsql version, which uses a proper strftime
        month = substr($4,2,2); count[month]++
      } 
      END {
        for(m in count){
          if(count[m] > count_max) {
            count_max = count[m]; month = m
          }
        } 
        print month, count[month]
      }
    ' A.txt B.CSV
    
    • 1

相关问题

  • 如何从命令行仅安装安全更新?关于如何管理更新的一些提示

  • 如何从命令行刻录双层 dvd iso

  • 如何从命令行判断机器是否需要重新启动?

  • 文件权限如何工作?文件权限用户和组

  • 如何在 Vim 中启用全彩支持?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    如何运行 .sh 脚本?

    • 16 个回答
  • Marko Smith

    如何安装 .tar.gz(或 .tar.bz2)文件?

    • 14 个回答
  • Marko Smith

    如何列出所有已安装的软件包

    • 24 个回答
  • Marko Smith

    无法锁定管理目录 (/var/lib/dpkg/) 是另一个进程在使用它吗?

    • 25 个回答
  • Martin Hope
    Flimm 如何在没有 sudo 的情况下使用 docker? 2014-06-07 00:17:43 +0800 CST
  • Martin Hope
    Ivan 如何列出所有已安装的软件包 2010-12-17 18:08:49 +0800 CST
  • Martin Hope
    La Ode Adam Saputra 无法锁定管理目录 (/var/lib/dpkg/) 是另一个进程在使用它吗? 2010-11-30 18:12:48 +0800 CST
  • Martin Hope
    David Barry 如何从命令行确定目录(文件夹)的总大小? 2010-08-06 10:20:23 +0800 CST
  • Martin Hope
    jfoucher “以下软件包已被保留:”为什么以及如何解决? 2010-08-01 13:59:22 +0800 CST
  • Martin Hope
    David Ashford 如何删除 PPA? 2010-07-30 01:09:42 +0800 CST

热门标签

10.10 10.04 gnome networking server command-line package-management software-recommendation sound xorg

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve