AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / unix / 问题 / 558347
Accepted
ptrcao
ptrcao
Asked: 2019-12-22 01:56:42 +0800 CST2019-12-22 01:56:42 +0800 CST 2019-12-22 01:56:42 +0800 CST

连接同一 csv 文件的列以创建具有新标题的新列

  • 772

我所拥有的是一个 CSV 文件:

+------------+--------------+
| Category I | Sub-Category |
+------------+--------------+
|       1144 |          128 |
|       1144 |          128 |
|       1000 |          100 |
|       1001 |          100 |
|       1002 |          100 |
|       1002 |          100 |
|       1011 |          102 |
|       1011 |          102 |
|       1011 |          102 |
|       1011 |          102 |
|       1011 |          102 |
|       1011 |          102 |
|       1013 |          103 |
|       1013 |          103 |
|       1013 |          103 |
|       1013 |          103 |
|       1013 |          103 |
|       1013 |          103 |
|       1013 |          103 |
+------------+--------------+

我希望将上面的第一列和第二列连接起来形成第三个新列,带有一个新的任意标题,效果如下:

+-------------+--------------+-----------------------+
| Category ID | Sub-Category | Arbitrary New Heading |
+-------------+--------------+-----------------------+
|        1144 |          128 |               1144128 |
|        1144 |          128 |               1144128 |
|        1000 |          100 |               1000100 |
|        1001 |          100 |               1001100 |
|        1002 |          100 |               1002100 |
|        1002 |          100 |               1002100 |
|        1011 |          102 |               1011102 |
|        1011 |          102 |               1011102 |
|        1011 |          102 |               1011102 |
|        1011 |          102 |               1011102 |
|        1011 |          102 |               1011102 |
|        1011 |          102 |               1011102 |
|        1013 |          103 |               1013103 |
|        1013 |          103 |               1013103 |
|        1013 |          103 |               1013103 |
|        1013 |          103 |               1013103 |
|        1013 |          103 |               1013103 |
|        1013 |          103 |               1013103 |
|        1013 |          103 |               1013103 |
+-------------+--------------+-----------------------+

我通常的首选实用程序,csvkit 没有办法实现这一点,afaik - 请参阅https://github.com/wireservice/csvkit/issues/930。

什么是不需要高级编程知识的简单解决方案,可以实现这一点?

我模糊地意识到 awk 和 sed 是潜在的解决方案,但我不想将查询限制在那些以防万一有更好(即更简单)的解决方案的情况下。

该解决方案必须对非常大的文件有效,即包含 120,000+ 行。

编辑:为了方便那些想要破解它的人,我已经包含了示例数据;在这里下载:https ://www.dropbox.com/s/achtyxg7qi1629k/category-subcat-test.csv?dl=0

awk sed
  • 2 2 个回答
  • 1202 Views

2 个回答

  • Voted
  1. Best Answer
    aborruso
    2019-12-22T03:23:44+08:002019-12-22T03:23:44+08:00

    使用 Miller ( https://github.com/johnkerl/miller ) 和这个示例输入文件

    Category ID,Sub-Category
    1001,128
    1002,127
    1002,126
    1004,122
    

    并运行

    mlr --csv put -S '$fieldName=${Category ID}." ".${Sub-Category}' input.csv >output.csv
    

    你将会有

    +-------------+--------------+-----------+
    | Category ID | Sub-Category | fieldName |
    +-------------+--------------+-----------+
    | 1001        | 128          | 1001 128  |
    | 1002        | 127          | 1002 127  |
    | 1002        | 126          | 1002 126  |
    | 1004        | 122          | 1004 122  |
    +-------------+--------------+-----------+
    

    你也可以运行 csvsql,它可以通过这种方式运行

    csvsql -I --query 'select *,("Category ID" || " " || "Sub-Category") fieldname from input' input.csv >output.csv
    
    • 5
  2. Praveen Kumar BS
    2019-12-22T23:28:24+08:002019-12-22T23:28:24+08:00

    命令

    Tried with below command
    
    awk 'NR>1{print $1,$2,$1$2 }' file| sed '1i Category Sub-Category New Heading'
    

    输出

    Category Sub-Category New Heading
    1144 128 1144128
    1144 128 1144128
    1000 100 1000100
    1001 100 1001100
    1002 100 1002100
    1002 100 1002100
    1011 102 1011102
    1011 102 1011102
    1011 102 1011102
    1011 102 1011102
    1011 102 1011102
    1011 102 1011102
    1013 103 1013103
    1013 103 1013103
    1013 103 1013103
    1013 103 1013103
    1013 103 1013103
    1013 103 1013103
    
    • 0

相关问题

  • 如何改进这个字符转换脚本?

  • 如何删除两行之间的单行

  • 重新排列字母并比较两个单词

  • 多行文件洗牌

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    模块 i915 可能缺少固件 /lib/firmware/i915/*

    • 3 个回答
  • Marko Smith

    无法获取 jessie backports 存储库

    • 4 个回答
  • Marko Smith

    如何将 GPG 私钥和公钥导出到文件

    • 4 个回答
  • Marko Smith

    我们如何运行存储在变量中的命令?

    • 5 个回答
  • Marko Smith

    如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域?

    • 3 个回答
  • Marko Smith

    dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

    • 2 个回答
  • Marko Smith

    如何从 systemctl 服务日志中查看最新的 x 行

    • 5 个回答
  • Marko Smith

    Nano - 跳转到文件末尾

    • 8 个回答
  • Marko Smith

    grub 错误:你需要先加载内核

    • 4 个回答
  • Marko Smith

    如何下载软件包而不是使用 apt-get 命令安装它?

    • 7 个回答
  • Martin Hope
    user12345 无法获取 jessie backports 存储库 2019-03-27 04:39:28 +0800 CST
  • Martin Hope
    Carl 为什么大多数 systemd 示例都包含 WantedBy=multi-user.target? 2019-03-15 11:49:25 +0800 CST
  • Martin Hope
    rocky 如何将 GPG 私钥和公钥导出到文件 2018-11-16 05:36:15 +0800 CST
  • Martin Hope
    Evan Carroll systemctl 状态显示:“状态:降级” 2018-06-03 18:48:17 +0800 CST
  • Martin Hope
    Tim 我们如何运行存储在变量中的命令? 2018-05-21 04:46:29 +0800 CST
  • Martin Hope
    Ankur S 为什么 /dev/null 是一个文件?为什么它的功能不作为一个简单的程序来实现? 2018-04-17 07:28:04 +0800 CST
  • Martin Hope
    user3191334 如何从 systemctl 服务日志中查看最新的 x 行 2018-02-07 00:14:16 +0800 CST
  • Martin Hope
    Marko Pacak Nano - 跳转到文件末尾 2018-02-01 01:53:03 +0800 CST
  • Martin Hope
    Kidburla 为什么真假这么大? 2018-01-26 12:14:47 +0800 CST
  • Martin Hope
    Christos Baziotis 在一个巨大的(70GB)、一行、文本文件中替换字符串 2017-12-30 06:58:33 +0800 CST

热门标签

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve