AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / unix / 问题 / 427301
Accepted
AfroJoe
AfroJoe
Asked: 2018-03-01 12:35:42 +0800 CST2018-03-01 12:35:42 +0800 CST 2018-03-01 12:35:42 +0800 CST

通过将前一行与当前和次要计算进行比较来转换现有的 .CSV

  • 772

再会!我有一个包含 9 列的 .CSV 文件。我需要将其内容解析为一个新文件,执行一些小计算并在此过程中创建一个新行。我认为这可以通过显示现有的 .CSV 和所需的输出来最好地说明:

现有的 .CSV 内容(9 列)

$cat file
Trans #,Type,Date,Num,Name,Memo,Account,Debit,Credit
1321,General Journal,1/4/2013,1127,,Consulting,Cash on Hand,,20.61
,,,,,,IT Services,20.61,
,,,,,,,20.61,20.61
,,,,,,,,
1322,General Journal,7/3/2013,1128,,Utilities,Cash on Hand,,105.5
,,,,,,Utilities,105.5,
,,,,,,,105.5,105.5
,,,,,,,,
1323,General Journal,4/3/2013,1129,,Bell,Cash on Hand,,466.69
,,,,,,Telephone,466.69,
,,,,,,,466.69,466.69
,,,,,,,,
1324,General Journal,1/3/2013,1130,,Consulting,Cash on Hand,,20.61
,,,,,,IT Services,20.61,
,,,,,,,20.61,20.61
,,,,,,,,
1325,General Journal,6/3/2013,1131,,Utilities,Cash on Hand,,79.09
,,,,,,Utilities,79.09,
,,,,,,,79.09,79.09
,,,,,,,,

期望的输出

Trans #,Type,Date,Num,Name,Memo,Account,Debit,Credit
1321,Expense,1/4/2013,1127,0,Consulting,Cash on Hand,,20.61
1321,Expense,1/4/2013,1127,0,Consulting,IT Services,18.24,
1321,Expense,1/4/2013,1127,0,Consulting,HST - Input tax,2.37,
1321,Expense,1/4/2013,1127,0,,,20.61,20.61
1322,Expense,7/3/2013,1128,0,Utilities,Cash on Hand,,105.5
1322,Expense,7/3/2013,1128,0,Utilities,Utilities,93.36,
1322,Expense,7/3/2013,1128,0,Utilities,HST - Input tax,12.14,
1322,Expense,7/3/2013,1128,0,,,105.50,105.5
1323,Expense,4/3/2013,1129,0,Bell,Cash on Hand,,466.69
1323,Expense,4/3/2013,1129,0,Bell,Telephone,413.00,
1323,Expense,4/3/2013,1129,0,Bell,HST - Input tax,53.69,
1323,Expense,4/3/2013,1129,0,,,466.69,466.69
1324,Expense,1/3/2013,1130,0,Consulting,Cash on Hand,,20.61
1324,Expense,1/3/2013,1130,0,Consulting,IT Services,18.24,
1324,Expense,1/3/2013,1130,0,Consulting,HST - Input tax,2.37,
1324,Expense,1/3/2013,1130,0,,,20.61,20.61
1325,Expense,6/3/2013,1131,0,Utilities,Cash on Hand,,79.09
1325,Expense,6/3/2013,1131,0,Utilities,Utilities,69.99,
1325,Expense,6/3/2013,1131,0,Utilities,HST - Input tax,9.10,
1325,Expense,6/3/2013,1131,0,,,79.09,79.09

正如您在期望的输出中看到的那样,我需要一些新东西:

  • 如果下一行是,则从上一行复制第 1、3、5 列NULL
  • 如果上一行中的第 5 列则改为NULL打印N/A
  • 将第二列中的所有条目更改为Expense(从General Journal)
  • 第 8 列(借方)是现有值减去13%
  • 插入新行并计算 HST 税 (13%)

到目前为止我做了什么?我搜索了整个 StackExchange 并提出了以下内容(来自这篇文章:)

    awk '{
       split($0,D,/[^[:space:]]*/);
       s = "";
       for(i=1;i<=NF;i++){ 
            if($i~/NoData/){ $i =  last[i]; } 
            last[i]=$i ; 
            s = s  sprintf("%s%s",D[i],$i) 
       }  
       print s
 }' file
awk csv
  • 1 1 个回答
  • 306 Views

1 个回答

  • Voted
  1. Best Answer
    Kusalananda
    2018-03-02T02:53:20+08:002018-03-02T02:53:20+08:00

    此awk脚本尝试实施您描述的操作:

    BEGIN   { OFS = FS = "," }
    
    NR == 1 { name = "N/A" }
    
    NR > 1 {
        # use values from previous row if missing
        if ($1 == "") $1 = trans
        if ($3 == "") $3 = date
        if ($5 == "") $5 = name
    
        $2 = "Expense"
    
        $9 = 0.13 * $8
        $8 -= $9
    
        # set values that may be used by the next row
        trans = $1
        date  = $3
        name  = ($5 == "" ? "N/A" : $5)
    }
    
    { print }
    

    在您提供的示例数据上运行:

    $ awk -f script.awk file.csv
    Trans #,Type,Date,Num,Name,Memo,Account,Debit,Credit
    1321,Expense,1/4/2013,1127,N/A,Consulting,Cash on Hand,0,0
    1321,Expense,1/4/2013,,N/A,,IT Services,17.9307,2.6793
    1321,Expense,1/4/2013,,N/A,,,17.9307,2.6793
    1321,Expense,1/4/2013,,N/A,,,0,0
    1322,Expense,7/3/2013,1128,N/A,Utilities,Cash on Hand,0,0
    1322,Expense,7/3/2013,,N/A,,Utilities,91.785,13.715
    1322,Expense,7/3/2013,,N/A,,,91.785,13.715
    1322,Expense,7/3/2013,,N/A,,,0,0
    1323,Expense,4/3/2013,1129,N/A,Bell,Cash on Hand,0,0
    1323,Expense,4/3/2013,,N/A,,Telephone,406.02,60.6697
    1323,Expense,4/3/2013,,N/A,,,406.02,60.6697
    1323,Expense,4/3/2013,,N/A,,,0,0
    1324,Expense,1/3/2013,1130,N/A,Consulting,Cash on Hand,0,0
    1324,Expense,1/3/2013,,N/A,,IT Services,17.9307,2.6793
    1324,Expense,1/3/2013,,N/A,,,17.9307,2.6793
    1324,Expense,1/3/2013,,N/A,,,0,0
    1325,Expense,6/3/2013,1131,N/A,Utilities,Cash on Hand,0,0
    1325,Expense,6/3/2013,,N/A,,Utilities,68.8083,10.2817
    1325,Expense,6/3/2013,,N/A,,,68.8083,10.2817
    1325,Expense,6/3/2013,,N/A,,,0,0
    

    这与您的预期输出不符,但由于您的预期输出首先不符合规范,因此我没有尝试对其进行过多解释。

    • 1

相关问题

  • 根据第一个逗号之前的匹配删除重复行数

  • 在另一个文件之后逐行追加行

  • 如何删除两行之间的单行

  • 重新排列字母并比较两个单词

  • 多行文件洗牌

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    如何将 GPG 私钥和公钥导出到文件

    • 4 个回答
  • Marko Smith

    ssh 无法协商:“找不到匹配的密码”,正在拒绝 cbc

    • 4 个回答
  • Marko Smith

    我们如何运行存储在变量中的命令?

    • 5 个回答
  • Marko Smith

    如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域?

    • 3 个回答
  • Marko Smith

    如何卸载内核模块“nvidia-drm”?

    • 13 个回答
  • Marko Smith

    dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

    • 2 个回答
  • Marko Smith

    如何从 systemctl 服务日志中查看最新的 x 行

    • 5 个回答
  • Marko Smith

    Nano - 跳转到文件末尾

    • 8 个回答
  • Marko Smith

    grub 错误:你需要先加载内核

    • 4 个回答
  • Marko Smith

    如何下载软件包而不是使用 apt-get 命令安装它?

    • 7 个回答
  • Martin Hope
    rocky 如何将 GPG 私钥和公钥导出到文件 2018-11-16 05:36:15 +0800 CST
  • Martin Hope
    Wong Jia Hau ssh-add 返回:“连接代理时出错:没有这样的文件或目录” 2018-08-24 23:28:13 +0800 CST
  • Martin Hope
    Evan Carroll systemctl 状态显示:“状态:降级” 2018-06-03 18:48:17 +0800 CST
  • Martin Hope
    Tim 我们如何运行存储在变量中的命令? 2018-05-21 04:46:29 +0800 CST
  • Martin Hope
    Ankur S 为什么 /dev/null 是一个文件?为什么它的功能不作为一个简单的程序来实现? 2018-04-17 07:28:04 +0800 CST
  • Martin Hope
    user3191334 如何从 systemctl 服务日志中查看最新的 x 行 2018-02-07 00:14:16 +0800 CST
  • Martin Hope
    Marko Pacak Nano - 跳转到文件末尾 2018-02-01 01:53:03 +0800 CST
  • Martin Hope
    Kidburla 为什么真假这么大? 2018-01-26 12:14:47 +0800 CST
  • Martin Hope
    Christos Baziotis 在一个巨大的(70GB)、一行、文本文件中替换字符串 2017-12-30 06:58:33 +0800 CST
  • Martin Hope
    Bagas Sanjaya 为什么 Linux 使用 LF 作为换行符? 2017-12-20 05:48:21 +0800 CST

热门标签

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve