如何使用 Bash 内置的“printf”在源中包含颜色的列中输出？

Question

tucomax

Asked: 2021-12-26 01:21:50 +0800 CST2021-12-26 01:21:50 +0800 CST 2021-12-26 01:21:50 +0800 CST

使用 awk 生成销售报告

772

我尝试使用 awk 脚本为每家商店创建销售报告。数据集为 csv 格式，共有 45 个商店。数据示例如下：

Store,Store_name,Date,Year,Weekly_Sales,Holiday_Flag,Temperature,Fuel_Price,CPI,Unemployment
1,Store1,05-02-2010,2010,1643690.9,No,42.31,2.572,211.0963582,8.106
1,Store1,12-02-2010,2010,1641957.44,Yes,38.51,2.548,211.2421698,8.106
...
...
45,Store45,12-10-2012,2012,734464.36,No,54.47,4,192.3272654,8.667
45,Store45,19-10-2012,2012,718125.53,No,56.47,3.969,192.3308542,8.667

我正在尝试使用以下代码对商店进行分组并汇总各个组记录：

#!/usr/bin/awk -f

awk BEGIN {F=","} {a[$2]+=$5;}END{for(i in a)print i", "a[i];}

上面代码的输出如下：

Store1, 2.22403e+08
...
...
Store45, 1.12395e+08

我想要两件事：按降序排序并更改不是科学计数法和两个浮点数的数字。有人可以给我一些建议吗？

2 个回答

Voted

cas · Answer 1 · 2021-12-26T01:32:43+08:00

Best Answer

cas

2021-12-26T01:32:43+08:002021-12-26T01:32:43+08:00

使用 printf 格式化输出。例如printf "%s, %.2f\n", i, a[i]。并通过管道sort对输出进行排序。例如：

按商店名称排序，使用 GNU sort 的-V“版本”排序选项（又名“自然排序”）：

$ awk -F, '{a[$2]+=$5;}END{for(i in a)printf "%s, %.2f\n", i, a[i]}' file.csv | sort -V -k1,1
Store1, 3285648.34
Store45, 1452589.89

按总销售额排序：

$ awk -F, '{a[$2]+=$5;}END{for(i in a)printf "%s, %.2f\n", i, a[i]}' file.csv | sort -k2,2
Store45, 1452589.89
Store1, 3285648.34

2

Ed Morton · Answer 2 · 2021-12-26T12:24:32+08:00

Ed Morton

2021-12-26T12:24:32+08:002021-12-26T12:24:32+08:00

使用for (i in a)循环改变输出索引的顺序a，请参阅https://www.gnu.org/software/gawk/manual/gawk.html#Scanning-an-Array。有更好的方法可以做到这一点，但是由于您的商店已经在您的输入中排序，因此您根本不需要数组，并且可以通过一次处理一个商店来保持商店在输出中以相同的方式排序。重新读取，这也是更高效的内存和执行速度，因为您不需要将所有数据存储在内存中，然后循环遍历 END 部分中的所有存储。

$ cat tst.awk
BEGIN {
    FS = ","
    ofmt = "%s, %0.2f\n"
}
$2 != store {
    if ( NR > 2 ) {
        printf ofmt, store, tot
    }
    store = $2
    tot = 0
}
{ tot += $5 }
END {
    printf ofmt, store, tot
}

$ awk -f tst.awk file
Store1, 3285648.34
Store45, 1452589.89

1

使用 awk 生成销售报告

模块 i915 可能缺少固件 /lib/firmware/i915/*

无法获取 jessie backports 存储库

如何将 GPG 私钥和公钥导出到文件

我们如何运行存储在变量中的命令？

如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域？

dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

如何从 systemctl 服务日志中查看最新的 x 行

Nano - 跳转到文件末尾

grub 错误：你需要先加载内核

如何下载软件包而不是使用 apt-get 命令安装它？

使用 awk 生成销售报告

2 个回答

相关问题