所以这是罪魁祸首:
zcat Merged.csv.gz | awk -F, 'FNR == 1 {header = $0; next} !seen[$7]++ {print header | "gzip > data/S20180528_"$7".txt.gz"} {print | "gzip > data/S20180528_"$7".txt.gz";}'
当我在这个大文件(Merged.csv.gz)上运行它时,我得到:
awk: cannot open "gzip > data/S20180528_2505329.txt.gz" for output (Too many open files)
我通过粘贴在此处和 stackoverflow 上找到的部分来创建原始命令。谷歌搜索,我想我可能弄乱了一些报价。现在,我不知道是哪一个。
这意味着您必须关闭打开的文件句柄。
它可能更清洁
由于文件按第 7 列排序: