Então aqui está o culpado:
zcat Merged.csv.gz | awk -F, 'FNR == 1 {header = $0; next} !seen[$7]++ {print header | "gzip > data/S20180528_"$7".txt.gz"} {print | "gzip > data/S20180528_"$7".txt.gz";}'
Quando o executo neste arquivo grande (Merged.csv.gz), recebo:
awk: cannot open "gzip > data/S20180528_2505329.txt.gz" for output (Too many open files)
Criei o comando original colando partes que encontrei aqui e no stackoverflow. Pesquisando no Google, acho que posso ter confundido algumas das citações ao fazê-lo. Agora, não consigo descobrir quais.
Isso significa que você deve fechar os identificadores de arquivos abertos.
Pode ser mais limpo para
Como o arquivo está classificado na coluna 7: