我对用逗号分隔的文本文件有疑问,当我要开始接收具有混合布局的文件(数百个)时,一些记录将有 7 个字段(总共 6 个逗号)和其他记录在同一个文件中将有 6 个字段(共 5 个逗号)。
当我找到一条包含 5 个逗号的记录时,我想在该记录的末尾添加一个逗号,后跟 NA,因此我的加载过程认为它有 7 个字段,即最后一个 NA。
这就是我现在所拥有的,第一条记录有 7 个字段,第二条只有 6 个:
200000003183000100,Data,NA,0,IN,0,0.00
200000004625000000,Data,NA,0,IN,0
这是我所期望的(两条记录都有 7 个字段)
200000003183000100,Data,NA,0,IN,0,0.00
200000004625000000,Data,NA,0,IN,0,NA
这可以用 sed 或类似的东西计算逗号并在文件末尾添加,NA 只要只有 5 个逗号。请记住,这将发生在数百个文件中,所以我不知道是否需要使用文件名作为参数等等。