Tenho um arquivo CSV sem cabeçalho que é classificado na primeira coluna. Quando a 2ª e a 3ª colunas são idênticas, quero "recolhê-las" em uma - ou seja, deixar a última coluna vazia. Em outras palavras, isto:
0000001,11111,66666
0000002,12121,22222
0000003,33333,33333
0000004,74747,44444
0000005,12345,12345
...se torna isto:
0000001,11111,66666
0000002,12121,22222
0000003,33333,
0000004,74747,44444
0000005,12345,
Eu tentei várias permutações de grep
and cut
mas não consegui fazer nada funcionar - o mais próximo que cheguei foi cut -c 8-19 file.csv
, que apenas isola a 2ª e a 3ª colunas. Tenho a sensação de que precisar fazer isso em colunas e precisar excluir o valor em vez da linha inteira torna isso complicado o suficiente para exigir awk
or sed
, e eu não sei o suficiente sobre nenhum dos dois para saber como abordar isso.