Tenho milhões de linhas de dados que meu chefe me pediu para reformatar para eles.
O formato é:
06/28/2022,04:00,142.01,142.38,141.59,142.15,3151
06/28/2022,04:01,142.1,142.1,142.1,142.1,196
Eu preciso reformatar o primeiro campo de data para:
20220628,04:00,142.01,142.38,141.59,142.15,3151
20220628,04:01,142.1,142.1,142.1,142.1,196
%Y%m%d
Eu tenho o seguinte:
gawk -F"," '{OFS=","; $1=strftime("%Y%m%d", $1); print $0}' AAPL.txt > AAPL.csv
mas o estranho é que funciona, mas produz uma data em 1969.
19691231,04:00,142.01,142.38,141.59,142.15,3151
19691231,04:01,142.1,142.1,142.1,142.1,196
Eu não entendo por quê. Eu escolhi gawk
porque awk
no MacOS não tem strftime
e chamar date
externamente cria um grande impacto no desempenho.