我有数百万行数据,我的老板要求我为它们重新格式化。
格式为:
06/28/2022,04:00,142.01,142.38,141.59,142.15,3151
06/28/2022,04:01,142.1,142.1,142.1,142.1,196
我需要将第一个日期字段重新格式化为:
20220628,04:00,142.01,142.38,141.59,142.15,3151
20220628,04:01,142.1,142.1,142.1,142.1,196
%Y%m%d
我有以下内容:
gawk -F"," '{OFS=","; $1=strftime("%Y%m%d", $1); print $0}' AAPL.txt > AAPL.csv
但奇怪的是它有效,但产生的日期是 1969 年。
19691231,04:00,142.01,142.38,141.59,142.15,3151
19691231,04:01,142.1,142.1,142.1,142.1,196
我不明白为什么。我选择gawk
是因为awk
在 MacOS 上没有,strftime
并且在外部调用会date
产生巨大的性能影响。