我有一个这样的csv格式的数据集(6000行):
Store,Date,Weekly_Sales,Holiday_Flag,Temperature,Fuel_Price,CPI,Unemployment
1,05-02-2010,1643690.9,0,42.31,2.572,211.0963582,8.106
1,12-02-2010,1641957.44,1,38.51,2.548,211.2421698,8.106
---
---
我想拆分日期列以创建一个仅包含年份的新列。像这样的东西:
Store,Date,Year,Weekly_Sales,Holiday_Flag,Temperature,Fuel_Price,CPI,Unemployment
1,05-02-2010,2010,1643690.9,0,42.31,2.572,211.0963582,8.106
1,12-02-2010,2010,1641957.44,1,38.51,2.548,211.2421698,8.106
我试图使用这段代码,但我不知道如何修改它来解决我的问题: 如何提取年份......
有人可以给我一些建议吗?
我会使用适当的
csv
解析器,例如csvkit
:输出:
但是如果你想用 来做
awk
,这会做: