我正在使用Netflix 电影和电视节目数据集来更好地了解熊猫。
date_added列的格式为:“2024 年 9 月 21 日”,据我了解,它将被解析为“%B-%d-%Y”。只需使用 pd.read_csv() 读取即可将此列作为对象类型返回。
使用parse_dates=['date_added']
似乎不起作用,也没有指定格式。这是我的代码:
df = pd.read_csv('netflix_titles.csv', parse_dates=['date_added'], date_format='%B-%d-%Y')
df.info()
导致:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 8807 entries, 0 to 8806
Data columns (total 12 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 show_id 8807 non-null object
1 type 8807 non-null object
2 title 8807 non-null object
3 director 6173 non-null object
4 cast 7982 non-null object
5 country 7976 non-null object
6 date_added 8797 non-null object
7 release_year 8807 non-null int64
8 rating 8803 non-null object
9 duration 8804 non-null object
10 listed_in 8807 non-null object
11 description 8807 non-null object
dtypes: int64(1), object(11)
memory usage: 825.8+ KB
我做错什么了?