ifly6提出的问题 -coding

ifly6

Asked: 2023-09-26 21:41:15 +0800 CST

无法解析 pd read_csv 中 Int64 的字符串

5

Pandas 2.0.0 似乎thousands=','在解析Int64对象时没有正确考虑：

import io
pd.read_csv(io.StringIO('''a\n22,922'''), sep='\t', dtype={'a': 'Int64'}, thousands=',')

具体错误是：

Traceback (most recent call last):    
  File pandas/_libs/lib.pyx:2280 in pandas._libs.lib.maybe_convert_numeric    
ValueError: Unable to parse string "22,922"

是否有一种解决方法不涉及返回到 un-nullableint或转换为float？我已经确认这适用于旧的 dtypesdtype={'a': 'int'}和dtype={'a': 'float'}.

Web Analytics