我有以下 csv,我想将其读入 Python(Spyder)并计算第 2 列中的空白值数量:
第 1 列 | 第 2 栏 |
---|---|
一个 | 不适用 |
乙 | 不适用 |
碳 | 不适用 |
德 | |
埃 | 不适用 |
F | 不适用 |
格 | |
赫 | 不适用 |
本例中有两个空白值,其余都是默认值。
标准代码为:
LoadFile=pd.read_csv(FileName)
读入的数据如下:
第 1 列 | 第 2 栏 |
---|---|
一个 | 钠 |
乙 | 钠 |
碳 | 钠 |
德 | 钠 |
埃 | 钠 |
F | 钠 |
格 | 钠 |
赫 | 钠 |
所以空计数是 8,而不是 2
missings =LoadFile['column 2'].isnull().sum()
然后我尝试以如下方式读它:
LoadFile=pd.read_csv(FileName,na_values='', keep_default_na=False)
将表格改为:
第 1 列 | 第 2 栏 |
---|---|
一个 | 不适用 |
乙 | 不适用 |
碳 | 不适用 |
德 | 不适用 |
埃 | 不适用 |
F | 不适用 |
格 | 不适用 |
赫 | 不适用 |
因此空计数为零。
我如何读取我的 csv 文件以便空计数为 2 并且它不会改变空值。
这对我来说很好。
或者,不定义
na_values
和计算空白:输出:
2