我找不到其他与我有关的问题。如果我错过了链接,请帮助我...
我有一个csv文件,看起来像这样:
"concentration"
"5"
"5"
"5"
"5"
"5"
"nan"
"nan"
"nan"
"nan"
"nan"
如果我使用pandas read_csv读取它,则“ nan”值将自动解释为NaN。但我想保留它们为字符串。第7行(实际上没有写入任何内容)应该是NaN的缺失值。
我试图这样阅读:
df = pd.read_csv(path, dtype= {'concentration': 'string'}, quoting = csv.QUOTE_NONNUMERIC, sep=',')
有人可以帮忙吗?
看起来您可以使用keep_default_na
和na_values
。从文档:
na_values : list-like or dict, default None
Additional strings to recognize as NA/NaN. If dict passed, specific per-column NA values
keep_default_na : bool, default True
If na_values are specified and keep_default_na is False the default NaN values are overridden, otherwise they’re appended to
所以这是代码
pd.read_csv('c:\\temp\\temp.txt', keep_default_na=False, na_values=[''])
concentration
0 5
1 5
2 5
3 5
4 5
5 NaN
6 nan
7 nan
8 nan
9 nan
10 nan
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句