当熊猫的read_csv方法引发异常时,如何知道line和col

杰罗姆·B

我正在尝试将巨大的csv文件导入pandas Dataframe(200列和数百万行)。

我正在使用read_csv方法,该方法在参数中提供了dtypes字典,以加快导入速度。

我有一些关于错误格式的例外,我给dtype这样的想法:

ValueError:以10为底的long()的无效文字:''

但是没有引用行号或列名。我的文件很大,该信息将帮助我节省很多时间来查找dtypes结构中的问题。

任何的想法 ?

编辑 :

更准确地说,我将解释所有故事。首先,我尝试读取我的csv文件,该文件在以下命令行中:

t = pd.read_csv(filename, sep=",")

它给我这个错误信息:

C:\ Python27 \ lib \ site-packages \ pandas \ io \ parsers.py:1159:DtypeWarning:列(0)具有混合类型。在导入时指定dtype选项,或将low_memory = False设置为false。

所以我尝试通过这种方式指定我的dtype(我没有复制/粘贴完整的dtype,因为有207个cols):

dtype_file = {
  'a': pd.np.int16,
  'b': pd.np.int16,
...
}
pd.read_csv(filename, sep=",",dtypes=dtype_file, na_filter=False)
杰罗姆·B

实际上,我可以使用low_memory参数自己解决该问题:

pd.read_csv(filename, sep=",", na_filter=False, low_memory=False)

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

熊猫:使用read_csv时如何包含双引号?

来自分类Dev

StringIO和熊猫read_csv

来自分类Dev

使用带有 header=None 的 read_csv() 时熊猫给出异常结果

来自分类Dev

熊猫read_csv,不知道头是否存在

来自分类Dev

如何加快熊猫read_csv的速度?

来自分类Dev

当未提及整个路径时,大熊猫如何访问read_csv?

来自分类Dev

在熊猫中使用read_csv时精度下降

来自分类Dev

熊猫read_csv()和python迭代器作为输入

来自分类Dev

熊猫中的不同read_csv index_col = None / 0 / False

来自分类Dev

如何使用熊猫read_csv加载分类变量?

来自分类Dev

如何熊猫每行read_csv多个记录

来自分类Dev

如何知道某个方法是否可以引发异常

来自分类Dev

Windows上的熊猫read_csv错误

来自分类Dev

熊猫:read_csv表示“以空格分隔”

来自分类Dev

熊猫数据框内存read_csv

来自分类Dev

熊猫列表read_csv编码列表

来自分类Dev

熊猫read_csv导入结果错误

来自分类Dev

熊猫中的编码错误read_csv

来自分类Dev

熊猫read_csv解析日期

来自分类Dev

熊猫read_csv导入结果错误

来自分类Dev

熊猫列表read_csv编码列表

来自分类Dev

熊猫数据框内存read_csv

来自分类Dev

如何使用数字和空格使 read_csv 更灵活

来自分类常见问题

如何为每个csv文件使用read_csv,即使它为空?蟒蛇熊猫

来自分类Dev

如何为每个csv文件使用read_csv,即使它为空?蟒蛇熊猫

来自分类Dev

如何使熊猫read_csv从其自己的csv生成的文件中正确解析日期?

来自分类Dev

使用熊猫read_csv时跳过0xff字节

来自分类Dev

使用熊猫read_csv读取此制表符分隔的文件时,行丢失

来自分类Dev

熊猫read_csv()与sep和quotechar冲突导致意外的列数

Related 相关文章

热门标签

归档