当熊猫的read_csv方法引发异常时，如何知道line和col

Jérôme B 发表于 Dev

杰罗姆·B

我正在尝试将巨大的csv文件导入pandas Dataframe（200列和数百万行）。

我正在使用read_csv方法，该方法在参数中提供了dtypes字典，以加快导入速度。

我有一些关于错误格式的例外，我给dtype这样的想法：

ValueError：以10为底的long（）的无效文字：''

但是没有引用行号或列名。我的文件很大，该信息将帮助我节省很多时间来查找dtypes结构中的问题。

任何的想法？

编辑：

更准确地说，我将解释所有故事。首先，我尝试读取我的csv文件，该文件在以下命令行中：

t = pd.read_csv(filename, sep=",")

它给我这个错误信息：

C：\ Python27 \ lib \ site-packages \ pandas \ io \ parsers.py：1159：DtypeWarning：列（0）具有混合类型。在导入时指定dtype选项，或将low_memory = False设置为false。

所以我尝试通过这种方式指定我的dtype（我没有复制/粘贴完整的dtype，因为有207个cols）：

dtype_file = {
  'a': pd.np.int16,
  'b': pd.np.int16,
...
}
pd.read_csv(filename, sep=",",dtypes=dtype_file, na_filter=False)

杰罗姆·B

实际上，我可以使用low_memory参数自己解决该问题：

pd.read_csv(filename, sep=",", na_filter=False, low_memory=False)

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-02-20

我来说两句

0条评论

登录后参与评论

来自分类Dev

熊猫：使用read_csv时如何包含双引号？

来自分类Dev

StringIO和熊猫read_csv

来自分类Dev

使用带有 header=None 的 read_csv() 时熊猫给出异常结果

来自分类Dev

熊猫read_csv，不知道头是否存在

来自分类Dev

如何加快熊猫read_csv的速度？

来自分类Dev

当未提及整个路径时，大熊猫如何访问read_csv？

来自分类Dev

在熊猫中使用read_csv时精度下降

来自分类Dev

熊猫read_csv（）和python迭代器作为输入

来自分类Dev

熊猫中的不同read_csv index_col = None / 0 / False

来自分类Dev

如何使用熊猫read_csv加载分类变量？

来自分类Dev

如何熊猫每行read_csv多个记录

来自分类Dev

如何知道某个方法是否可以引发异常

来自分类Dev

Windows上的熊猫read_csv错误

来自分类Dev

熊猫：read_csv表示“以空格分隔”

来自分类Dev

熊猫数据框内存read_csv

来自分类Dev

熊猫列表read_csv编码列表

来自分类Dev

熊猫read_csv导入结果错误

来自分类Dev

熊猫中的编码错误read_csv

来自分类Dev

熊猫read_csv解析日期

来自分类Dev

熊猫read_csv导入结果错误

来自分类Dev

熊猫列表read_csv编码列表

来自分类Dev

熊猫数据框内存read_csv

来自分类Dev

如何使用数字和空格使 read_csv 更灵活

来自分类常见问题

如何为每个csv文件使用read_csv，即使它为空？蟒蛇熊猫

来自分类Dev

如何为每个csv文件使用read_csv，即使它为空？蟒蛇熊猫

来自分类Dev

如何使熊猫read_csv从其自己的csv生成的文件中正确解析日期？

来自分类Dev

使用熊猫read_csv时跳过0xff字节

来自分类Dev

使用熊猫read_csv读取此制表符分隔的文件时，行丢失

来自分类Dev

熊猫read_csv（）与sep和quotechar冲突导致意外的列数

Related 相关文章

文章