大数据框的Pandas IndexError

达·L。

当我尝试向大型DataFrame添加新列时,出现IndexError。有人能帮我解决这个错误吗?

>vec
                 0        1        2        3        4        5        6 
V1.UC8.0         0        0        0        0        0        0        0   
V1.UC48.0        0        0        0        0        0        0        0   

                 7        8        9         ...     2546531  2546532  2546533  
V1.UC8.0         0        0        0   ...           0        0        0   
V1.UC48.0        0        0        0   ...           0        0        0   

               2546534  2546535  2546536  2546537  2546538  2546539  2546540  
V1.UC8.0         0        0        0        0        0        0        0  
V1.UC48.0        0        0        0        0        0        0        0  

[2 rows x 2546541 columns]

> vec['ToDrop']=0


    IndexError                                Traceback (most recent call last)
<ipython-input-40-9868611037ed> in <module>()
----> 1 vec['ToDrop']=0

C:\Anaconda\lib\site-packages\pandas\core\frame.pyc in __setitem__(self, key, value)
   2115         else:
   2116             # set column
-> 2117             self._set_item(key, value)
   2118 
   2119     def _setitem_slice(self, key, value):

C:\Anaconda\lib\site-packages\pandas\core\frame.pyc in _set_item(self, key, value)
   2193         self._ensure_valid_index(value)
   2194         value = self._sanitize_column(key, value)
-> 2195         NDFrame._set_item(self, key, value)
   2196 
   2197         # check if we are modifying a copy

C:\Anaconda\lib\site-packages\pandas\core\generic.pyc in _set_item(self, key, value)
   1188 
   1189     def _set_item(self, key, value):
-> 1190         self._data.set(key, value)
   1191         self._clear_item_cache()
   1192 

C:\Anaconda\lib\site-packages\pandas\core\internals.pyc in set(self, item, value, check)
   2970 
   2971         try:
-> 2972             loc = self.items.get_loc(item)
   2973         except KeyError:
   2974             # This item wasn't present, just insert at end

C:\Anaconda\lib\site-packages\pandas\core\index.pyc in get_loc(self, key, method)
   1435         """
   1436         if method is None:
-> 1437             return self._engine.get_loc(_values_from_object(key))
   1438 
   1439         indexer = self.get_indexer([key], method=method)

pandas\index.pyx in pandas.index.IndexEngine.get_loc (pandas\index.c:3824)()

pandas\index.pyx in pandas.index.IndexEngine.get_loc (pandas\index.c:3578)()

pandas\src\util.pxd in util.get_value_at (pandas\index.c:15287)()

IndexError: index out of bounds

我一直在尝试向转置的DataFrame(vec.T)添加新行,但是出现了相同的错误。

迪尔

确实这很奇怪。

您可以使用以下方法作为解决方法:

vec = pd.merge(vec, pd.DataFrame([0, 0], columns=["new"]), right_index=True, left_index=True)  # Optional: pass copy=False

确保新的1列数据框具有与相同的索引vec

有关为什么这很奇怪的更多信息:

希望有人可以提供适当的答案。

df = pd.DataFrame(np.zeros((2, 2546540)))
df[2546540] = 0

输出:IndexError如在OP的帖子中所述。

df["blah"] = 0

输出:

TypeError: unorderable types: numpy.ndarray() < str()

同时,使用小型数据框就可以了:

df = pd.DataFrame(np.zeros((2, 200)))
df[200] = 0

输出完全符合预期:

   0    1    2    3    4    5    6    7    8    9   ...   191  192  193  194  0    0    0    0    0    0    0    0    0    0    0 ...     0    0    0    0   
1    0    0    0    0    0    0    0    0    0    0 ...     0    0    0    0   

   195  196  197  198  199  200  
0    0    0    0    0    0    0  
1    0    0    0    0    0    0  

[2 rows x 201 columns]

希望这会有所帮助,并且有人可以解释这种熊猫行为。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

IndexError: 数组的索引太多。Numpy + Pandas 数据框

来自分类Dev

从xml检索数据中的IndexError

来自分类Dev

打开Excel文件时的Pandas IndexError

来自分类Dev

IndexError:手动创建Spark数据框时列表索引超出范围?

来自分类Dev

python pandas无法显示大数据框的摘要

来自分类Dev

Pandas boxplot:IndexError:列表索引超出范围

来自分类Dev

使用生成器输入数据集,但得到IndexError

来自分类Dev

在python pandas中的循环中将大数据框中的许多子数据框合并

来自分类Dev

重构复杂的大数据框

来自分类Dev

Python -pandas:如何同时选择大数据框的所有偶数列

来自分类Dev

Python - 尝试在嵌套列表之间传输数据(IndexError:列表分配索引超出范围)

来自分类Dev

Pandas 在一个数据帧上给出 IndexError 但不在另一个类似的数据帧上给出

来自分类Dev

将大数据框写入txt文件

来自分类Dev

从较大数据框中的行子集创建数据框

来自分类Dev

如何合并大小保持与大数据框相同的数据框

来自分类Dev

较大数据框中的数据框列查找

来自分类Dev

了解Python中的IndexError

来自分类Dev

IndexError:无效的分片

来自分类Dev

V-rep IndexError

来自分类Dev

Python多处理IndexError

来自分类Dev

Python IndexError处理

来自分类Dev

IndexError错误错误Python

来自分类Dev

将lambda函数应用于pandas中的列时出现“ IndexError:列表索引超出范围”

来自分类Dev

如何使用布尔类型的MultiIndex访问Pandas DataFrame中的行(“ IndexError:项目的长度错误2而不是3。”)

来自分类Dev

Dash Plotly-仅更改数据源时,如何解决IndexError:列表索引超出范围?

来自分类Dev

在 Pandas 中处理大数据集

来自分类Dev

Python Pandas数据框

来自分类Dev

更改 Pandas 数据框

来自分类Dev

Pandas 数据框改造

Related 相关文章

  1. 1

    IndexError: 数组的索引太多。Numpy + Pandas 数据框

  2. 2

    从xml检索数据中的IndexError

  3. 3

    打开Excel文件时的Pandas IndexError

  4. 4

    IndexError:手动创建Spark数据框时列表索引超出范围?

  5. 5

    python pandas无法显示大数据框的摘要

  6. 6

    Pandas boxplot:IndexError:列表索引超出范围

  7. 7

    使用生成器输入数据集,但得到IndexError

  8. 8

    在python pandas中的循环中将大数据框中的许多子数据框合并

  9. 9

    重构复杂的大数据框

  10. 10

    Python -pandas:如何同时选择大数据框的所有偶数列

  11. 11

    Python - 尝试在嵌套列表之间传输数据(IndexError:列表分配索引超出范围)

  12. 12

    Pandas 在一个数据帧上给出 IndexError 但不在另一个类似的数据帧上给出

  13. 13

    将大数据框写入txt文件

  14. 14

    从较大数据框中的行子集创建数据框

  15. 15

    如何合并大小保持与大数据框相同的数据框

  16. 16

    较大数据框中的数据框列查找

  17. 17

    了解Python中的IndexError

  18. 18

    IndexError:无效的分片

  19. 19

    V-rep IndexError

  20. 20

    Python多处理IndexError

  21. 21

    Python IndexError处理

  22. 22

    IndexError错误错误Python

  23. 23

    将lambda函数应用于pandas中的列时出现“ IndexError:列表索引超出范围”

  24. 24

    如何使用布尔类型的MultiIndex访问Pandas DataFrame中的行(“ IndexError:项目的长度错误2而不是3。”)

  25. 25

    Dash Plotly-仅更改数据源时,如何解决IndexError:列表索引超出范围?

  26. 26

    在 Pandas 中处理大数据集

  27. 27

    Python Pandas数据框

  28. 28

    更改 Pandas 数据框

  29. 29

    Pandas 数据框改造

热门标签

归档