为什么在此熊猫数据框分配中丢失9个值?

列文

我正在尝试使用新的标准化值(ndf2)更新原始数据框(df)中的一些数字列。333行非空值赋值后,我的9个数值为NaN-我怀疑我的赋值操作有问题或索引出现问题如何正确执行此操作?

ndf2.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 333 entries, 0 to 332
Data columns (total 4 columns):
 #   Column             Non-Null Count  Dtype  
---  ------             --------------  -----  
 0   bill_length_mm     333 non-null    float64
 1   bill_depth_mm      333 non-null    float64
 2   flipper_length_mm  333 non-null    float64
 3   body_mass_g        333 non-null    float64
dtypes: float64(4)
memory usage: 10.5 KB

df.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 333 entries, 0 to 343
Data columns (total 7 columns):
 #   Column             Non-Null Count  Dtype  
---  ------             --------------  -----  
 0   species            333 non-null    object 
 1   island             333 non-null    object 
 2   bill_length_mm     333 non-null    float64
 3   bill_depth_mm      333 non-null    float64
 4   flipper_length_mm  333 non-null    float64
 5   body_mass_g        333 non-null    float64
 6   sex                333 non-null    object 
dtypes: float64(4), object(3)
memory usage: 20.8+ KB

这就是问题所在-但不确定如何正确执行此操作

df.iloc[:,2:-1] = ndf2  # is this the best way to do this?

因为在此之后:

df.info(), df.shape

<class 'pandas.core.frame.DataFrame'>
Int64Index: 333 entries, 0 to 343
Data columns (total 7 columns):
 #   Column             Non-Null Count  Dtype  
---  ------             --------------  -----  
 0   species            333 non-null    object 
 1   island             333 non-null    object 
 2   bill_length_mm     324 non-null    float64
 3   bill_depth_mm      324 non-null    float64
 4   flipper_length_mm  324 non-null    float64
 5   body_mass_g        324 non-null    float64
 6   sex                333 non-null    object 
dtypes: float64(4), object(3)
memory usage: 20.8+ KB
(None, (333, 7))

我剩下324个数字非空值。对于数据框Int64Index: 333 entries, 0 to 343和所报告的范围不同,我也感到困惑Int64Index: 333 entries, 0 to 343

数据集最初以344个条目开始,但之后

df.dropna(inplace=True)
df.reset_index(drop=True)

正如我所料,它下降到了333。


更新:看来,如果我这样做df.reset_index(drop=True, inplace=True),可以解决此问题。

真空库

可能是您的索引未对齐。您可以使用以下方法进行检查:

df1.index.equals(ndf2.index)

如果不是,则可以通过以下方式重置索引:

df.reset_index(inplace = True)
ndf2.reset_index(inplace = True)

然后,分配值:

df[['bill_length_mm', 'bill_depth_mm', 'flipper_length_mm', 'body_mass_g']] = \
ndf2[['bill_length_mm', 'bill_depth_mm', 'flipper_length_mm', 'body_mass_g']]

或者,如果您的数据集具有相同的行数,则以下操作无需索引对齐即可工作:

df[['bill_length_mm', 'bill_depth_mm', 'flipper_length_mm', 'body_mass_g']] = \
ndf2[['bill_length_mm', 'bill_depth_mm', 'flipper_length_mm', 'body_mass_g']].to_numpy()

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

为什么指针在此Go程序中丢失其值

来自分类Dev

根据熊猫数据框中的条件为列分配值

来自分类Dev

重新分配熊猫数据框中的值范围?

来自分类Python

熊猫将值分配给已过滤的数据框/系列。为什么不一致?

来自分类Dev

他们为什么熊猫将数据框中的int值转换为float?

来自分类Dev

为什么我在熊猫中得到一个空的数据框?

来自分类Dev

为什么在熊猫的数据框列(对象类型系列)上没有参数的all()返回列中的最后一个值

来自分类Dev

遍历熊猫数据框并分配值

来自分类Python

我为什么要在熊猫中复制数据框

来自分类Dev

为什么“&=”会在熊猫数据框中插入?

来自分类Dev

为什么在熊猫数据框列中应用更改dtype

来自分类Dev

如何在熊猫中参考另一个数据框值来分配唯一键?

来自分类Dev

为什么const在此模板结构中丢失?

来自分类Dev

在数据帧上使用熊猫的reindex方法时,为什么原始值会丢失?

来自分类Dev

熊猫数据框在其他数据框中查找值并分配值

来自分类Dev

计算熊猫数据框中包含n个值的行数

来自分类Dev

为什么在此变量分配中引用了两个对象?

来自分类Dev

熊猫:为什么列的dtype在分配给数据框时会发生变化

来自分类Dev

在熊猫数据框中随机插入NA的值-完全没有行丢失

来自分类Dev

为什么我的数据没有显示在此熊猫图中?

来自分类Dev

熊猫数据框将值除以另一个数据框中的值

来自分类Dev

为什么索引的对齐方式在此数据框中如此奇怪?如何解决?

来自分类Dev

熊猫:根据另一个数据框分配值

来自分类Dev

根据两个熊猫数据框之间的条件将值分配给新列

来自分类Dev

从另一个数据框中更新熊猫数据框中的特定值

来自分类Python

在此数据框中填充缺失值的最有效方法是什么?

来自分类Dev

熊猫数据框使用前N行值分配值

来自分类Dev

为什么我的熊猫数据框仅显示一个数据集的结果?

来自分类Dev

为什么在此示例中多个线程分配效率低下?

Related 相关文章

  1. 1

    为什么指针在此Go程序中丢失其值

  2. 2

    根据熊猫数据框中的条件为列分配值

  3. 3

    重新分配熊猫数据框中的值范围?

  4. 4

    熊猫将值分配给已过滤的数据框/系列。为什么不一致?

  5. 5

    他们为什么熊猫将数据框中的int值转换为float?

  6. 6

    为什么我在熊猫中得到一个空的数据框?

  7. 7

    为什么在熊猫的数据框列(对象类型系列)上没有参数的all()返回列中的最后一个值

  8. 8

    遍历熊猫数据框并分配值

  9. 9

    我为什么要在熊猫中复制数据框

  10. 10

    为什么“&=”会在熊猫数据框中插入?

  11. 11

    为什么在熊猫数据框列中应用更改dtype

  12. 12

    如何在熊猫中参考另一个数据框值来分配唯一键?

  13. 13

    为什么const在此模板结构中丢失?

  14. 14

    在数据帧上使用熊猫的reindex方法时,为什么原始值会丢失?

  15. 15

    熊猫数据框在其他数据框中查找值并分配值

  16. 16

    计算熊猫数据框中包含n个值的行数

  17. 17

    为什么在此变量分配中引用了两个对象?

  18. 18

    熊猫:为什么列的dtype在分配给数据框时会发生变化

  19. 19

    在熊猫数据框中随机插入NA的值-完全没有行丢失

  20. 20

    为什么我的数据没有显示在此熊猫图中?

  21. 21

    熊猫数据框将值除以另一个数据框中的值

  22. 22

    为什么索引的对齐方式在此数据框中如此奇怪?如何解决?

  23. 23

    熊猫:根据另一个数据框分配值

  24. 24

    根据两个熊猫数据框之间的条件将值分配给新列

  25. 25

    从另一个数据框中更新熊猫数据框中的特定值

  26. 26

    在此数据框中填充缺失值的最有效方法是什么?

  27. 27

    熊猫数据框使用前N行值分配值

  28. 28

    为什么我的熊猫数据框仅显示一个数据集的结果?

  29. 29

    为什么在此示例中多个线程分配效率低下?

热门标签

归档