使用特定列在scikit-learn中估算分类缺失值

没有

我为患者设置了数据集,我想处理这些数据的缺失值,它包含数字和文本,这是我想根据受试者ID处理的想法。不基于列替换仅数据集如下所示

 subject_id     time      heart_rate      blood_pressure    urine_color 
   1             1.10          23              60                red
   1              2                            40                
   2             3             60              80              
   2             4                                            dark yellow 

我想将文本数据替换为最常用的患者数据,并将数值替换为患者的平均值,就像这样

 subject_id     time      heart_rate      blood_pressure    urine_color 
   1             1.10          23              60                red
   1              2            23              40                red
   2             3             60              80              dark yellow 
   2             4             60              80              dark yellow

任何人都可以帮助解决这一问题,我可以搜索所有估算方法,在列中使用频率最高,或者对整个列进行统计分析

耶斯列尔

使用GroupBy.transform自定义功能mean与数字列,并mode为categoricals列,并通过替换缺失值DataFrame.fillna

f = lambda x: x.mean() if np.issubdtype(x.dtype, np.number) else x.mode().iat[0]

如果可能,请替代NaN每个组中分类列的所有s值:

f = lambda x: x.mean() if np.issubdtype(x.dtype, np.number) else next(iter(x.mode()), None)

cols = df.columns.difference(['subject_id'])
df[cols] = df[cols].fillna(df.groupby('subject_id')[cols].transform(f))
print (df)
   subject_id time  heart_rate  blood_pressure  urine_color
0           1  1.1          23              60          red
1           1    2          23              40          red
2           2    3          60              80  dark yellow
3           2    4          60              80  dark yellow

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

通过从熊猫和scikit-learn中的非缺失值估算方程来估算缺失值

来自分类Dev

使用ARIMA模型估算缺失值

来自分类Dev

使用ARIMA模型估算缺失值

来自分类Dev

使用scikit学习OneHotEncoder时如何处理分类数据中的缺失值(NaN)?

来自分类Dev

如何使用模式/均值在pandas数据框中估算全部缺失值?

来自分类Dev

在数据框中的所有列中估算最频繁的分类值

来自分类Dev

使用scikit-learn的Imputer模块预测缺失值

来自分类Dev

如何为该数据集使用从R中的回归方程模拟的值来估算变量的缺失值?

来自分类Dev

用R中的特定列填充缺失值的缺失日期

来自分类Dev

Scikit-Learn中的分类数据转换

来自分类Dev

使用scikit-learn处理分类特征

来自分类Dev

使用scikit-learn处理分类特征

来自分类Dev

在JavaScript数组中估算缺失值

来自分类Dev

使用熊猫更新列中的缺失值

来自分类Dev

情感分类中的缺失值

来自分类Dev

scikit-learn中处理nan / null的分类器

来自分类Dev

scikit-learn中多类问题的级联分类器

来自分类Dev

Scikit Learn中估算器的丰富视觉表示-获取文本而不是图表

来自分类Dev

删除scikit Learn中的特定功能

来自分类Dev

使用 Scikit-Learn 使用分类数据制作回归模型

来自分类Dev

如何将数据框列的分类值转换为sckikit-learn中的一键编码列?

来自分类Dev

联接表以查找列中的缺失值

来自分类Dev

根据每行中的缺失值选择列

来自分类Dev

联接表以查找列中的缺失值

来自分类Dev

使用scikit-learn处理太多分类功能

来自分类Dev

使用scikit-learn进行二次采样+分类

来自分类Dev

在Scikit-Learn中使用近似最近邻进行分类

来自分类Dev

使用scikit-learn生成困难分类数据集

来自分类Dev

使用scikit-learn的置换测试进行的重大检验结果为所有分类器提供了相同的p值

Related 相关文章

  1. 1

    通过从熊猫和scikit-learn中的非缺失值估算方程来估算缺失值

  2. 2

    使用ARIMA模型估算缺失值

  3. 3

    使用ARIMA模型估算缺失值

  4. 4

    使用scikit学习OneHotEncoder时如何处理分类数据中的缺失值(NaN)?

  5. 5

    如何使用模式/均值在pandas数据框中估算全部缺失值?

  6. 6

    在数据框中的所有列中估算最频繁的分类值

  7. 7

    使用scikit-learn的Imputer模块预测缺失值

  8. 8

    如何为该数据集使用从R中的回归方程模拟的值来估算变量的缺失值?

  9. 9

    用R中的特定列填充缺失值的缺失日期

  10. 10

    Scikit-Learn中的分类数据转换

  11. 11

    使用scikit-learn处理分类特征

  12. 12

    使用scikit-learn处理分类特征

  13. 13

    在JavaScript数组中估算缺失值

  14. 14

    使用熊猫更新列中的缺失值

  15. 15

    情感分类中的缺失值

  16. 16

    scikit-learn中处理nan / null的分类器

  17. 17

    scikit-learn中多类问题的级联分类器

  18. 18

    Scikit Learn中估算器的丰富视觉表示-获取文本而不是图表

  19. 19

    删除scikit Learn中的特定功能

  20. 20

    使用 Scikit-Learn 使用分类数据制作回归模型

  21. 21

    如何将数据框列的分类值转换为sckikit-learn中的一键编码列?

  22. 22

    联接表以查找列中的缺失值

  23. 23

    根据每行中的缺失值选择列

  24. 24

    联接表以查找列中的缺失值

  25. 25

    使用scikit-learn处理太多分类功能

  26. 26

    使用scikit-learn进行二次采样+分类

  27. 27

    在Scikit-Learn中使用近似最近邻进行分类

  28. 28

    使用scikit-learn生成困难分类数据集

  29. 29

    使用scikit-learn的置换测试进行的重大检验结果为所有分类器提供了相同的p值

热门标签

归档