Python - 使用 scikit 学习随机森林关于值格式的错误

R用户

当我执行命令时:

clf.fit(train_data, train_label)

我收到以下错误

ValueError: 输入包含 NaN、无穷大或对于 dtype('float32') 来说太大的值。

问题是train_data大小为 (18000,20)的数组我试过使用这个命令:

clf.fit(np.float32(train_data), train_label)

或者

train_data = np.array([s[0].astype('float32') for s in train_data])

在以下链接的训练文件 (python) 中找到数据集 train_data 和 train_label:

https://www.dropbox.com/s/b3017gi18x6x325/train?dl=0

但是,我无法从数组“train_data”中获取对clf.fit函数有效的所有值有什么帮助吗?

塞拉鲁克

刚刚找到了克服此错误的解决方案。您需要缩放数据:

代码:

from sklearn.ensemble import RandomForestClassifier
import pickle
import numpy as np
from sklearn.preprocessing import scale

with open('train', 'rb') as f: 
    train_data, train_label = pickle.load(f)

#some diagnostic to see if there are NaNs. No NaN were found !
print(np.isnan(train_data))
print(np.where(np.isnan(train_data)))
print(np.nan_to_num(train_data))
print(np.isnan(train_label))
print(np.where(np.isnan(train_label)))

#so need to scale
train_data = scale(train_data)

clf = RandomForestClassifier()
clf.fit(train_data, train_label)

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

Scikit使用随机森林学习分类数据

来自分类Dev

scikit学习随机森林的输入

来自分类Dev

使用scikit随机森林sample_weights

来自分类Dev

scikit随机森林的使用sample_weights

来自分类Dev

Python scikit学习导入错误

来自分类Dev

Scikit学习-如何使用SVM和随机森林进行文本分类?

来自分类Dev

scikit-学习随机森林过多的内存使用情况

来自分类Dev

如何使用SciKit随机森林的oob_decision_function_学习曲线?

来自分类Dev

使用标准MAE而不是MSE的scikit学习中的随机森林回归慢约150倍

来自分类Dev

Scikit学习随机森林拟合方法中的值误差

来自分类Dev

在Python中使用Scikit学习管道与列表追加

来自分类Dev

在Python中使用scikit学习的多元回归模型

来自分类Dev

结合scikit学习中的随机森林模型

来自分类Dev

Python Scikit随机森林pred_proba输出四舍五入值

来自分类Dev

scikit-learn / python中带有字符的随机森林

来自分类Dev

使用scikit-learn消除随机森林上的递归特征

来自分类Dev

使用scikit-learn并行生成随机森林

来自分类Dev

导出Scikit Learn随机森林以在Hadoop平台上使用

来自分类Dev

使用scikit-learn消除随机森林上的递归特征

来自分类Dev

SciKit-Learn:使用随机森林时的 JoblibException

来自分类Dev

如何为随机森林分类器,Ada Boost分类器,Extra Trees分类器访问python scikit学习代码

来自分类Dev

Python中的Scikit学习更新

来自分类Dev

Python / Scikit学习/回归-从熊猫数据框到Scikit预测

来自分类Dev

使用scikit使用余弦距离学习KNeighborsClassifier

来自分类Dev

ValueError:scikit的随机森林分类学习

来自分类Dev

python:如何在scikit学习分类器(SVM)等中使用POS(词性)功能

来自分类Dev

python:如何在scikit学习分类器(SVM)等中使用POS(词性)功能

来自分类Dev

Python scikit-学习预测失败

来自分类Dev

维度问题线性回归Python scikit学习

Related 相关文章

  1. 1

    Scikit使用随机森林学习分类数据

  2. 2

    scikit学习随机森林的输入

  3. 3

    使用scikit随机森林sample_weights

  4. 4

    scikit随机森林的使用sample_weights

  5. 5

    Python scikit学习导入错误

  6. 6

    Scikit学习-如何使用SVM和随机森林进行文本分类?

  7. 7

    scikit-学习随机森林过多的内存使用情况

  8. 8

    如何使用SciKit随机森林的oob_decision_function_学习曲线?

  9. 9

    使用标准MAE而不是MSE的scikit学习中的随机森林回归慢约150倍

  10. 10

    Scikit学习随机森林拟合方法中的值误差

  11. 11

    在Python中使用Scikit学习管道与列表追加

  12. 12

    在Python中使用scikit学习的多元回归模型

  13. 13

    结合scikit学习中的随机森林模型

  14. 14

    Python Scikit随机森林pred_proba输出四舍五入值

  15. 15

    scikit-learn / python中带有字符的随机森林

  16. 16

    使用scikit-learn消除随机森林上的递归特征

  17. 17

    使用scikit-learn并行生成随机森林

  18. 18

    导出Scikit Learn随机森林以在Hadoop平台上使用

  19. 19

    使用scikit-learn消除随机森林上的递归特征

  20. 20

    SciKit-Learn:使用随机森林时的 JoblibException

  21. 21

    如何为随机森林分类器,Ada Boost分类器,Extra Trees分类器访问python scikit学习代码

  22. 22

    Python中的Scikit学习更新

  23. 23

    Python / Scikit学习/回归-从熊猫数据框到Scikit预测

  24. 24

    使用scikit使用余弦距离学习KNeighborsClassifier

  25. 25

    ValueError:scikit的随机森林分类学习

  26. 26

    python:如何在scikit学习分类器(SVM)等中使用POS(词性)功能

  27. 27

    python:如何在scikit学习分类器(SVM)等中使用POS(词性)功能

  28. 28

    Python scikit-学习预测失败

  29. 29

    维度问题线性回归Python scikit学习

热门标签

归档