搜索

搜索

Python - 使用 scikit 学习随机森林关于值格式的错误

debugcn 发表于 Dev

10

R用户

当我执行命令时：

clf.fit(train_data, train_label)

我收到以下错误

ValueError: 输入包含 NaN、无穷大或对于 dtype('float32') 来说太大的值。

问题是train_data大小为 (18000,20)的数组。我试过使用这个命令：

clf.fit(np.float32(train_data), train_label)

或者

train_data = np.array([s[0].astype('float32') for s in train_data])

在以下链接的训练文件 (python) 中找到数据集 train_data 和 train_label：

https://www.dropbox.com/s/b3017gi18x6x325/train?dl=0

但是，我无法从数组“train_data”中获取对clf.fit函数有效的所有值。有什么帮助吗？

塞拉鲁克

刚刚找到了克服此错误的解决方案。您需要缩放数据：

代码：

from sklearn.ensemble import RandomForestClassifier
import pickle
import numpy as np
from sklearn.preprocessing import scale

with open('train', 'rb') as f: 
    train_data, train_label = pickle.load(f)

#some diagnostic to see if there are NaNs. No NaN were found !
print(np.isnan(train_data))
print(np.where(np.isnan(train_data)))
print(np.nan_to_num(train_data))
print(np.isnan(train_label))
print(np.where(np.isnan(train_label)))

#so need to scale
train_data = scale(train_data)

clf = RandomForestClassifier()
clf.fit(train_data, train_label)

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-07-13

0

我来说两句

0条评论

登录后参与评论

相关文章

来自分类Dev

Scikit使用随机森林学习分类数据

来自分类Dev

scikit学习随机森林的输入

来自分类Dev

使用scikit随机森林sample_weights

来自分类Dev

scikit随机森林的使用sample_weights

来自分类Dev

Python scikit学习导入错误

来自分类Dev

Scikit学习-如何使用SVM和随机森林进行文本分类？

来自分类Dev

scikit-学习随机森林过多的内存使用情况

来自分类Dev

如何使用SciKit随机森林的oob_decision_function_学习曲线？

来自分类Dev

使用标准MAE而不是MSE的scikit学习中的随机森林回归慢约150倍

来自分类Dev

Scikit学习随机森林拟合方法中的值误差

来自分类Dev

在Python中使用Scikit学习管道与列表追加

来自分类Dev

在Python中使用scikit学习的多元回归模型

来自分类Dev

结合scikit学习中的随机森林模型

来自分类Dev

Python Scikit随机森林pred_proba输出四舍五入值

来自分类Dev

scikit-learn / python中带有字符的随机森林

来自分类Dev

使用scikit-learn消除随机森林上的递归特征

来自分类Dev

使用scikit-learn并行生成随机森林

来自分类Dev

导出Scikit Learn随机森林以在Hadoop平台上使用

来自分类Dev

使用scikit-learn消除随机森林上的递归特征

来自分类Dev

SciKit-Learn：使用随机森林时的 JoblibException

来自分类Dev

如何为随机森林分类器，Ada Boost分类器，Extra Trees分类器访问python scikit学习代码

来自分类Dev

Python中的Scikit学习更新

来自分类Dev

Python / Scikit学习/回归-从熊猫数据框到Scikit预测

来自分类Dev

使用scikit使用余弦距离学习KNeighborsClassifier

来自分类Dev

ValueError：scikit的随机森林分类学习

来自分类Dev

python：如何在scikit学习分类器（SVM）等中使用POS（词性）功能

来自分类Dev

python：如何在scikit学习分类器（SVM）等中使用POS（词性）功能

来自分类Dev

Python scikit-学习预测失败

来自分类Dev

维度问题线性回归Python scikit学习

Related 相关文章

文章

热门标签

归档