搜索

搜索

在scikit中最终期望相同的预期和预测数组学习随机森林模型

user308827 发表于 Dev

19

用户名

data = df_train.as_matrix(columns=train_vars)  # All columns aside from 'output'
target = df_train.as_matrix(columns=['output']).ravel()

# Get training and testing splits
splits = cross_validation.train_test_split(data, target, test_size=0.2)
data_train, data_test, target_train, target_test = splits

# Fit the training data to the model
model = RandomForestRegressor(100)
model.fit(data_train, target_train)

# Make predictions
expected = target_test
predicted = model.predict(data_test)

当我运行此代码来预测变量“输出”作为该文件中所有其他变量的函数时：https : //www.dropbox.com/s/cgyh09q2liew85z/uuu.csv?dl=0

预期和预测的数组完全相同。好像我过度拟合或做错了什么。如何解决？

风神

质疑结果太好了！

数据中的每个要素（列）仅包含少量不同的值。如果我计算正确，那么只有14个唯一不同的行。

这有两个含义：

您很可能过度拟合，因为您只有14个有效样本，但有36个特征。
同一行很可能再次出现在测试集中和训练集中。这意味着您正在测试与训练模型相同的数据。由于模型完全适合该数据，因此您可以获得理想的结果。

编辑

我只是意识到我还没有回答实际的问题-如何解决？

那要看。

如果幸运的话，有人在准备数据时出错。

如果数据正确，事情将会变得更加困难。首先，通过执行操作来消除重复的行np.vstack({tuple(row) for row in data})（请参阅此处）。然后尝试是否可以做一些有意义的工作。但是老实说，我相信14个样本对于进行机器学习来说有点低。尝试获取更多数据:)

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-02-25

0

我来说两句

0条评论

登录后参与评论

上一篇：数组上怪异的PHP魔术获取器

相关文章

来自分类Dev

结合scikit学习中的随机森林模型

来自分类Dev

随机森林预测模型

来自分类Dev

scikit学习随机森林的输入

来自分类Dev

随机森林模型中预测结果的差异

来自分类Dev

scikit中的弱学习者学习随机森林和多余的树分类器

来自分类Dev

Scikit学习-如何使用SVM和随机森林进行文本分类？

来自分类Dev

如何在随机森林中获得相同的预测（概率和分类）

来自分类常见问题

scikit学习模型的预测是线程安全的吗？

来自分类Dev

ValueError：scikit的随机森林分类学习

来自分类Dev

Scikit使用随机森林学习分类数据

来自分类Dev

Scikit学习随机森林拟合方法中的值误差

来自分类Dev

Python - 使用 scikit 学习随机森林关于值格式的错误

来自分类Dev

随机森林预测值

来自分类Dev

您如何绘制随机森林模型的学习曲线？

来自分类Dev

PySpark和MLLib：随机森林预测的类概率

来自分类Dev

随机森林分类-SciKit vs Weka具有100个特征的预测

来自分类Dev

如何在Python scikit-learn中从随机森林中的每棵树输出回归预测？

来自分类Dev

随机森林的模型和输入特征不匹配

来自分类Dev

scikit-学习随机森林过多的内存使用情况

来自分类Dev

如何使用SciKit随机森林的oob_decision_function_学习曲线？

来自分类Dev

使用标准MAE而不是MSE的scikit学习中的随机森林回归慢约150倍

来自分类Dev

当我从“随机森林”得出的混淆矩阵显示该模型不能很好地预测疾病时，为什么我的ROC图和AUC值看起来不错？

来自分类Dev

随机森林在训练和测试中获得98％的准确性，但在其他情况下总是预测相同的等级

来自分类Dev

随机森林模型的Rcaret提取预测：错误：$运算符对于原子向量无效

来自分类Dev

是否可以将预测函数与 r 中的随机森林模型一起使用？

来自分类Dev

OnevsrestClassifier和随机森林

来自分类Dev

OnevsrestClassifier和随机森林

来自分类Dev

解释随机森林模型结果

来自分类Dev

在随机森林模型（Python，scikit-learn）中访问单个树的底层（tree_）对象

Related 相关文章

文章

热门标签

归档