在scikit中最终期望相同的预期和预测数组学习随机森林模型

用户名
data = df_train.as_matrix(columns=train_vars)  # All columns aside from 'output'
target = df_train.as_matrix(columns=['output']).ravel()

# Get training and testing splits
splits = cross_validation.train_test_split(data, target, test_size=0.2)
data_train, data_test, target_train, target_test = splits

# Fit the training data to the model
model = RandomForestRegressor(100)
model.fit(data_train, target_train)

# Make predictions
expected = target_test
predicted = model.predict(data_test)

当我运行此代码来预测变量“输出”作为该文件中所有其他变量的函数时:https : //www.dropbox.com/s/cgyh09q2liew85z/uuu.csv?dl=0

预期和预测的数组完全相同。好像我过度拟合或做错了什么。如何解决?

风神

质疑结果太好了!

数据中的每个要素(列)仅包含少量不同的值。如果我计算正确,那么只有14个唯一不同的行

这有两个含义:

  1. 您很可能过度拟合,因为您只有14个有效样本,但有36个特征。

  2. 同一行可能再次出现在测试集中和训练集中。这意味着您正在测试与训练模型相同的数据。由于模型完全适合该数据,因此您可以获得理想的结果。

编辑

我只是意识到我还没有回答实际的问题-如何解决?

那要看。

如果幸运的话,有人在准备数据时出错。

如果数据正确,事情将会变得更加困难。首先,通过执行操作来消除重复的行np.vstack({tuple(row) for row in data})(请参阅此处)。然后尝试是否可以做一些有意义的工作。但是老实说,我相信14个样本对于进行机器学习来说有点低。尝试获取更多数据:)

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

结合scikit学习中的随机森林模型

来自分类Dev

随机森林预测模型

来自分类Dev

scikit学习随机森林的输入

来自分类Dev

随机森林模型中预测结果的差异

来自分类Dev

scikit中的弱学习者学习随机森林和多余的树分类器

来自分类Dev

Scikit学习-如何使用SVM和随机森林进行文本分类?

来自分类Dev

如何在随机森林中获得相同的预测(概率和分类)

来自分类常见问题

scikit学习模型的预测是线程安全的吗?

来自分类Dev

ValueError:scikit的随机森林分类学习

来自分类Dev

Scikit使用随机森林学习分类数据

来自分类Dev

Scikit学习随机森林拟合方法中的值误差

来自分类Dev

Python - 使用 scikit 学习随机森林关于值格式的错误

来自分类Dev

随机森林预测值

来自分类Dev

您如何绘制随机森林模型的学习曲线?

来自分类Dev

PySpark和MLLib:随机森林预测的类概率

来自分类Dev

随机森林分类-SciKit vs Weka具有100个特征的预测

来自分类Dev

如何在Python scikit-learn中从随机森林中的每棵树输出回归预测?

来自分类Dev

随机森林的模型和输入特征不匹配

来自分类Dev

scikit-学习随机森林过多的内存使用情况

来自分类Dev

如何使用SciKit随机森林的oob_decision_function_学习曲线?

来自分类Dev

使用标准MAE而不是MSE的scikit学习中的随机森林回归慢约150倍

来自分类Dev

当我从“随机森林”得出的混淆矩阵显示该模型不能很好地预测疾病时,为什么我的ROC图和AUC值看起来不错?

来自分类Dev

随机森林在训练和测试中获得98%的准确性,但在其他情况下总是预测相同的等级

来自分类Dev

随机森林模型的Rcaret提取预测:错误:$运算符对于原子向量无效

来自分类Dev

是否可以将预测函数与 r 中的随机森林模型一起使用?

来自分类Dev

OnevsrestClassifier和随机森林

来自分类Dev

OnevsrestClassifier和随机森林

来自分类Dev

解释随机森林模型结果

来自分类Dev

在随机森林模型(Python,scikit-learn)中访问单个树的底层(tree_)对象

Related 相关文章

  1. 1

    结合scikit学习中的随机森林模型

  2. 2

    随机森林预测模型

  3. 3

    scikit学习随机森林的输入

  4. 4

    随机森林模型中预测结果的差异

  5. 5

    scikit中的弱学习者学习随机森林和多余的树分类器

  6. 6

    Scikit学习-如何使用SVM和随机森林进行文本分类?

  7. 7

    如何在随机森林中获得相同的预测(概率和分类)

  8. 8

    scikit学习模型的预测是线程安全的吗?

  9. 9

    ValueError:scikit的随机森林分类学习

  10. 10

    Scikit使用随机森林学习分类数据

  11. 11

    Scikit学习随机森林拟合方法中的值误差

  12. 12

    Python - 使用 scikit 学习随机森林关于值格式的错误

  13. 13

    随机森林预测值

  14. 14

    您如何绘制随机森林模型的学习曲线?

  15. 15

    PySpark和MLLib:随机森林预测的类概率

  16. 16

    随机森林分类-SciKit vs Weka具有100个特征的预测

  17. 17

    如何在Python scikit-learn中从随机森林中的每棵树输出回归预测?

  18. 18

    随机森林的模型和输入特征不匹配

  19. 19

    scikit-学习随机森林过多的内存使用情况

  20. 20

    如何使用SciKit随机森林的oob_decision_function_学习曲线?

  21. 21

    使用标准MAE而不是MSE的scikit学习中的随机森林回归慢约150倍

  22. 22

    当我从“随机森林”得出的混淆矩阵显示该模型不能很好地预测疾病时,为什么我的ROC图和AUC值看起来不错?

  23. 23

    随机森林在训练和测试中获得98%的准确性,但在其他情况下总是预测相同的等级

  24. 24

    随机森林模型的Rcaret提取预测:错误:$运算符对于原子向量无效

  25. 25

    是否可以将预测函数与 r 中的随机森林模型一起使用?

  26. 26

    OnevsrestClassifier和随机森林

  27. 27

    OnevsrestClassifier和随机森林

  28. 28

    解释随机森林模型结果

  29. 29

    在随机森林模型(Python,scikit-learn)中访问单个树的底层(tree_)对象

热门标签

归档