随机森林模型中预测结果的差异

mql4beginner

我建立了一个随机森林模型,当我编写两行不同的代码以生成预测时,我得到了两个不同的预测结果。我不知道哪一个是正确的。这是我的示例数据框和usedcode:

dat <- read.table(text = " cats birds    wolfs     snakes
      0        3        9         7
      1        3        8         4
      1        1        2         8
      0        1        2         3
      0        1        8         3
      1        6        1         2
      0        6        7         1
      1        6        1         5
      0        5        9         7
      1        3        8         7
      1        4        2         7
      0        1        2         3
      0        7        6         3
      1        6        1         1
      0        6        3         9
      1        6        1         1   ",header = TRUE)

我建立了一个随机森林模型:

model<-randomForest(snakes~cats+birds+wolfs,data=dat,ntree=20)
RF_pred<- data.frame(predict(model))
train<-cbind(train,RF_pred) # this gave me a predictive results named: "predict.model."

出于好奇,我尝试了以下代码使用另一种语法:

dat$RF_pred<-predict(model,newdata=dat,type='response') # this gave me a predictive results named: "RF_pred"

令我惊讶的是,我得到了其他预测结果:

 dat
   cats birds wolfs snakes predict.model.  RF_pred
1     0     3     9      7       3.513889 5.400675
2     1     3     8      4       5.570000 5.295417
3     1     1     2      8       3.928571 5.092917
4     0     1     2      3       4.925893 4.208452
5     0     1     8      3       4.583333 4.014008
6     1     6     1      2       3.766667 2.943750
7     0     6     7      1       5.486806 4.061508
8     1     6     1      5       3.098148 2.943750
9     0     5     9      7       4.575397 5.675675
10    1     3     8      7       4.729167 5.295417
11    1     4     2      7       4.416667 5.567917
12    0     1     2      3       4.222619 4.208452
13    0     7     6      3       6.125714 4.036508
14    1     6     1      1       3.695833 2.943750
15    0     6     3      9       4.115079 5.178175
16    1     6     1      1       3.595238 2.943750

为什么会有差异。两者之间?哪一个是正确的?有任何想法吗?

洪大井

区别在于预测的两个调用:

predict(model)

predict(model, newdata=dat)

第一种选择是从随机森林中获得关于您的训练数据的即时预测。将预测值与实际值进行比较时,通常这就是您想要的。

第二个方法将您的训练数据视为新数据集,然后将观察结果沿每棵树运行。这将导致预测值与实际值之间人为地密切相关,因为RF算法通常不会修剪单个树,而是依靠树的集合来控制过度拟合。因此,如果您想获得训练数据的预测,请不要执行此操作。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

从随机森林分类器中提取树(预测变量)

来自分类Dev

结合scikit学习中的随机森林模型

来自分类Dev

随机森林包预测,newdata参数?

来自分类Dev

Python中的随机森林

来自分类Dev

PySpark和MLLib:随机森林预测的类概率

来自分类Dev

获得R中连续变量的随机森林预测精度

来自分类Dev

在插入符号中拟合随机森林模型后使用partialPlot

来自分类Dev

在scikit中最终期望相同的预期和预测数组学习随机森林模型

来自分类Dev

JAGS随机效应模型预测

来自分类Dev

将随机森林预测作为列添加到测试文件中

来自分类Dev

如何在Python scikit-learn中从随机森林中的每棵树输出回归预测?

来自分类Dev

解释随机森林模型结果

来自分类Dev

神经网络与随机森林性能差异

来自分类Dev

使用随机森林预测未来事件

来自分类Dev

为什么结果与Keras模型中的调用和预测不同?似乎预测忽略任何随机产生的值

来自分类Dev

随机森林模型的Rcaret提取预测:错误:$运算符对于原子向量无效

来自分类Dev

统计模型中预测值与拟合值之间的差异

来自分类Dev

保存的随机森林模型在同一数据集上产生不同的结果

来自分类Dev

Sklearn随机森林模型不会从数据帧中删除标题

来自分类Dev

如何在“随机森林分类器”中获取“ predict”预测的类的“ predict_proba”?

来自分类Dev

Tidymodels软件包:使用ggplot()可视化随机森林模型以显示最重要的预测变量

来自分类Dev

随机森林预测值

来自分类Dev

随机森林包预测,newdata参数?

来自分类Dev

用R中的模型预测结果

来自分类Dev

Python中的随机森林

来自分类Dev

是否可以将预测函数与 r 中的随机森林模型一起使用?

来自分类Dev

随机森林文本分类在预测中提供额外的行

来自分类Dev

随机森林中预测值的特征重要性?

来自分类Dev

随机森林预测模型

Related 相关文章

  1. 1

    从随机森林分类器中提取树(预测变量)

  2. 2

    结合scikit学习中的随机森林模型

  3. 3

    随机森林包预测,newdata参数?

  4. 4

    Python中的随机森林

  5. 5

    PySpark和MLLib:随机森林预测的类概率

  6. 6

    获得R中连续变量的随机森林预测精度

  7. 7

    在插入符号中拟合随机森林模型后使用partialPlot

  8. 8

    在scikit中最终期望相同的预期和预测数组学习随机森林模型

  9. 9

    JAGS随机效应模型预测

  10. 10

    将随机森林预测作为列添加到测试文件中

  11. 11

    如何在Python scikit-learn中从随机森林中的每棵树输出回归预测?

  12. 12

    解释随机森林模型结果

  13. 13

    神经网络与随机森林性能差异

  14. 14

    使用随机森林预测未来事件

  15. 15

    为什么结果与Keras模型中的调用和预测不同?似乎预测忽略任何随机产生的值

  16. 16

    随机森林模型的Rcaret提取预测:错误:$运算符对于原子向量无效

  17. 17

    统计模型中预测值与拟合值之间的差异

  18. 18

    保存的随机森林模型在同一数据集上产生不同的结果

  19. 19

    Sklearn随机森林模型不会从数据帧中删除标题

  20. 20

    如何在“随机森林分类器”中获取“ predict”预测的类的“ predict_proba”?

  21. 21

    Tidymodels软件包:使用ggplot()可视化随机森林模型以显示最重要的预测变量

  22. 22

    随机森林预测值

  23. 23

    随机森林包预测,newdata参数?

  24. 24

    用R中的模型预测结果

  25. 25

    Python中的随机森林

  26. 26

    是否可以将预测函数与 r 中的随机森林模型一起使用?

  27. 27

    随机森林文本分类在预测中提供额外的行

  28. 28

    随机森林中预测值的特征重要性?

  29. 29

    随机森林预测模型

热门标签

归档