随机森林模型中预测结果的差异

mql4beginner

我建立了一个随机森林模型,当我编写两行不同的代码以生成预测时,我得到了两个不同的预测结果。我不知道哪一个是正确的。这是我的示例数据框和usedcode:

dat <- read.table(text = " cats birds    wolfs     snakes
      0        3        9         7
      1        3        8         4
      1        1        2         8
      0        1        2         3
      0        1        8         3
      1        6        1         2
      0        6        7         1
      1        6        1         5
      0        5        9         7
      1        3        8         7
      1        4        2         7
      0        1        2         3
      0        7        6         3
      1        6        1         1
      0        6        3         9
      1        6        1         1   ",header = TRUE)

我建立了一个随机森林模型:

model<-randomForest(snakes~cats+birds+wolfs,data=dat,ntree=20)
RF_pred<- data.frame(predict(model))
train<-cbind(train,RF_pred) # this gave me a predictive results named: "predict.model."

出于好奇,我尝试了以下代码使用另一种语法:

dat$RF_pred<-predict(model,newdata=dat,type='response') # this gave me a predictive results named: "RF_pred"

令我惊讶的是,我得到了其他预测结果:

 dat
   cats birds wolfs snakes predict.model.  RF_pred
1     0     3     9      7       3.513889 5.400675
2     1     3     8      4       5.570000 5.295417
3     1     1     2      8       3.928571 5.092917
4     0     1     2      3       4.925893 4.208452
5     0     1     8      3       4.583333 4.014008
6     1     6     1      2       3.766667 2.943750
7     0     6     7      1       5.486806 4.061508
8     1     6     1      5       3.098148 2.943750
9     0     5     9      7       4.575397 5.675675
10    1     3     8      7       4.729167 5.295417
11    1     4     2      7       4.416667 5.567917
12    0     1     2      3       4.222619 4.208452
13    0     7     6      3       6.125714 4.036508
14    1     6     1      1       3.695833 2.943750
15    0     6     3      9       4.115079 5.178175
16    1     6     1      1       3.595238 2.943750

为什么会有差异。两者之间?哪一个是正确的?有任何想法吗?

洪大井

区别在于预测的两个调用:

predict(model)

predict(model, newdata=dat)

第一种选择是从随机森林中获得关于您的训练数据的即时预测。将预测值与实际值进行比较时,通常这就是您想要的。

第二个方法将您的训练数据视为新数据集,然后将观察结果沿每棵树运行。这将导致预测值与实际值之间人为地密切相关,因为RF算法通常不会修剪单个树,而是依靠树的集合来控制过度拟合。因此,如果您想获得训练数据的预测,请不要执行此操作。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

随机森林预测模型

来自分类Dev

解释随机森林模型结果

来自分类Dev

是否可以将预测函数与 r 中的随机森林模型一起使用?

来自分类Dev

随机森林预测值

来自分类Dev

结合scikit学习中的随机森林模型

来自分类Dev

获得R中连续变量的随机森林预测精度

来自分类Dev

为什么结果与Keras模型中的调用和预测不同?似乎预测忽略任何随机产生的值

来自分类Dev

在scikit中最终期望相同的预期和预测数组学习随机森林模型

来自分类Dev

随机森林模型的Rcaret提取预测:错误:$运算符对于原子向量无效

来自分类Dev

在插入符号中拟合随机森林模型后使用partialPlot

来自分类Dev

Sklearn随机森林模型不会从数据帧中删除标题

来自分类Dev

随机森林包预测,newdata参数?

来自分类Dev

使用随机森林预测未来事件

来自分类Dev

随机森林包预测,newdata参数?

来自分类Dev

用R中的模型预测结果

来自分类Dev

Python中的随机森林

来自分类Dev

Python中的随机森林

来自分类Dev

神经网络与随机森林性能差异

来自分类Dev

将随机森林预测作为列添加到测试文件中

来自分类Dev

如何在Python scikit-learn中从随机森林中的每棵树输出回归预测?

来自分类Dev

如何在“随机森林分类器”中获取“ predict”预测的类的“ predict_proba”?

来自分类Dev

保存的随机森林模型在同一数据集上产生不同的结果

来自分类Dev

Tidymodels软件包:使用ggplot()可视化随机森林模型以显示最重要的预测变量

来自分类Dev

统计模型中预测值与拟合值之间的差异

来自分类Dev

JAGS随机效应模型预测

来自分类Dev

PySpark和MLLib:随机森林预测的类概率

来自分类Dev

从随机森林分类器中提取树(预测变量)

来自分类Dev

随机森林文本分类在预测中提供额外的行

来自分类Dev

随机森林中预测值的特征重要性?

Related 相关文章

  1. 1

    随机森林预测模型

  2. 2

    解释随机森林模型结果

  3. 3

    是否可以将预测函数与 r 中的随机森林模型一起使用?

  4. 4

    随机森林预测值

  5. 5

    结合scikit学习中的随机森林模型

  6. 6

    获得R中连续变量的随机森林预测精度

  7. 7

    为什么结果与Keras模型中的调用和预测不同?似乎预测忽略任何随机产生的值

  8. 8

    在scikit中最终期望相同的预期和预测数组学习随机森林模型

  9. 9

    随机森林模型的Rcaret提取预测:错误:$运算符对于原子向量无效

  10. 10

    在插入符号中拟合随机森林模型后使用partialPlot

  11. 11

    Sklearn随机森林模型不会从数据帧中删除标题

  12. 12

    随机森林包预测,newdata参数?

  13. 13

    使用随机森林预测未来事件

  14. 14

    随机森林包预测,newdata参数?

  15. 15

    用R中的模型预测结果

  16. 16

    Python中的随机森林

  17. 17

    Python中的随机森林

  18. 18

    神经网络与随机森林性能差异

  19. 19

    将随机森林预测作为列添加到测试文件中

  20. 20

    如何在Python scikit-learn中从随机森林中的每棵树输出回归预测?

  21. 21

    如何在“随机森林分类器”中获取“ predict”预测的类的“ predict_proba”?

  22. 22

    保存的随机森林模型在同一数据集上产生不同的结果

  23. 23

    Tidymodels软件包:使用ggplot()可视化随机森林模型以显示最重要的预测变量

  24. 24

    统计模型中预测值与拟合值之间的差异

  25. 25

    JAGS随机效应模型预测

  26. 26

    PySpark和MLLib:随机森林预测的类概率

  27. 27

    从随机森林分类器中提取树(预测变量)

  28. 28

    随机森林文本分类在预测中提供额外的行

  29. 29

    随机森林中预测值的特征重要性?

热门标签

归档