随机森林预测模型

用户233531

我正在尝试为价格预测问题建立一个随机森林模型。我经历了以下步骤:

1)将数据拆分为3组train、test和valid(不仅需要拆分为train和test,还需要拆分为3组)

set.seed(1234)
assignment <- sample(1:3, size = nrow(train), prob = c(0.7, 0.15, 0.15), replace = TRUE) 
#Create a train, validation and tests from the train data
train_train <- train[assignment == 1, ]  
train_valid <- train[assignment == 2, ]  
train_test <- train[assignment == 3, ] 

2)我已经建立了模型,其中 x 和 y 来自训练集

fit_rf_train <- train(x = train_train[, -which(names(train_train) %in% 
c("Item_Identifier", "Item_Outlet_Sales"))], 
                y = train_train$Item_Outlet_Sales,
                method = "ranger",
                metric = "RMSE",
                tuneGrid = expand.grid(
                  .mtry = 6,
                  .splitrule = "variance",
                  .min.node.size = c(10,15,20)),
                trControl = trControl,
                importance = "permutation",
                num.trees = 350)

对于同一列车数据上的模型输出,我有以下屏幕截图:

训练数据的模型输出

3) 使用预测函数,我将模型与其他两个数据集一起使用,使用以下代码行进行验证和测试:

prediction_test <- predict(fit_rf_train, train_test)
prediction_valid <- predict(fit_rf_train, train_valid)

我的问题是如何衡量模型在未见数据(测试和有效)上的性能?

纳尔逊·贡

如果您想坚持使用caret,那么您可以执行以下操作:

library(caret)
trainda<-createDataPartition(iris$Sepal.Length,p=0.8,list=F)
valid_da<-iris[-trainda,]
trainda<-iris[trainda,]
ctrl<-trainControl(method="cv",number=5)
set.seed(233)
m<-train(Sepal.Length~.,data=trainda,method="rf",metric="RMSE",trControl = ctrl,verbose=F)
m1<-predict(m,valid_da)
RMSE(m1,valid_da$Sepal.Length)

结果:

[1] 0.3499783

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

随机森林模型中预测结果的差异

来自分类Dev

随机森林预测值

来自分类Dev

在scikit中最终期望相同的预期和预测数组学习随机森林模型

来自分类Dev

随机森林模型的Rcaret提取预测:错误:$运算符对于原子向量无效

来自分类Dev

是否可以将预测函数与 r 中的随机森林模型一起使用?

来自分类Dev

解释随机森林模型结果

来自分类Dev

随机森林包预测,newdata参数?

来自分类Dev

使用随机森林预测未来事件

来自分类Dev

随机森林包预测,newdata参数?

来自分类Dev

Tidymodels软件包:使用ggplot()可视化随机森林模型以显示最重要的预测变量

来自分类Dev

结合scikit学习中的随机森林模型

来自分类Dev

JAGS随机效应模型预测

来自分类Dev

PySpark和MLLib:随机森林预测的类概率

来自分类Dev

从随机森林分类器中提取树(预测变量)

来自分类Dev

获得R中连续变量的随机森林预测精度

来自分类Dev

随机森林文本分类在预测中提供额外的行

来自分类Dev

随机森林中预测值的特征重要性?

来自分类Dev

当我从“随机森林”得出的混淆矩阵显示该模型不能很好地预测疾病时,为什么我的ROC图和AUC值看起来不错?

来自分类Dev

R中线性模型的随机预测

来自分类Dev

嵌套随机效应的lmer模型的预测

来自分类Dev

将python随机森林模型保存到文件

来自分类Dev

在插入符号中拟合随机森林模型后使用partialPlot

来自分类Dev

互分随机森林模型的文本分类

来自分类Dev

您如何绘制随机森林模型的学习曲线?

来自分类Dev

如何根据随机森林模型创建精确的召回曲线?

来自分类Dev

Sklearn随机森林模型不会从数据帧中删除标题

来自分类Dev

OpenCV抛出错误。尝试使用随机森林模型

来自分类Dev

随机森林的模型和输入特征不匹配

来自分类Dev

随机森林分类-SciKit vs Weka具有100个特征的预测

Related 相关文章

  1. 1

    随机森林模型中预测结果的差异

  2. 2

    随机森林预测值

  3. 3

    在scikit中最终期望相同的预期和预测数组学习随机森林模型

  4. 4

    随机森林模型的Rcaret提取预测:错误:$运算符对于原子向量无效

  5. 5

    是否可以将预测函数与 r 中的随机森林模型一起使用?

  6. 6

    解释随机森林模型结果

  7. 7

    随机森林包预测,newdata参数?

  8. 8

    使用随机森林预测未来事件

  9. 9

    随机森林包预测,newdata参数?

  10. 10

    Tidymodels软件包:使用ggplot()可视化随机森林模型以显示最重要的预测变量

  11. 11

    结合scikit学习中的随机森林模型

  12. 12

    JAGS随机效应模型预测

  13. 13

    PySpark和MLLib:随机森林预测的类概率

  14. 14

    从随机森林分类器中提取树(预测变量)

  15. 15

    获得R中连续变量的随机森林预测精度

  16. 16

    随机森林文本分类在预测中提供额外的行

  17. 17

    随机森林中预测值的特征重要性?

  18. 18

    当我从“随机森林”得出的混淆矩阵显示该模型不能很好地预测疾病时,为什么我的ROC图和AUC值看起来不错?

  19. 19

    R中线性模型的随机预测

  20. 20

    嵌套随机效应的lmer模型的预测

  21. 21

    将python随机森林模型保存到文件

  22. 22

    在插入符号中拟合随机森林模型后使用partialPlot

  23. 23

    互分随机森林模型的文本分类

  24. 24

    您如何绘制随机森林模型的学习曲线?

  25. 25

    如何根据随机森林模型创建精确的召回曲线?

  26. 26

    Sklearn随机森林模型不会从数据帧中删除标题

  27. 27

    OpenCV抛出错误。尝试使用随机森林模型

  28. 28

    随机森林的模型和输入特征不匹配

  29. 29

    随机森林分类-SciKit vs Weka具有100个特征的预测

热门标签

归档