R's Caret软件包混淆了线性模型（lm）和随机森林

debugcn 发表于 Dev

布歇尔

我正在对语言数据进行回归分析，希望预测句子的数字情感值。我的数据是120x531。我正在使用所谓的词袋方法，因此我的数据相对稀疏。

我想从一个简单的线性回归模型开始，所以我的代码本质上是这样的：

ctrl = trainControl(method="cv", number=10)
model.valence.lm = train(data[,5:531], data[,2], model = "lm", trControl = ctrl)
model.valence.lm

但是，插入符号似乎混淆了线性模型和随机森林，因此我得到以下输出（特别是第一行）：

Random Forest 

120 samples
527 predictors

No pre-processing
Resampling: Cross-Validated (10 fold) 
Summary of sample sizes: 108, 108, 108, 108, 108, 108, ... 
Resampling results across tuning parameters:

  mtry  RMSE      Rsquared   RMSE SD    Rsquared SD
    2   2.594079  0.2786009  0.1236510  0.1612251  
   32   2.459950  0.1920956  0.1886138  0.1484976  
  526   2.639718  0.1028518  0.2459268  0.1067835  

RMSE was used to select the optimal model using  the smallest value.
The final value used for the model was mtry = 32.

令我感到困惑的是，我基本上是从以前的项目（在此工作的地方）复制并粘贴了此代码。有谁知道为什么会这样吗？我检查了我的数据对象，显然我使用的功能是整数（不是数字/浮点数）。这可能是一个解释吗？

迈尔斯·麦贝恩

参数的默认参数是“随机森林”或“ rf” method。您已经设置了model参数，脱字符号已被接受而没有受到任何投诉，但是被忽略了。使用method="lm"。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。