我正在对语言数据进行回归分析,希望预测句子的数字情感值。我的数据是120x531。我正在使用所谓的词袋方法,因此我的数据相对稀疏。
我想从一个简单的线性回归模型开始,所以我的代码本质上是这样的:
ctrl = trainControl(method="cv", number=10)
model.valence.lm = train(data[,5:531], data[,2], model = "lm", trControl = ctrl)
model.valence.lm
但是,插入符号似乎混淆了线性模型和随机森林,因此我得到以下输出(特别是第一行):
Random Forest
120 samples
527 predictors
No pre-processing
Resampling: Cross-Validated (10 fold)
Summary of sample sizes: 108, 108, 108, 108, 108, 108, ...
Resampling results across tuning parameters:
mtry RMSE Rsquared RMSE SD Rsquared SD
2 2.594079 0.2786009 0.1236510 0.1612251
32 2.459950 0.1920956 0.1886138 0.1484976
526 2.639718 0.1028518 0.2459268 0.1067835
RMSE was used to select the optimal model using the smallest value.
The final value used for the model was mtry = 32.
令我感到困惑的是,我基本上是从以前的项目(在此工作的地方)复制并粘贴了此代码。有谁知道为什么会这样吗?我检查了我的数据对象,显然我使用的功能是整数(不是数字/浮点数)。这可能是一个解释吗?
参数的默认参数是“随机森林”或“ rf” method
。您已经设置了model
参数,脱字符号已被接受而没有受到任何投诉,但是被忽略了。使用method="lm"
。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句