我将数据集撒入训练和测试中,如下所示:
splitdata<-split(sb[1:nrow(sb),], sample(rep(1:2, as.integer(nrow(sb)/2))))
test<-splitdata[[1]]
train<-rbind(splitdata[[2]])
sb是原始数据集的名称,因此它是50/50训练和测试。
然后,我使用培训套件安装了一个套料。
fitglm<- glm(num_claims~year+vt+va+public+pri_bil+persist+penalty_pts+num_veh+num_drivers+married+gender+driver_age+credit+col_ded+car_den, family=poisson, train)
现在,我要预测使用此glm,接下来的10个观察值。
我很难在预报()中指定newdata,
我试过了:
pred<-predict(fitglm,newdata=data.frame(train),type="response", se.fit=T)
这将提供与训练集中的样本数量相等的预测数量。
最后,如何以置信区间绘制这些预测?
感谢您的帮助
如果您要问如何在测试集中的下10个上构建预测,则:
pred10<-predict(fitglm,newdata=data.frame(test)[1:10, ], type="response", se.fit=T)
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句