如何针对R中的决策树模型测试数据?

伯尼2436

我使用R中的rpart包从训练数据中构建了一个决策树。现在我有更多数据,我想对照该树进行检查以检查模型。从逻辑上/迭代上,我想执行以下操作:

for each datapoint in new data
     run point thru decision tree, branching as appropriate
     examine how tree classifies the data point
     determine if the datapoint is a true positive or false positive

我如何在R中做到这一点?

帕斯卡

为了能够使用此功能,我假设您将训练集分为子训练集和测试集。

要创建训练模型,您可以使用:

model <- rpart(y~., traindata, minbucket=5)   # I suspect you did it so far.

要将其应用于测试集:

pred <- predict(model, testdata) 

然后,您将获得预测结果的向量。

在训练测试数据集中,您还将获得“真实”答案。假设训练集中的最后一列。

只需将它们相等即可得出结果:

pred == testdata[ , last]  # where 'last' equals the index of 'y'

当元素相等时,您将获得TRUE,而当您获得FALSE时,则意味着您的预测是错误的。

pred + testdata[, last] > 1 # gives TRUE positive, as it means both vectors are 1
pred == testdata[, last]    # gives those that are correct

看看您有多少正确率可能会很有趣:

mean(pred == testdata[ , last])    # here TRUE will count as a 1, and FALSE as 0

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何在R中为决策树模型创建收益图?

来自分类Dev

决策树中R数据挖掘的空结果

来自分类Dev

如何获取R中的rpart(CART)决策树的属性?

来自分类Dev

如何重塑决策树的数据?

来自分类Dev

无法在R中创建决策树

来自分类Dev

如何在R中运行c5.0决策树和基于规则的模型时提取错误率?

来自分类Dev

Tidymodel包:R中的常规线性模型(glm)和决策树(袋装树,增强树和随机森林)模型

来自分类Dev

如何为决策树模型创建混淆矩阵

来自分类Dev

如何在ignite中保存决策树训练模型?

来自分类Dev

如何可视化Spark(pyspark)中的决策树模型?

来自分类Dev

如何存储决策树

来自分类Dev

如何将数据集的示例加载到不同的数组中以进行决策树分类?

来自分类Dev

决策树学习算法中的重复训练数据

来自分类Dev

在数据库中应用决策树

来自分类Dev

决策树学习算法中的重复训练数据

来自分类Dev

R中决策树中rpart的标记问题

来自分类Dev

如何在R中的决策树中指定分支数

来自分类Dev

scikit学习决策树模型评估

来自分类Dev

SPARK:如何为LabeledPoint中的决策树创建categoricalFeaturesInfo?

来自分类Dev

用于决策树的spark数据分区

来自分类Dev

用于决策树的spark数据分区

来自分类Dev

决策树 sklearn : PlayTennis 数据集

来自分类Dev

用R绘制决策树

来自分类Dev

重复的行如何影响决策树?

来自分类Dev

在决策树中解释数字

来自分类Dev

CART决策树中的拆分冲突

来自分类Dev

sklearn中的交叉验证+决策树

来自分类Dev

Python中的基本决策树

来自分类Dev

Python中的基本决策树内容