如何针对R中的决策树模型测试数据？

bernie2436 发表于 Dev

伯尼2436

我使用R中的rpart包从训练数据中构建了一个决策树。现在我有更多数据，我想对照该树进行检查以检查模型。从逻辑上/迭代上，我想执行以下操作：

for each datapoint in new data
     run point thru decision tree, branching as appropriate
     examine how tree classifies the data point
     determine if the datapoint is a true positive or false positive

我如何在R中做到这一点？

帕斯卡

为了能够使用此功能，我假设您将训练集分为子训练集和测试集。

要创建训练模型，您可以使用：

model <- rpart(y~., traindata, minbucket=5)   # I suspect you did it so far.

要将其应用于测试集：

pred <- predict(model, testdata)

然后，您将获得预测结果的向量。

在训练测试数据集中，您还将获得“真实”答案。假设训练集中的最后一列。

只需将它们相等即可得出结果：

pred == testdata[ , last]  # where 'last' equals the index of 'y'

当元素相等时，您将获得TRUE，而当您获得FALSE时，则意味着您的预测是错误的。

pred + testdata[, last] > 1 # gives TRUE positive, as it means both vectors are 1
pred == testdata[, last]    # gives those that are correct

看看您有多少正确率可能会很有趣：

mean(pred == testdata[ , last])    # here TRUE will count as a 1, and FALSE as 0

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-02-4

我来说两句

0条评论

登录后参与评论

来自分类Dev

如何在R中为决策树模型创建收益图？

来自分类Dev

决策树中R数据挖掘的空结果

来自分类Dev

如何获取R中的rpart（CART）决策树的属性？

来自分类Dev

如何重塑决策树的数据？

来自分类Dev

无法在R中创建决策树

来自分类Dev

如何在R中运行c5.0决策树和基于规则的模型时提取错误率？

来自分类Dev

Tidymodel包：R中的常规线性模型（glm）和决策树（袋装树，增强树和随机森林）模型

来自分类Dev

如何为决策树模型创建混淆矩阵

来自分类Dev

如何在ignite中保存决策树训练模型？

来自分类Dev

如何可视化Spark（pyspark）中的决策树模型？

来自分类Dev

如何存储决策树

来自分类Dev

如何将数据集的示例加载到不同的数组中以进行决策树分类？

来自分类Dev

决策树学习算法中的重复训练数据

来自分类Dev

在数据库中应用决策树

来自分类Dev

决策树学习算法中的重复训练数据

来自分类Dev

R中决策树中rpart的标记问题

来自分类Dev

如何在R中的决策树中指定分支数

来自分类Dev

scikit学习决策树模型评估

来自分类Dev

SPARK：如何为LabeledPoint中的决策树创建categoricalFeaturesInfo？

来自分类Dev

用于决策树的spark数据分区

来自分类Dev

用于决策树的spark数据分区

来自分类Dev

决策树 sklearn : PlayTennis 数据集

来自分类Dev

用R绘制决策树

来自分类Dev

重复的行如何影响决策树？

来自分类Dev

在决策树中解释数字

来自分类Dev

CART决策树中的拆分冲突

来自分类Dev

sklearn中的交叉验证+决策树

来自分类Dev

Python中的基本决策树

来自分类Dev

Python中的基本决策树内容

Related 相关文章

文章