我在R中遇到了3类ROC分析的问题,并获得了非常烦人的结果(请参阅此处)。现在,我尝试使用另一种方法来解决它。数据为iris
,分类器为nnet
包装中的多项逻辑回归。代码如下:
# iris data (3-class ROC)
library(nnet)
library(pROC) # should be installed first: install.packages('pROC')
data(iris)
# 3-class logistic regression
model = multinom(Species~., data = iris, trace = F)
# confusion matrix (z1) & accuracy (E1)
z1 = table(iris[, 5], predict(model, data = iris))
E1 = sum(diag(z1)) / sum(z1)
z1;E1
# setosa versicolor virginica
# setosa 50 0 0
# versicolor 0 49 1
# virginica 0 1 49
#[1] 0.9866667
# prediction model (still training data set)
pre = predict(model, data = iris, type='probs')
# AUC measure
modelroc = mean(
c(as.numeric(multiclass.roc(iris$Species, pre[,1])$auc),
as.numeric(multiclass.roc(iris$Species, pre[,2])$auc),
as.numeric(multiclass.roc(iris$Species, pre[,3])$auc)
)
)
modelroc
## RESULT ##
# [1] 0.9803556
我的问题是:
这是使用pROC
软件包的正确方法吗?
非常感谢!!!
一些相关参考:
pROC
程序包:http : //www.inside-r.org/packages/cran/pROC/docs/multiclass.roc
Hand & Till(2001)
原始文件:http : //link.springer.com/article/10.1023%2FA%3A1010920819831
您将采用三个多类AUC的平均值,它们本身就是三个ROC曲线的AUC的平均值。所以这就是9 AUC的平均值。根据您所遇到的实际问题,这可能不是您问题的正确答案,但是由于您从未问过,因此很难回答。我只能说的不是您提到的Hand&Till(2001)论文中描述的内容。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句