scikit中的分类报告学习

debugcn 发表于 Dev

阿里·奥克

我想对设备的故障和无故障条件进行分类。标签A表示故障，标签B表示无故障。

scikit-learn 给我一份关于分类矩阵的报告：

        precision    recall   f1-score   support
A       0.82         0.18     0.30       2565
B       0.96         1.00     0.98       45100

现在我应该使用A或B中的哪个结果来指定模型操作？

卢卡斯（Lukasz Tracewski）

介绍

没有一个可以整体描述模型的分数，这完全取决于您的目标。在您的情况下，您正在处理故障检测，因此您有兴趣在数量更多的非故障情况下查找故障。相同的逻辑适用于例如人口和发现携带病原体的个体。

在这种情况下，对“故障”案例（或例如您可能生病）进行高召回率（也称为敏感性）通常非常重要。在这样的筛选中，通常可以将其诊断为“故障”，而实际上它可以正常工作-这就是您的误报。为什么？因为错过发动机或肿瘤中有故障的零件的成本要比要求工程师或医生验证病例的成本高得多。

解

假设这种假设（故障的召回是最重要的指标）在您的情况下成立，那么您应该考虑标签A的召回（故障）。按照这些标准，您的模型运行情况很差：仅发现18％的故障。故障的数量可能比非故障小20倍左右，这会带来严重的偏差（需要解决）。

我可以想到很多情况下该分数实际上不会很差。如果您可以检测到引擎中所有故障的18％（在其他系统之上），并且不引入错误警报，那么它真的很有用-您不需要在状况良好的情况下向驾驶员发出过多的警报。同时，您可能不想在癌症检测中使用相同的逻辑，并告诉患者“一切都好”，而诊断错误的可能性很高。

指标

为了完整起见，我将解释这些术语。考虑以下定义：

tp-真实正值（真实故障）
tn-真否定（这不是错误）
fp-误报（可以，但可以检测到故障）
fn-假阴性（检测到OK，这是一个错误）

这是一篇文章，试图很好地解释什么是精度，召回率和F1。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-04-1

我来说两句

0条评论

登录后参与评论

来自分类Dev

Related 相关文章

文章

scikit中的分类报告学习

scikit中的分类报告学习

介绍

解

指标

Scikit学习分类

Scikit学习返回错误的分类报告和准确性得分

在scikit学习中评估SGD分类器的收敛性

scikit学习管道中的后处理分类器输出

评估scikit学习中SGD分类器的收敛性

scikit中的弱学习者学习随机森林和多余的树分类器

Scikit分类报告-更改显示结果的格式

scikit学习文本的多标签分类

scikit学习对停用词进行分类

scikit学习离散分类数值数据

分类和数值特征-分类目标-Scikit学习-Python

如何在scikit学习管道中组合数字和分类功能？

使用scikit学习OneHotEncoder时如何处理分类数据中的缺失值（NaN）？

转换JPG图像以输入到scikit学习SVM分类器

ValueError：scikit的随机森林分类学习

预测scikit学习分类将运行多长时间

Scikit使用随机森林学习分类数据

在Scikit学习分类器上使用交叉验证

转换JPG图像以输入到scikit学习SVM分类器

scikit中的RandomForestClassifier与ExtraTreesClassifier学习

scikit学习中的NuSVR与SVR

scikit中的OneHotEncoder混淆学习

Python中的Scikit学习更新

在单个查询或报告中执行多个分类

提取监督学习中的分类函数

机器学习中的无监督分类

提取监督学习中的分类函数

Scikit-Learn中的分类数据转换

如何为随机森林分类器，Ada Boost分类器，Extra Trees分类器访问python scikit学习代码