我想为多类多标签分类建立一个混淆矩阵,然后计算精度,召回率和F1。一种想法是从训练和测试集中的所有组合中构建它,例如
A1 A2A3 A1A3
A1 x x x
A2A3 x x x
A1A3 x x x
另一个想法是像简单的标签分类那样构建它,但对矩阵的值使用双值,例如
A1 A2 A3
A1 double double double
A2 double double double
A3 double double double
在这种情况下的问题是如何计算有意义的值?
有没有建立这种矩阵的经验?哪个版本更合理?如果还有其他方法可以构建这种混淆矩阵,那么很高兴听到您的来信。
问候,安德里
如果也有人感兴趣,这是对我有用的方法:由于使用了Gj的描述,我使用了第一个想法并计算了基于标签的度量。Madjarov等人,“多标签学习方法的广泛实验比较,模式识别”(2012)。
相应的代码可以在评估模块的dkpro-tc(DKPro文本分类框架)中找到。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句