scikit-learn中多类问题的级联分类器

tiao 发表于 Dev

tiao

说我有一个分类问题，该分类问题是多类的并且具有特征性的层次结构，例如“可食用”，“营养丰富”和“〜营养丰富”-因此可以这样表示

├── edible
│   ├── nutritious
│   └── ~nutritious
└── ~edible

虽然使用支持多类分类的分类器可以获得合理的性能，或者对不支持分类器的分类器使用一对一/全方案，但在每个级别分别训练分类器并将其连接起来，将分类为“可食用的”可分为“可食用”nutritious或“不可食用” 。

我想将scikit-lean估算器用作构建基块，并且想知道是否可以Pipeline为此提供支持，或者是否需要编写自己的估算器来实现基本估算器，并且可能BaseEnsemble这样做。

@ogrisel之前已经在邮件列表http://sourceforge.net/mailarchive/message.php?msg_id=31417048上提到了它，我想知道是否有人对此有见解或建议。

奥格里塞尔

您可以通过提供a作为构造函数参数base_estimator和要层叠的目标类的列表顺序列表，来编写自己的类作为元估计器。在此元分类器的fit方法中，您可以基于这些类对数据base_estimators进行细分，并为每个级别拟合的克隆，然后将结果子分类器存储在meta分类器的属性中。

在predict方法中，您再次遍历级联结构，这次在基础子分类器上调用predict，以切分您的预测并将其递归传递到下一个级别。您将需要大量的numpy花式索引;）

您可以git grep base_estimator在源代码中找到代码库中现有的元估算器示例（例如Bagging，AdaBoost，GridSearchCV ...）。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-02-6

我来说两句

0条评论

登录后参与评论

上一篇：放置一个有序的间隔序列，以便与另一个固定间隔序列最大程度地对齐

来自分类Dev

Related 相关文章

文章

scikit-learn中多类问题的级联分类器

scikit-learn中多类问题的级联分类器

scikit-learn中多类分类器的平均值=“ micro”的精确召回曲线

如何处理 Scikit.learn 管道中不平衡的 xgboost 多类分类？

Scikit-learn Ridge分类器：提取类概率

Scikit-learn Ridge分类器：提取类概率

scikit-learn中处理nan / null的分类器

Scikit-Learn中的分类数据转换

scikit-learn计算多标签分类中的F1

使用keras模型解决多标签问题的scikit学习链分类器的拟合方法错误

Scikit了解多类分类（完美的结果）

scikit中的分类报告学习

SciKit中的多类逻辑回归学习

scikit-learn分类器中的得分函数位于哪里？

在scikit-learn中组合概率分类器的最佳方法

在scikit-learn python中结合两个不同的分类器结果

在scikit-learn的Pipeline中包含分类器以进行交叉验证是否有意义？

Scikit学习分类

使用scikit-learn处理分类特征

使用scikit-learn处理分类特征

处理 scikit-learn MLPClassifier 的分类标签

Scikit Learn中的交叉验证

Scikit Learn中的距离指标

scikit学习文本的多标签分类

从scikit-learn（sklearn）中的多类数据计算AUC和ROC曲线？

在SciKit Learn中使用相同的预处理器缩放数据框中的多列

在scikit学习中评估SGD分类器的收敛性

scikit学习管道中的后处理分类器输出

评估scikit学习中SGD分类器的收敛性

如何使用scikit-learn执行集成（多分类器）分类？

scikit-learn获取分类的确定性/所选类别的分类器分数