处理 scikit-learn MLPClassifier 的分类标签

debugcn 发表于 Dev

害怕

我有一个用于分类目的的手写数据集，其中的类来自a-z. 如果我想使用MLPClassifier，我想我不能直接使用这样的分类类，因为 scikit-learn 中的 MLP 实现只处理数字类。因此，这里应该采取什么适当的行动？将这些类转换为从 1 到 28 的编号如何，是否有意义？如果没有，scikit-learn 是否为类标签提供了特殊的编码机制来处理这种情况（我猜这里不是单热编码的选项）？

谢谢

弗朗西斯科·坎特罗

您可能需要预处理数据，因为 scikit-learn 只处理数值。在这种情况下，我想预测交易的货币。货币以 ISO 代码表示，因此使用 LabelEncoder 将其转换为数字类别（即：1、2、3...）：

#Import the object LabelEncoder
from sklearn.preprocessing import LabelEncoder

#defining class column
my_encoder = LabelEncoder()
my_class_currency = np.array(my_encoder.fit_transform(my_data['currency'])).reshape(-1,1)
#Create a "diccionary" to translate the categories into the actual values once you have the output
my_class_decoder = list(np.unique(my_data['currency']))

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-07-20

我来说两句

0条评论

登录后参与评论

来自分类Dev

Related 相关文章

文章

处理 scikit-learn MLPClassifier 的分类标签

处理 scikit-learn MLPClassifier 的分类标签

使用scikit-learn处理太多分类功能

scikit-learn中多类问题的级联分类器

使用scikit-learn处理分类特征

Scikit-learn Ridge分类器：提取类概率

如何使用scikit-learn使用标签对文本进行分类？

如何使用scikit-learn执行集成（多分类器）分类？

Scikit-Learn中的分类数据转换

如何使用scikit-learn加载和处理.txt文件？

如何预处理新实例进行分类，以使特征编码与使用Scikit-learn的模型相同？

scikit学习文本的多标签分类

scikit-learn中处理nan / null的分类器

scikit-learn计算多标签分类中的F1

scikit学习管道中的后处理分类器输出

如何告诉scikit-learn给出F-1 /精度/召回分数的标签（二进制分类）？

使用scikit-learn进行二次采样+分类

scikit-learn获取分类的确定性/所选类别的分类器分数

使用NLTK，scikit-learn和OneVsRestClassifier启用多标签分类

相似度度量scikit-learn文档分类

在Scikit-Learn中使用近似最近邻进行分类

Scikit-Learn中的分层标签K折叠交叉验证

从scikit-learn / numpy中的集群中心计算标签？

使用scikit-learn处理分类特征

Scikit-learn Ridge分类器：提取类概率

使用scikit-learn生成困难分类数据集

如何在scikit Learn，Python中处理名义数据？

如何使用 scikit learn 预测目标标签

Scikit-learn 微调：在评估前对预测标签进行后处理

如何处理 Scikit.learn 管道中不平衡的 xgboost 多类分类？

使用 Scikit-Learn 使用分类数据制作回归模型