scikit-learn / python中带有字符的随机森林

索拉·马斯特罗

我有一个字符列和数字,但是我想对字符列进行分类并应用随机森林分类器。我意识到有OneHotEncoder,但是任何地方都没有示例。那么如何将字符分类,例如将具有'f'和'm'的性别列转换为(0,1)之类的整数?

罗宾·斯皮斯

使用LabelEncoder,它接受一个字符串数组并将其转换为整数数组。

例子:

from sklearn.preprocessing import LabelEncoder
import pandas as pd

data = pd.DataFrame()

data['age'] = [17,33,47]
data['gender'] = ['m','f','m']

enc = LabelEncoder()

print(data)
enc.fit(data['gender'])
data['gender'] = enc.transform(data['gender'])
print(data)

输出:

   age gender
0    17      m
1    33      f
2    47      m
   age  gender
0    17       1
1    33       0
2    47       1

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

在随机森林模型(Python,scikit-learn)中访问单个树的底层(tree_)对象

来自分类Dev

如何在Python scikit-learn中从随机森林中的每棵树输出回归预测?

来自分类Dev

Python scikit-learn-TypeError

来自分类Dev

Scikit Learn中的交叉验证

来自分类Dev

Scikit Learn中的距离指标

来自分类Dev

使用scikit-learn消除随机森林上的递归特征

来自分类Dev

使用scikit-learn并行生成随机森林

来自分类Dev

导出Scikit Learn随机森林以在Hadoop平台上使用

来自分类Dev

使用scikit-learn消除随机森林上的递归特征

来自分类Dev

SciKit-Learn:使用随机森林时的 JoblibException

来自分类Dev

线性回归的模拟scikit-learn python

来自分类Dev

了解Scikit Learn中的Birch集群设置

来自分类Dev

scikit-learn中的成本敏感分析

来自分类Dev

在Scikit Learn中控制Logistic回归的阈值

来自分类Dev

scikit-learn中的“ verbose”参数

来自分类Dev

scikit-learn中LogisticRegression的GridSearchCV

来自分类Dev

删除scikit Learn中的特定功能

来自分类Dev

在scikit-learn中运行Randomforest的MemoryError

来自分类Dev

Scikit-Learn KDE中的PDF估计

来自分类Dev

Scikit-Learn中的分类数据转换

来自分类Dev

scikit-learn中的StratifiedKFold vs KFold

来自分类Dev

在scikit-learn中运行Randomforest的MemoryError

来自分类Dev

了解Scikit Learn中的Birch集群设置

来自分类Dev

scikit-learn中的叶排序

来自分类Dev

SVM,scikit-learn:带有RBF内核的决策值

来自分类Dev

用户定义的带有scikit-learn的SVM内核

来自分类Dev

为什么scikit-learn的随机森林使用这么多内存?

来自分类Dev

SciKit-Learn随机森林子样本大小如何等于原始训练数据大小?

来自分类Dev

如何在scikit-learn中保存一个随机森林?

Related 相关文章

热门标签

归档