我有一个字符列和数字,但是我想对字符列进行分类并应用随机森林分类器。我意识到有OneHotEncoder,但是任何地方都没有示例。那么如何将字符分类,例如将具有'f'和'm'的性别列转换为(0,1)之类的整数?
使用LabelEncoder,它接受一个字符串数组并将其转换为整数数组。
例子:
from sklearn.preprocessing import LabelEncoder
import pandas as pd
data = pd.DataFrame()
data['age'] = [17,33,47]
data['gender'] = ['m','f','m']
enc = LabelEncoder()
print(data)
enc.fit(data['gender'])
data['gender'] = enc.transform(data['gender'])
print(data)
输出:
age gender
0 17 m
1 33 f
2 47 m
age gender
0 17 1
1 33 0
2 47 1
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句