如何控制特征的数量[机器学习]?

金融账户 حساب

我正在编写此机器学习代码(分类)以在两个类之间进行分类。我首先使用一项功能来捕获我的所有图像。

例如:(注:1 & 0 用于标注)class A=[(4295046.0, 1), (4998220.0, 1), (4565017.0, 1), (4078291.0, 1), (4350411.0, 1), (4.0) 1), (4201831.0, 1), (4203570.0, 1), (4197025.0, 1), (4110781.0, 1), (4080568.0, 1), (4276499.0, 1), (4), 5,17.3), (4), 5,13. , (4455070.0, 1), (5682823.0, 1), (5572122.0, 1), (5382890.0, 1), (5217487.0, 1), (4714908.0, 1), (7,8,10.0, 1), (46, 10) 4143981.0, 1), (3899129.0, 1), (3830584.0, 1), (3557377.0, 1), (3125518.0, 1), (3197039.0, 1), (3109.5) (3109.0, 10) (3109.0, 10), (3109.0, 10) 1), (2726363.0, 1), (3507626.0, 1), .....etc]

B类=[(7179088.0, 0), (7144249.0, 0), (6806806.0, 0), (5080876.0, 0), (5170390.0, 0), (5694876.0, 0), (6), 7,02, (6), 5, 02 ), (6472171.0, 0), (7112956.0, 0), (7356507.0, 0), (9180030.0, 0), (9183460.0, 0), (9212517.0, 0), (9212517.0, 0), (3), 5, 905 (905) (9103067.0, 0), (8889903.0, 0), (8328604.0, 0), (8475442.0, 0), (8499221.0, 0), (8752169.0, 0), (87,89,709) (87,890.70) , 0), (9027381.0, 0), (9090035.0, 0), (9343846.0, 0), (9518609.0, 0), (9435149.0, 0), (9365842.0, 0.5), (9), 86, 0.5 ), (4749338.0, 0), (5296143.0, 0), (5478942.0, 0), (5610865.0, 0), (5514997.0, 0), (5381010.0, 0), (5478942.0, 0), (5610865.0, 0), (5381010.0, 0), (6), 6.09. (4804526.0, 0), (4743107.0, 0), (4898914.0, 0), (5018503.0, 0), (5778240.0, 0), (5741893.0, 0), (46,507.0) (46,503.0) (46,503.0) (46,520.0) , 0), (5699410.0, 0), (5748260.0, 0), (5869260.0, 0), ...。等等]

/data is A and B combined

x = [[each[0]] for each in data]
y = [[each[1]] for each in data]
print (len(x), len(y))

x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2, 
random_state=42)
print (len(x_train), len(x_test))
print (len(y_train), len(y_test))

from sklearn.ensemble import RandomForestClassifier

clf = RandomForestClassifier(n_estimators=100, max_depth=2, random_state=0)
clf.fit(x_train, y_train)

问题:

更改什么以添加另一个功能?添加功能时 A 和 B 应该如何显示,我是否更改此行

clf = RandomForestClassifier(n_estimators=100, max_depth=2, random_state=0)

何时使用两个功能?

我猜:

A类=[(4295046.0,secons features, 1), (4998220.0,secons features, 1), (4565017.0,secons features, 1), (4078291.0,secons features, 1), (4350411.0,secons features, 1) 4434050.0, 1),......] 是吗?有更好的方法吗?

伊塔马尔·穆什金

这个模型不需要明确的特征数量。
如果类始终是数据中每个元组中的最后一个元素,则可以执行以下操作:

x = [[each[:-1]] for each in data]
y = [[each[-1]] for each in data]

并从那里继续相同。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何预处理数据以进行机器学习?

来自分类Dev

机器学习中维度,属性和特征之间的差异

来自分类Dev

如何避免重新训练机器学习模型

来自分类Dev

机器学习中的加权系统程序如何工作?

来自分类Dev

机器学习中参数,特征和类之间的区别

来自分类Dev

通过机器学习从图像计算车辆数量

来自分类Dev

如何在深度学习模型中训练不同尺度的特征

来自分类Dev

如何从特征提取中找到匹配的数量?

来自分类Dev

机器学习如何与大数据融合?

来自分类Dev

如何结合使用GridSearchCV和SelectFromModel来减少特征数量?

来自分类Dev

Azure机器学习工作区笔记本的版本控制

来自分类Dev

如何使用机器学习模型预测特征稍有不同的数据?

来自分类Dev

如何正确验证机器学习模型?

来自分类Dev

如何为机器学习编码“年”数据?

来自分类Dev

是那个使每个数据的数量完全相等以使机器学习更好的偶像吗?

来自分类Dev

机器学习如何与Hadoop链接?

来自分类Dev

机器学习-如何摆脱svm的偏见?

来自分类Dev

SVM机器学习:LibSVM中的特征表示

来自分类Dev

在回归(机器学习)中处理分类特征的未分配(空)值?

来自分类Dev

如何计算Linux机器上的vcore数量

来自分类Dev

如何分辨学习者的机器学习模型类型

来自分类Dev

机器学习模型如何更新?

来自分类Dev

机器学习:将特征组合成单个特征

来自分类Dev

提取特征并对不在 0 附近振荡的信号使用机器学习

来自分类Dev

使用机器学习的数据集中特征的重要性?

来自分类Dev

如何确定机器学习脚本的最佳 GPU 数量?

来自分类Dev

在机器学习中,编码非分层分类特征的最佳方法是什么?

来自分类Dev

如何减少文本分类中的特征数量?

来自分类Dev

如何查看失败的机器学习记录

Related 相关文章

  1. 1

    如何预处理数据以进行机器学习?

  2. 2

    机器学习中维度,属性和特征之间的差异

  3. 3

    如何避免重新训练机器学习模型

  4. 4

    机器学习中的加权系统程序如何工作?

  5. 5

    机器学习中参数,特征和类之间的区别

  6. 6

    通过机器学习从图像计算车辆数量

  7. 7

    如何在深度学习模型中训练不同尺度的特征

  8. 8

    如何从特征提取中找到匹配的数量?

  9. 9

    机器学习如何与大数据融合?

  10. 10

    如何结合使用GridSearchCV和SelectFromModel来减少特征数量?

  11. 11

    Azure机器学习工作区笔记本的版本控制

  12. 12

    如何使用机器学习模型预测特征稍有不同的数据?

  13. 13

    如何正确验证机器学习模型?

  14. 14

    如何为机器学习编码“年”数据?

  15. 15

    是那个使每个数据的数量完全相等以使机器学习更好的偶像吗?

  16. 16

    机器学习如何与Hadoop链接?

  17. 17

    机器学习-如何摆脱svm的偏见?

  18. 18

    SVM机器学习:LibSVM中的特征表示

  19. 19

    在回归(机器学习)中处理分类特征的未分配(空)值?

  20. 20

    如何计算Linux机器上的vcore数量

  21. 21

    如何分辨学习者的机器学习模型类型

  22. 22

    机器学习模型如何更新?

  23. 23

    机器学习:将特征组合成单个特征

  24. 24

    提取特征并对不在 0 附近振荡的信号使用机器学习

  25. 25

    使用机器学习的数据集中特征的重要性?

  26. 26

    如何确定机器学习脚本的最佳 GPU 数量?

  27. 27

    在机器学习中,编码非分层分类特征的最佳方法是什么?

  28. 28

    如何减少文本分类中的特征数量?

  29. 29

    如何查看失败的机器学习记录

热门标签

归档