如何修复标签数量与样本数量不匹配的问题?

任意投手

我正在尝试运行随机森林分类器,在 test_train_split 之后,当我运行它时会生成一个错误,即样本数与样本不匹配。我有 960 行和 26 列。

X=pd.read_csv('csv',delimiter=',',sep=",",quotechar='"',header=None,quoting=2,error_bad_lines=False,na_values="")
X=X.drop([0,2,4,5],axis=1)
X= X.fillna('')
X= X[0:961].astype("int")
features= X.columns
Y= X[27] #my labels
Y= Y[0:961].astype("int") # Converting datatype string to int
Y=Y[np.isfinite(X[27])] # Remove NAN values from my label Y
x_train,y_train,x_test,y_test=train_test_split(X,Y,test_size=0.3)
clf = RandomForestClassifier(n_estimators=50,max_depth=3)
clf.fit(x_train,y_train)
沙漠之舟

您的代码有两个问题。

第一个是,当您从标签 Y 中删除 NaN 值时:

Y=Y[np.isfinite(X[27])] # Remove NAN values from my label Y

你不会对你的特征 X 做同样的事情;因此,您的特征 X 和标签 Y 最终会得到不同数量的样本,并train_test_split给出预期错误。

由于您已经从 Y 中删除了 NaN 值,因此在 X 中保留相应的行是没有意义的;所以,你应该添加

X=X[np.isfinite(X[27])] # remove rows with NaN labels

第二个问题是你的train_test_split作业是错误的(检查文档);它应该是

x_train, x_test, y_train, y_test = train_test_split(X,Y,test_size=0.3)

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何增加绘制的样本数量?

来自分类Dev

如何在图例中显示样本数量?

来自分类Dev

如何在图例中显示样本数量?

来自分类Dev

dplyr:样本数量大于总体数量

来自分类Dev

Seaborn如何在sns.catplot中添加每个类别的样本数量

来自分类Dev

Keras-flow_from_directory:如何获取每个类别中的样本数量?

来自分类Dev

我收到ValueError:“ ValueError:标签数= 16512与样本数不匹配= 16339”

来自分类Dev

python sklearn cross_validation /标签数与样本数不匹配

来自分类Dev

iPhone11的音频样本数量意外

来自分类Dev

Tensorflow-获取队列中的样本数量?

来自分类Dev

SystemML决策树-“无法将节点数为1.0的样本数量减少到匹配10个”

来自分类Dev

SVM-训练样本数量与特征数量之间的关系

来自分类Dev

如何控制双击选择的文本数量?

来自分类Dev

如何控制双击选择的文本数量?

来自分类Dev

如何按匹配标签的数量对图像列表进行排序?

来自分类Dev

绑定变量的数量与PDO的令牌数量不匹配

来自分类Dev

“绑定变量的数量与令牌的数量不匹配”-但它确实

来自分类Dev

绑定变量的数量与令牌的数量不匹配-MySQl

来自分类Dev

无效的参数编号:绑定变量的数量与令牌的数量不匹配

来自分类Dev

学说:绑定变量的数量与标记的数量不匹配

来自分类Dev

错误:绑定变量的数量与标记的数量不匹配

来自分类Dev

输入样本的FFT数量

来自分类Dev

如何指定轴标签的数量

来自分类Dev

使用pandas pd.resample跟踪每个垃圾箱中的样本数量

来自分类Dev

有没有办法更改现有GLFW窗口的MSAA样本数量?

来自分类Dev

ValueError:找到输入样本数量不一致的输入变量:[249957,8248581]

来自分类Dev

ValueError:找到样本数量不一致的输入变量:[100,300]

来自分类Dev

找到样本数量不一致的输入变量:[799996,199999]

来自分类Dev

如果验证步骤不适合样本数量怎么办?

Related 相关文章

  1. 1

    如何增加绘制的样本数量?

  2. 2

    如何在图例中显示样本数量?

  3. 3

    如何在图例中显示样本数量?

  4. 4

    dplyr:样本数量大于总体数量

  5. 5

    Seaborn如何在sns.catplot中添加每个类别的样本数量

  6. 6

    Keras-flow_from_directory:如何获取每个类别中的样本数量?

  7. 7

    我收到ValueError:“ ValueError:标签数= 16512与样本数不匹配= 16339”

  8. 8

    python sklearn cross_validation /标签数与样本数不匹配

  9. 9

    iPhone11的音频样本数量意外

  10. 10

    Tensorflow-获取队列中的样本数量?

  11. 11

    SystemML决策树-“无法将节点数为1.0的样本数量减少到匹配10个”

  12. 12

    SVM-训练样本数量与特征数量之间的关系

  13. 13

    如何控制双击选择的文本数量?

  14. 14

    如何控制双击选择的文本数量?

  15. 15

    如何按匹配标签的数量对图像列表进行排序?

  16. 16

    绑定变量的数量与PDO的令牌数量不匹配

  17. 17

    “绑定变量的数量与令牌的数量不匹配”-但它确实

  18. 18

    绑定变量的数量与令牌的数量不匹配-MySQl

  19. 19

    无效的参数编号:绑定变量的数量与令牌的数量不匹配

  20. 20

    学说:绑定变量的数量与标记的数量不匹配

  21. 21

    错误:绑定变量的数量与标记的数量不匹配

  22. 22

    输入样本的FFT数量

  23. 23

    如何指定轴标签的数量

  24. 24

    使用pandas pd.resample跟踪每个垃圾箱中的样本数量

  25. 25

    有没有办法更改现有GLFW窗口的MSAA样本数量?

  26. 26

    ValueError:找到输入样本数量不一致的输入变量:[249957,8248581]

  27. 27

    ValueError:找到样本数量不一致的输入变量:[100,300]

  28. 28

    找到样本数量不一致的输入变量:[799996,199999]

  29. 29

    如果验证步骤不适合样本数量怎么办?

热门标签

归档