Scikit Learn中的交叉验证

天鹅87

我一直在使用http://scikit-learn.org/stable/modules/generation/sklearn.cross_validation.cross_val_score.html

为了交叉验证Logistic回归分类器。我得到的结果是:

[ 0.78571429  0.64285714  0.85714286  0.71428571  
0.78571429  0.64285714    0.84615385  0.53846154  
0.76923077  0.66666667]

我的主要问题是如何找到哪个组/对子最大程度地提高分类器得分并产生0.857。

后续问题:用这种方法训练我的分类器是一种好的做法吗?

先感谢您。

阿米·塔沃里(Ami Tavory)

我是否以及如何找到哪个组合/对折将最大化我的分类器得分

从的文档中cross_val_score,您可以看到它在特定cv对象上运行。(如果未明确给出,则KFold在某些情况下用到,在其他情况下用到其他东西-请参阅此处的文档。)

您可以遍历此对象(或相同对象)以找到确切的火车/测试索引。例如:

for tr, te in KFold(10000, 3):
    # tr, te in each iteration correspond to those which gave you the scores you saw.

是否用这套训练分类器是一个好习惯。

绝对不!

交叉验证的唯一合法用途是用于评估整体性能,在不同模型之间进行选择或配置模型参数。

致力于模型后,您应该在整个训练集中对其进行训练。在碰巧给出最高分的子集上训练它是完全错误的。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

Scikit-Learn中的分层标签K折叠交叉验证

来自分类Dev

在scikit Learn中自定义交叉验证

来自分类Dev

如何获得交叉验证中的Keras scikit-learn包装器的训练和验证损失?

来自分类Dev

如何在Scikit-Learn中绘制PR曲线超过10倍的交叉验证

来自分类Dev

在scikit-learn中对自定义内核SVM进行交叉验证

来自分类Dev

在scikit-learn GridSearchCV中评估交叉验证得分的平均值,stddev

来自分类Dev

Scikit-learn SVC在随机数据交叉验证中始终提供0精度

来自分类Dev

在scikit-learn的Pipeline中包含分类器以进行交叉验证是否有意义?

来自分类Dev

scikit-learn 中的交叉验证:(X_test, y_test) 的平均绝对误差

来自分类Dev

scikit learn:5 折交叉验证和训练测试拆分

来自分类Dev

Scikit学习交叉验证拆分

来自分类Dev

scikit的交叉验证如何工作?

来自分类Dev

scikit 学习交叉验证库中的新更新

来自分类Dev

scikit-learn交叉验证针对时间序列数据的自定义拆分

来自分类Dev

scikit-learn交叉验证,带有均方误差的负值

来自分类Dev

带有scikit-learn的多重输入的Keras模型的交叉验证

来自分类Dev

scikit-learn交叉验证针对时间序列数据的自定义拆分

来自分类Dev

在scikit-learn中将RandomizedSearchCV(或GridSearcCV)与LeaveOneGroupOut交叉验证相结合

来自分类Dev

回归的Scikit学习交叉验证评分

来自分类Dev

Scikit Learn中的距离指标

来自分类Dev

在交叉验证期间将参数传递给scikit中的score_func

来自分类Dev

在Scikit学习分类器上使用交叉验证

来自分类Dev

scikit-学习线性回归K折交叉验证

来自分类Dev

scikit-学习的LinearRegression出现意外的交叉验证分数

来自分类Dev

使用保留集在scikit-learn中的RandomizedSearchCV中进行验证?

来自分类Dev

了解Scikit Learn中的Birch集群设置

来自分类Dev

scikit-learn中的成本敏感分析

来自分类Dev

在Scikit Learn中控制Logistic回归的阈值

来自分类Dev

scikit-learn中的“ verbose”参数

Related 相关文章

  1. 1

    Scikit-Learn中的分层标签K折叠交叉验证

  2. 2

    在scikit Learn中自定义交叉验证

  3. 3

    如何获得交叉验证中的Keras scikit-learn包装器的训练和验证损失?

  4. 4

    如何在Scikit-Learn中绘制PR曲线超过10倍的交叉验证

  5. 5

    在scikit-learn中对自定义内核SVM进行交叉验证

  6. 6

    在scikit-learn GridSearchCV中评估交叉验证得分的平均值,stddev

  7. 7

    Scikit-learn SVC在随机数据交叉验证中始终提供0精度

  8. 8

    在scikit-learn的Pipeline中包含分类器以进行交叉验证是否有意义?

  9. 9

    scikit-learn 中的交叉验证:(X_test, y_test) 的平均绝对误差

  10. 10

    scikit learn:5 折交叉验证和训练测试拆分

  11. 11

    Scikit学习交叉验证拆分

  12. 12

    scikit的交叉验证如何工作?

  13. 13

    scikit 学习交叉验证库中的新更新

  14. 14

    scikit-learn交叉验证针对时间序列数据的自定义拆分

  15. 15

    scikit-learn交叉验证,带有均方误差的负值

  16. 16

    带有scikit-learn的多重输入的Keras模型的交叉验证

  17. 17

    scikit-learn交叉验证针对时间序列数据的自定义拆分

  18. 18

    在scikit-learn中将RandomizedSearchCV(或GridSearcCV)与LeaveOneGroupOut交叉验证相结合

  19. 19

    回归的Scikit学习交叉验证评分

  20. 20

    Scikit Learn中的距离指标

  21. 21

    在交叉验证期间将参数传递给scikit中的score_func

  22. 22

    在Scikit学习分类器上使用交叉验证

  23. 23

    scikit-学习线性回归K折交叉验证

  24. 24

    scikit-学习的LinearRegression出现意外的交叉验证分数

  25. 25

    使用保留集在scikit-learn中的RandomizedSearchCV中进行验证?

  26. 26

    了解Scikit Learn中的Birch集群设置

  27. 27

    scikit-learn中的成本敏感分析

  28. 28

    在Scikit Learn中控制Logistic回归的阈值

  29. 29

    scikit-learn中的“ verbose”参数

热门标签

归档