在scikit Learn中自定义交叉验证

r

对于每个玩家的重播,我都有一组功能,以及在不同时间段的目标值。我正在通过Scikit-learn进行分类。为了进行交叉验证,我应该设置一个约束,使得如果重播的样本位于训练集中,则测试集中应该没有该重播的其他样本。我应该定义一个拆分数据的功能,还是可以在Scikit-learn中自定义craoss验证功能?

编辑1

假设我的数据矩阵如下:replayID,时间片和该行的功能。我也有一个包含类标签的数组。

             replayID Time_slice Features
data=array([[ 100,     0.,     1.5,...],
           [ 100,      1.,       3.7,...],
           [ 100,      0.,       1.2,...],
           [ 100,      1.,       1.8,...],
           [ 100,      2.,       2.9,...],
           [ 101,      0.,       1.5,...],
           [ 101,      1.,       3.7,...],
           [ 101,      0.,       1.2,...],
           [ 101,      1.,       1.8,...],
           [ 101,      2.,       2.9,...]])

我要求训练数据中是否包含replayID = 100的样本,那么测试数据中没有其他样本且replayID = 100。此外,训练数据应为数据和测试数据的80%,即20%。

X = data[:, 1:]
y = targets
labels = data[:, 0]
cv = LabelKFold(labels, n_folds=10)
est = GradientBoostingClassifier(**params)
for train, test in cv:
     X_train = X[train]
     y_train = y[train]
     X_test = X[test]
     est.fit(X_train, y_train)
阿米·塔沃里(Ami Tavory)

现代版本的sklearn.cross_validation已包含您要查询的版本-包含单词的版本Label例如,

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

在scikit-learn中对自定义内核SVM进行交叉验证

来自分类Dev

scikit-learn交叉验证针对时间序列数据的自定义拆分

来自分类Dev

scikit-learn交叉验证针对时间序列数据的自定义拆分

来自分类Dev

Scikit Learn中的交叉验证

来自分类Dev

scikit-learn 中 NMF 中的自定义矩阵

来自分类Dev

Scikit-Learn中的分层标签K折叠交叉验证

来自分类Dev

Scikit-learn 自定义评分函数 1

来自分类Dev

参数不会传递给scikit-learn GridSearchCV中的自定义估计器

来自分类Dev

如何获得交叉验证中的Keras scikit-learn包装器的训练和验证损失?

来自分类Dev

scikit learn:5 折交叉验证和训练测试拆分

来自分类Dev

如何在Scikit-Learn中绘制PR曲线超过10倍的交叉验证

来自分类Dev

在scikit-learn GridSearchCV中评估交叉验证得分的平均值,stddev

来自分类Dev

Scikit-learn SVC在随机数据交叉验证中始终提供0精度

来自分类Dev

在scikit-learn的Pipeline中包含分类器以进行交叉验证是否有意义?

来自分类Dev

scikit-learn 中的交叉验证:(X_test, y_test) 的平均绝对误差

来自分类Dev

Scikit学习交叉验证拆分

来自分类Dev

scikit的交叉验证如何工作?

来自分类Dev

Scikit学习自定义评分功能

来自分类Dev

Scikit学习自定义评分功能

来自分类Dev

实施自定义scikit-learn估算器的完整规范是什么?

来自分类Dev

如何在scikit-learn的`pipeline'中使用自定义功能选择功能

来自分类Dev

scikit-learn中用于ColumnTransformer的自定义变压器的问题

来自分类Dev

在 scikit-learn 中加载自定义文本数据的问题

来自分类Dev

scikit 学习交叉验证库中的新更新

来自分类Dev

回归的Scikit学习交叉验证评分

来自分类Dev

Scikit Learn中的距离指标

来自分类Dev

为Scikit图像构建自定义AWS Lambda层

来自分类Dev

Scikit 学习自定义 Transformer 维度不匹配

来自分类Dev

scikit-learn交叉验证,带有均方误差的负值

Related 相关文章

  1. 1

    在scikit-learn中对自定义内核SVM进行交叉验证

  2. 2

    scikit-learn交叉验证针对时间序列数据的自定义拆分

  3. 3

    scikit-learn交叉验证针对时间序列数据的自定义拆分

  4. 4

    Scikit Learn中的交叉验证

  5. 5

    scikit-learn 中 NMF 中的自定义矩阵

  6. 6

    Scikit-Learn中的分层标签K折叠交叉验证

  7. 7

    Scikit-learn 自定义评分函数 1

  8. 8

    参数不会传递给scikit-learn GridSearchCV中的自定义估计器

  9. 9

    如何获得交叉验证中的Keras scikit-learn包装器的训练和验证损失?

  10. 10

    scikit learn:5 折交叉验证和训练测试拆分

  11. 11

    如何在Scikit-Learn中绘制PR曲线超过10倍的交叉验证

  12. 12

    在scikit-learn GridSearchCV中评估交叉验证得分的平均值,stddev

  13. 13

    Scikit-learn SVC在随机数据交叉验证中始终提供0精度

  14. 14

    在scikit-learn的Pipeline中包含分类器以进行交叉验证是否有意义?

  15. 15

    scikit-learn 中的交叉验证:(X_test, y_test) 的平均绝对误差

  16. 16

    Scikit学习交叉验证拆分

  17. 17

    scikit的交叉验证如何工作?

  18. 18

    Scikit学习自定义评分功能

  19. 19

    Scikit学习自定义评分功能

  20. 20

    实施自定义scikit-learn估算器的完整规范是什么?

  21. 21

    如何在scikit-learn的`pipeline'中使用自定义功能选择功能

  22. 22

    scikit-learn中用于ColumnTransformer的自定义变压器的问题

  23. 23

    在 scikit-learn 中加载自定义文本数据的问题

  24. 24

    scikit 学习交叉验证库中的新更新

  25. 25

    回归的Scikit学习交叉验证评分

  26. 26

    Scikit Learn中的距离指标

  27. 27

    为Scikit图像构建自定义AWS Lambda层

  28. 28

    Scikit 学习自定义 Transformer 维度不匹配

  29. 29

    scikit-learn交叉验证,带有均方误差的负值

热门标签

归档