搜索

搜索

在scikit Learn中自定义交叉验证

YNr 发表于 Dev

10

r

对于每个玩家的重播，我都有一组功能，以及在不同时间段的目标值。我正在通过Scikit-learn进行分类。为了进行交叉验证，我应该设置一个约束，使得如果重播的样本位于训练集中，则测试集中应该没有该重播的其他样本。我应该定义一个拆分数据的功能，还是可以在Scikit-learn中自定义craoss验证功能？

编辑1

假设我的数据矩阵如下：replayID，时间片和该行的功能。我也有一个包含类标签的数组。

             replayID Time_slice Features
data=array([[ 100,     0.,     1.5,...],
           [ 100,      1.,       3.7,...],
           [ 100,      0.,       1.2,...],
           [ 100,      1.,       1.8,...],
           [ 100,      2.,       2.9,...],
           [ 101,      0.,       1.5,...],
           [ 101,      1.,       3.7,...],
           [ 101,      0.,       1.2,...],
           [ 101,      1.,       1.8,...],
           [ 101,      2.,       2.9,...]])

我要求训练数据中是否包含replayID = 100的样本，那么测试数据中没有其他样本且replayID = 100。此外，训练数据应为数据和测试数据的80％，即20％。

X = data[:, 1:]
y = targets
labels = data[:, 0]
cv = LabelKFold(labels, n_folds=10)
est = GradientBoostingClassifier(**params)
for train, test in cv:
     X_train = X[train]
     y_train = y[train]
     X_test = X[test]
     est.fit(X_train, y_train)

阿米·塔沃里（Ami Tavory）

现代版本的sklearn.cross_validation已包含您要查询的版本-包含单词的版本Label。例如，

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-02-25

0

我来说两句

0条评论

登录后参与评论

上一篇：将对象传递给AngularJS中的指令时没有数据

相关文章

来自分类Dev

在scikit-learn中对自定义内核SVM进行交叉验证

来自分类Dev

scikit-learn交叉验证针对时间序列数据的自定义拆分

来自分类Dev

scikit-learn交叉验证针对时间序列数据的自定义拆分

来自分类Dev

Scikit Learn中的交叉验证

来自分类Dev

scikit-learn 中 NMF 中的自定义矩阵

来自分类Dev

Scikit-Learn中的分层标签K折叠交叉验证

来自分类Dev

Scikit-learn 自定义评分函数 1

来自分类Dev

参数不会传递给scikit-learn GridSearchCV中的自定义估计器

来自分类Dev

如何获得交叉验证中的Keras scikit-learn包装器的训练和验证损失？

来自分类Dev

scikit learn：5 折交叉验证和训练测试拆分

来自分类Dev

如何在Scikit-Learn中绘制PR曲线超过10倍的交叉验证

来自分类Dev

在scikit-learn GridSearchCV中评估交叉验证得分的平均值，stddev

来自分类Dev

Scikit-learn SVC在随机数据交叉验证中始终提供0精度

来自分类Dev

在scikit-learn的Pipeline中包含分类器以进行交叉验证是否有意义？

来自分类Dev

scikit-learn 中的交叉验证：(X_test, y_test) 的平均绝对误差

来自分类Dev

Scikit学习交叉验证拆分

来自分类Dev

scikit的交叉验证如何工作？

来自分类Dev

Scikit学习自定义评分功能

来自分类Dev

Scikit学习自定义评分功能

来自分类Dev

实施自定义scikit-learn估算器的完整规范是什么？

来自分类Dev

如何在scikit-learn的`pipeline'中使用自定义功能选择功能

来自分类Dev

scikit-learn中用于ColumnTransformer的自定义变压器的问题

来自分类Dev

在 scikit-learn 中加载自定义文本数据的问题

来自分类Dev

scikit 学习交叉验证库中的新更新

来自分类Dev

回归的Scikit学习交叉验证评分

来自分类Dev

Scikit Learn中的距离指标

来自分类Dev

为Scikit图像构建自定义AWS Lambda层

来自分类Dev

Scikit 学习自定义 Transformer 维度不匹配

来自分类Dev

scikit-learn交叉验证，带有均方误差的负值

Related 相关文章

文章

热门标签

归档