Scikit Learn Pipeline的定制转换器

机械

我正在使用Scikit学习管道对象,因为我要执行一系列任务(上采样,特征选择,分类)。我的升采样方法是一种自定义方法,这意味着我必须为管道实现一个自定义转换器。

变压器必须具有变换和拟合方法。当然,我只想对训练数据进行升采样,而不对测试数据进行升采样。这是否意味着我只需要实现fit方法,而无需实现transform方法(对传递给fit方法的数据集进行上采样)?据我了解,转换方法既适用于训练集又适用于测试集...

米哈伊尔·科罗波夫(Mikhail Korobov)

scikit-learn转换器无法更改样本数量,API不支持此操作-请参见http://scikit-learn.org/stable/modules/generated/sklearn.base.TransformerMixin.html#sklearn.base.TransformerMixin。 fit_transform-注意X,y和X_new的尺寸。另外,请注意,它们仅返回X,而不返回y-这意味着,如果更改X尺寸,它将不再与y尺寸匹配。

一种方法是在管道外部运行它-生成用于训练的新样本并将其放到管道中,而不生成用于测试的新样本。但是它不能与交叉验证一起使用。

为了使其能够用于交叉验证和模型选择,您需要一个自定义的Pipeline类,该类支持更改n_samples的转换器。例如,可以在不平衡学习包中找到一个实现:请参见此处检查此程序包-如果您需要上采样,那么您的上采样方法可能已经在不平衡学习中实现了。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

Scikit-Learn中的分类数据转换

来自分类Dev

无法在Scikit-learn中导入PolynomialFeatures,make_pipeline

来自分类Dev

将scikit-learn SVM模型转换为LibSVM

来自分类Dev

scikit-learn中的目标转换和特征选择

来自分类Dev

Scikit-Learn管道拟合和转换错误

来自分类Dev

将scikit-learn SVM模型转换为LibSVM

来自分类Dev

scikit-learn中处理nan / null的分类器

来自分类Dev

如何使这个估计器与scikit-learn兼容?

来自分类Dev

scikit-learn中多类问题的级联分类器

来自分类Dev

Scikit-learn Ridge分类器:提取类概率

来自分类Dev

如何克隆包括数据的scikit-learn估算器?

来自分类Dev

Scikit-Learn包装器和RandomizedSearchCV:RuntimeError

来自分类Dev

Scikit-learn Ridge分类器:提取类概率

来自分类Dev

如何使这个估计器与scikit-learn兼容?

来自分类Dev

在scikit-learn的Pipeline中包含分类器以进行交叉验证是否有意义?

来自分类Dev

.arff文件与scikit-learn?

来自分类Dev

Scikit Learn中的交叉验证

来自分类Dev

Python scikit-learn-TypeError

来自分类Dev

scikit-learn StratifiedKFold实现

来自分类Dev

Scikit Learn中的距离指标

来自分类Dev

输出 Scikit Learn OLS 报告

来自分类Dev

scikit-learn:最近的邻居

来自分类Dev

Scikit-learn 导入约定

来自分类Dev

如何在scikit-learn的`pipeline'中使用自定义功能选择功能

来自分类Dev

如何在scikit-learn中提取MultinomialNB Pipeline训练模型中的单词特征?

来自分类Dev

如何在scikit-learn中对管道中的转换参数进行网格搜索

来自分类Dev

scikit-learn PCA转换返回不正确的缩减特征长度

来自分类Dev

将xgboost.Booster的实例转换为实现scikit-learn API的模型

来自分类Dev

在scikit-learn中将机器学习算法的熊猫数据帧转换为numpy数组是否必须

Related 相关文章

  1. 1

    Scikit-Learn中的分类数据转换

  2. 2

    无法在Scikit-learn中导入PolynomialFeatures,make_pipeline

  3. 3

    将scikit-learn SVM模型转换为LibSVM

  4. 4

    scikit-learn中的目标转换和特征选择

  5. 5

    Scikit-Learn管道拟合和转换错误

  6. 6

    将scikit-learn SVM模型转换为LibSVM

  7. 7

    scikit-learn中处理nan / null的分类器

  8. 8

    如何使这个估计器与scikit-learn兼容?

  9. 9

    scikit-learn中多类问题的级联分类器

  10. 10

    Scikit-learn Ridge分类器:提取类概率

  11. 11

    如何克隆包括数据的scikit-learn估算器?

  12. 12

    Scikit-Learn包装器和RandomizedSearchCV:RuntimeError

  13. 13

    Scikit-learn Ridge分类器:提取类概率

  14. 14

    如何使这个估计器与scikit-learn兼容?

  15. 15

    在scikit-learn的Pipeline中包含分类器以进行交叉验证是否有意义?

  16. 16

    .arff文件与scikit-learn?

  17. 17

    Scikit Learn中的交叉验证

  18. 18

    Python scikit-learn-TypeError

  19. 19

    scikit-learn StratifiedKFold实现

  20. 20

    Scikit Learn中的距离指标

  21. 21

    输出 Scikit Learn OLS 报告

  22. 22

    scikit-learn:最近的邻居

  23. 23

    Scikit-learn 导入约定

  24. 24

    如何在scikit-learn的`pipeline'中使用自定义功能选择功能

  25. 25

    如何在scikit-learn中提取MultinomialNB Pipeline训练模型中的单词特征?

  26. 26

    如何在scikit-learn中对管道中的转换参数进行网格搜索

  27. 27

    scikit-learn PCA转换返回不正确的缩减特征长度

  28. 28

    将xgboost.Booster的实例转换为实现scikit-learn API的模型

  29. 29

    在scikit-learn中将机器学习算法的熊猫数据帧转换为numpy数组是否必须

热门标签

归档