LassoCV如何在scikit学习分区数据中?

西拉

我正在使用sklearn中的套索方法执行线性回归。

根据他们的指导,以及我在其他地方看到的指导,建议不要简单地对所有训练数据进行交叉验证,而建议将其分成更传统的训练集/验证集分区。

因此,在训练集上训练了套索,然后根据来自验证集的交叉验证的结果来调整超参数alpha。最后,在测试集上使用可接受的模型以给出真实的视图,以了解其在现实中的性能。在这里将关注点分开是防止过度拟合的预防措施。

实际问题

Lasso CV是否符合上述协议,还是只是在相同的数据上和/或在相同的CV轮次中以某种方式训练了模型参数和超参数?

谢谢。

艾肯伯格

如果sklearn.cross_validation.cross_val_scoresklearn.linear_model.LassoCV对象一起使用,那么您将执行嵌套的交叉验证cross_val_score会根据您指定折叠的方式将数据分为训练集和测试集(可以使用诸如之类的对象来完成sklearn.cross_validation.KFold)。火车将被传递到LassoCV该火车本身会再次对数据进行拆分,以选择正确的罚则。看来,这与您要查找的设置相对应。

import numpy as np
from sklearn.cross_validation import KFold, cross_val_score
from sklearn.linear_model import LassoCV

X = np.random.randn(20, 10)
y = np.random.randn(len(X))

cv_outer = KFold(len(X), n_folds=5)
lasso = LassoCV(cv=3)  # cv=3 makes a KFold inner splitting with 3 folds

scores = cross_val_score(lasso, X, y, cv=cv_outer)

答:LassoCV不会为您完成所有工作,您必须将其与所需的功能结合使用cross_val_score同时,这也是实现此类对象的合理方式,因为我们也可能只对优化过的超参数进行拟合LassoCV而不必对另一组保留的数据直接进行评估,对此很感兴趣

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何标准化scikit学习中的排名数据?

来自分类Dev

如何创建scikit学习数据集?

来自分类Dev

如何在scikit学习决策树中形成数据以构成n个特征和n个样本的数组?

来自分类Dev

使用scikit学习OneHotEncoder时如何处理分类数据中的缺失值(NaN)?

来自分类Dev

如何在scikit学习管道中组合数字和分类功能?

来自分类Dev

如何在scikit学习列选择器管道中仅选择少数列?

来自分类Dev

如何在SnappyData的列表中对数据进行分区?

来自分类Dev

如何在 sparklyr 中重新分区数据框

来自分类Dev

如何在scikit Learn,Python中处理名义数据?

来自分类Dev

将csv中的数据加载到Scikit中以学习SVM

来自分类Dev

将csv中的数据加载到Scikit中以学习SVM

来自分类Dev

python scikit中更快的数据拟合(或学习)功能

来自分类Dev

Zip scikit学习数据集

来自分类Dev

scikit-学习CountVectorizer中的术语频率如何计算

来自分类Dev

PCA如何为scikit中的Kmeans算法中心提供学习

来自分类Dev

如何在内存中加载scikit学习机器学习模块?

来自分类Dev

如何在分区之间平衡我的数据?

来自分类常见问题

scikit中的RandomForestClassifier与ExtraTreesClassifier学习

来自分类Dev

scikit学习中的NuSVR与SVR

来自分类Dev

scikit中的OneHotEncoder混淆学习

来自分类Dev

scikit中的分类报告学习

来自分类Dev

Python中的Scikit学习更新

来自分类Dev

分区表后,如何查看每个分区中的数据

来自分类Dev

如何在张量流学习验证监视器中输入数据?

来自分类Dev

如何在Django中的字段上进行数据库分区?

来自分类Dev

Cassandra分区容限如何在多数据中心环境中工作

来自分类Dev

如何在pyspark数据帧读取方法中包括分区列

来自分类Dev

如何在Azure CosmosDB中为Graph数据库选择分区键

来自分类Dev

如何在Django中的字段上进行数据库分区?

Related 相关文章

  1. 1

    如何标准化scikit学习中的排名数据?

  2. 2

    如何创建scikit学习数据集?

  3. 3

    如何在scikit学习决策树中形成数据以构成n个特征和n个样本的数组?

  4. 4

    使用scikit学习OneHotEncoder时如何处理分类数据中的缺失值(NaN)?

  5. 5

    如何在scikit学习管道中组合数字和分类功能?

  6. 6

    如何在scikit学习列选择器管道中仅选择少数列?

  7. 7

    如何在SnappyData的列表中对数据进行分区?

  8. 8

    如何在 sparklyr 中重新分区数据框

  9. 9

    如何在scikit Learn,Python中处理名义数据?

  10. 10

    将csv中的数据加载到Scikit中以学习SVM

  11. 11

    将csv中的数据加载到Scikit中以学习SVM

  12. 12

    python scikit中更快的数据拟合(或学习)功能

  13. 13

    Zip scikit学习数据集

  14. 14

    scikit-学习CountVectorizer中的术语频率如何计算

  15. 15

    PCA如何为scikit中的Kmeans算法中心提供学习

  16. 16

    如何在内存中加载scikit学习机器学习模块?

  17. 17

    如何在分区之间平衡我的数据?

  18. 18

    scikit中的RandomForestClassifier与ExtraTreesClassifier学习

  19. 19

    scikit学习中的NuSVR与SVR

  20. 20

    scikit中的OneHotEncoder混淆学习

  21. 21

    scikit中的分类报告学习

  22. 22

    Python中的Scikit学习更新

  23. 23

    分区表后,如何查看每个分区中的数据

  24. 24

    如何在张量流学习验证监视器中输入数据?

  25. 25

    如何在Django中的字段上进行数据库分区?

  26. 26

    Cassandra分区容限如何在多数据中心环境中工作

  27. 27

    如何在pyspark数据帧读取方法中包括分区列

  28. 28

    如何在Azure CosmosDB中为Graph数据库选择分区键

  29. 29

    如何在Django中的字段上进行数据库分区?

热门标签

归档