scikit-learn中SGDClassifier的正则化参数和迭代

z991 发表于 Dev

z991

Python scikit-learn SGDClassifier（）同时支持l1，l2和弹性，找到正则化参数的最佳值似乎很重要。

我得到了将SGDClassifier（）与GridSearchCV（）一起使用的建议，但是在SGDClassifier中仅提供正则化参数alpha。如果我使用诸如SVM或LogisticRegression之类的损失函数，则我认为应该使用C而不是alpha进行参数优化。使用Logisitic回归或SVM时，是否可以在SGDClassifier（）中设置最佳参数？

另外，我还有一个关于迭代参数n_iter的问题，但我不明白该参数的含义。如果与shuffle选项一起使用，是否像套袋一样工作？因此，如果我使用l1惩罚和较大的n_iter值，它将像RandomizedLasso（）一样工作吗？

大卫·老鼠

C并且alpha都具有相同的效果。区别在于术语的选择。C与...成正比1/alpha。您应该使用GridSearchCV选择一种alpha或C相同的方式，但请记住，较高的C值可能过度拟合，而较低的值alpha则可能过度拟合。

L2将生成一个具有许多小系数的模型，其中L1将选择一个具有大量0系数和一些大系数的模型。弹性网是两者的结合。

SGDClassifier使用随机梯度下降法，其中数据逐个样本地通过学习算法馈送。该n_iter告诉它应该多少遍做过来的数据。随着迭代次数的增加和学习率的降低，SGD变得更像批次梯度下降，但它也变慢了。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-02-24

我来说两句

0条评论

登录后参与评论

上一篇：如何在ASP.Net的内存或磁盘中流式传输用户请求中的文件而无需缓冲请求

来自分类Dev

Related 相关文章

文章

scikit-learn中SGDClassifier的正则化参数和迭代

scikit-learn中SGDClassifier的正则化参数和迭代

scikit-learn SGDClassifier热启动被忽略

scikit-learn SGDClassifier热启动被忽略

scikit-learn中的“ verbose”参数

Scikit Learn中的交叉验证

Scikit Learn中的距离指标

从 scikit-learn 模型列表中迭代预测

为什么带有铰链丢失的SGDClassifier比scikit-learn中的SVC实现要快

scikit中的RBM预测

scikit-learn中的class_weight参数如何工作？

如何使用Scikit Learn在Random Forest中调整参数？

什么是 scikit-learn TSNE 中的 random_state 参数？

如何在scikit-learn中使用随机对数回归找到最低的正则化参数（C）？

scikit-learn中的SVC和LinearSVC在什么参数下等效？

scikit-learn的多级并行化

在scikit-learn中可视化决策树

scikit-learn 在 Java 中规范化实现？

scikit-learn和sklearn之间的区别

XGBoostError：管道和scikit.learn问题

.arff文件与scikit-learn？

Python scikit-learn-TypeError

scikit-learn StratifiedKFold实现

输出 Scikit Learn OLS 报告

scikit-learn：最近的邻居

Scikit-learn 导入约定

scikit-learn和glmnet中的弹性网是否等效？

scikit-learn中的PCA投影和重构

scikit-learn中的目标转换和特征选择

了解Scikit Learn中的Birch集群设置

scikit-learn中的成本敏感分析