如何在scikit-learn中显示每次迭代的成本函数？

Hazzamataza 发表于 Dev

哈扎马塔萨

我最近一直在运行一些线性/逻辑回归模型，我想知道如何为每次迭代输出成本函数。sci-kit LinearRegression中的参数之一是'maxiter'，但实际上，您需要查看成本与迭代的关系，以找出该值真正需要的值，即，值得花更多时间进行更多迭代的计算等。

我确定我丢失了一些东西，但我会以为有一种方法可以输出此信息？

提前致谢！

伊戈尔OA

当拟合任何估计量时，必须了解是否存在任何迭代（隐含计算成本函数）或解析精确解。

线性回归

实际上，线性回归（即，最小二乘的最小化）不是一种算法，而是可以使用不同技术解决的最小化问题。那些技术

没有进入这里描述的统计部分的详细信息：

实际上，至少有三种方法用于计算最小二乘解：法线方程，QR分解和奇异值分解。

就我进入代码的细节而言，似乎计算时间涉及到获得解析精确解，而不是遍历成本函数。但是我敢打赌，它们取决于您的系统确定不足，确定或过度确定，以及所使用的语言和库。

逻辑回归

线性回归，logistic回归是最小化问题，可以使用不同的技术，对于scikit学习，是可以解决：newton-cg，lbfgs，liblinear和sag。正如您所提到的，sklearn.linear_model.LogisticRegression包含max_iter参数，这意味着它包含迭代*。之所以可以控制这些变量，是因为更新后的参数不再更改-直到某个epsilon值-或因为它达到了最大迭代次数。

*如文档中所述，它仅包括某些求解器的迭代

仅对牛顿cg，sag和lbfgs求解器有用。求解程序收敛所需的最大迭代次数。

实际上，每个求解器都涉及其自己的实现，例如此处的liblinear求解器。

我建议使用该verbose参数，也许等于2或3获取最大值。根据求解器的不同，它可能会显示成本函数错误。但是，我不明白您打算如何使用此信息。

另一个解决方案可能是编写您自己的求解器，并在每次迭代时打印成本函数。

好奇心杀死了猫，但我检查了scikit的源代码，其中涉及更多内容。

首先，sklearn.linear_model.LinearRegression使用拟合训练其参数。
然后，在的源代码中fit，他们使用了numpy的普通最小二乘（source）。
最后，Numpy的最小二乘函数使用函数scipy.linalg.lapack.dgelsd，它是对DGELSD用Fortran（source）编写的LAPACK（线性代数打包）函数的包装。

也就是说，对于scikit学习者来说，进行错误计算（如果有的话）并不容易。但是，对于LinearRegression我的更多使用以及更多的使用，成本函数和迭代时间之间的权衡是很容易实现的。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-03-3

我来说两句

0条评论

登录后参与评论

来自分类Dev

Related 相关文章

文章

如何在scikit-learn中显示每次迭代的成本函数？

如何在scikit-learn中显示每次迭代的成本函数？

如何在scikit-learn中预测时间序列？

如何在scikit-learn中理解DecisionTreeClassifier的输出？

如何在scikit-learn的DecisionTreeRegressor中获取节点的MSE？

如何在scikit Learn，Python中处理名义数据？

如何在scikit-learn中使用tfidf计算功能？

如何在scikit-learn CountVectorizer中计算词频

如何在scikit-learn中使用tfidf计算功能？

scikit-learn中的成本敏感分析

如何评估scikit学习LogisticRegression的成本函数？

LassoCV如何在scikit学习分区数据中？

如何在scikit-learn的LogisticRegressionCV调用中将参数传递给评分函数

如何在scikit-learn中对管道中的转换参数进行网格搜索

如何在scikit-learn中的LogisticRegressionCV中实现不同的计分功能？

如何在scikit-learn中根据自己的数据创建sklearn.datasets.base.Bunch对象？

如何在Scikit-Learn中绘制PR曲线超过10倍的交叉验证

如何在scikit-learn中提取MultinomialNB Pipeline训练模型中的单词特征？

如何在scikit-learn中缩放大规模数据？

您如何在Python的scikit-learn中访问树深度？

如何在Python scikit-learn中从随机森林中的每棵树输出回归预测？

如何在scikit-learn或Neuraxle中并行运行2条管道？

如何在scikit-learn中缩放大规模数据？

scikit-learn-如何在LinearSVC中强制选择至少一个标签

如何在每次迭代（ajax）上显示图像

如何在每次迭代（ajax）上显示图像

如何在每次迭代 map 函数后渲染不同的组件

如何在Ruby中循环的每次迭代中读取数字？

如何在scikit-learn中使用字符串内核？

如何在scikit-learn的岭回归中设置学习率？

如何在scikit-learn的`pipeline'中使用自定义功能选择功能