我正在尝试使用scikit-learn对庞大的数据集进行逻辑回归SGDClassifier
(partial_fit
准确地说,我是在使用)。我获得的系数具有不同的符号,而我想强迫分类器只寻找正值(我知道这在方法论上可能不是最好的方法,但是现在还可以)。
我的问题是:有什么方法可以使用来对系数施加约束SGDClassifier
吗?
谢谢你的时间
SGDClassifier
在当前的实现中这是不可能的。
如果您想实现此目标,则必须添加一个惩罚,将其称为“正数”,以确保通过将无限成本置于负值上来验证此约束。
可能有可能使用例如Duchi 2009的论文来实现这一目标(但我认为,新文献中有一些后续工作可能会更胜任该工作)。在每个小批量生产中,您需要做的是投射到正向矫形器上。只需将所有logistic损失中的负值在梯度步骤后发生的负值设置为0,即可完成此操作。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句