是否sklearn.LinearRegression
支持在线/增量学习?
我有100组数据,我正在尝试完全实现它们。对于每个组,有超过10000个实例和〜10个功能,因此如果我构建一个巨大的矩阵(10 ^ 6 x 10),则会导致sklearn出现内存错误。如果我每次都能用新组的批处理样本更新回归器,那就太好了。
我发现这篇文章很相关,但是可以接受的解决方案适用于使用单个新数据(仅一个实例)而不是批处理样本的在线学习。
看一看linear_model.SGDRegressor
,它使用随机梯度学习线性模型。
总体而言,sklearn有许多模型可以接受“ partial_fit
”,它们在不适合RAM的中型到大型数据集上都非常有用。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句