有人可以解释如何将oob_decision_function_属性用于python SciKit随机森林分类器吗?我想用它来绘制学习曲线,将训练和验证误差与不同训练集大小进行比较,以识别过度拟合和其他问题。似乎找不到有关如何执行此操作的任何信息。
您可以将自定义评分功能传递scoring
给模型评估字段中的任何参数,它需要具有签名classifier, X, y_true -> score
。
对于您的情况,您可以使用类似
from sklearn.learning_curve import learning_curve
learning_curve(r, X, y, cv=3, scoring=lambda c,x,y: c.oob_score_)
这将针对不同的训练集大小计算3倍交叉验证的oob分数。顺便说一句,我认为您不应该过度适应随机森林,这是它们的好处之一。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句