Logistic回归-class_weight平衡vs dict参数

在这里1

当使用sklearn LogisticRegression函数对不平衡训练数据集进行二进制分类时(例如85%pos类vs 15%neg类),将class_weight参数设置为'balanced'与将其设置为{0:0.15,1: 0.85}?根据文档,在我看来,使用'balanced'参数将提供与提供字典相同的功能。

class_weight

“平衡”模式使用y的值自动将权重与输入数据中的类频率成反比地调整为n_samples /(n_classes * np.bincount(y))。

IMB

是的,意思是一样的。使用该class_weight='balanced参数,您无需传递确切的数字,就可以自动进行平衡。

您可以在此链接中看到更详细的说明:

https://scikit-learn.org/dev/glossary.html#term-class-weight

确认下一个属性的相似性:

  • class_weight ='平衡'
  • class_weight = {0:0.5,1:0.5}
  • class_weight =无

我已经产生了这个实验:

from sklearn.datasets import load_iris
from sklearn.linear_model import LogisticRegression

X, y = load_iris(return_X_y=True)
clf_balanced = LogisticRegression(class_weight='balanced', random_state=0).fit(X, y)
clf_custom = LogisticRegression(class_weight={0:0.5,1:0.5}, random_state=0).fit(X, y)
clf_none = LogisticRegression(class_weight=None, random_state=0).fit(X, y)

print('Balanced:',clf_balanced.score(X, y))
print('Custom:',clf_custom.score(X, y))
print('None:',clf_none.score(X, y))

输出是:

Balanced: 0.9733333333333334
Custom:   0.9733333333333334
None:     0.9733333333333334

因此,我们可以凭经验得出结论,它们是相同的。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类常见问题

scikit-learn中的class_weight参数如何工作?

来自分类Dev

如何解释Weka Logistic回归输出?

来自分类Dev

Python SKLearn Logistic回归中的虚拟变量

来自分类Dev

在Logistic回归中微调参数

来自分类Dev

Matlab中的Logistic回归梯度下降

来自分类Dev

在R中绘制Logistic回归

来自分类Dev

使用OCTAVE的梯度下降进行Logistic回归

来自分类Dev

sklearn的Logistic回归功能

来自分类Dev

Logistic回归:出现奇怪的变量

来自分类Dev

R-Logistic回归-稀疏矩阵

来自分类Dev

statsmodels logistic回归类型问题

来自分类Dev

在Scikit Learn中控制Logistic回归的阈值

来自分类Dev

Logistic函数用于回归克里金法

来自分类Dev

Scikit了解Logistic回归的困惑

来自分类Dev

scikit-learn:随机森林的class_weight和sample_weight参数

来自分类Dev

统计模型Logistic回归类不平衡

来自分类Dev

python logistic回归(入门)

来自分类Dev

Logistic回归和Softmax回归之间的区别

来自分类Dev

class_weight =幼稚贝叶斯等效的“平衡”

来自分类Dev

LinearSVC中参数class_weight的最佳值是多少?

来自分类Dev

建立股票的Logistic回归模型

来自分类Dev

在svm.scv()中同时使用“ class_weight”和“ c”参数时会发生什么?

来自分类Dev

使用class_weight平衡数据-.fit_generator()

来自分类Dev

在R中绘制Logistic回归

来自分类Dev

R中的glm logistic回归

来自分类Dev

sklearn Python和Logistic回归

来自分类Dev

Logistic回归中的错误图

来自分类Dev

随机森林中的 class_weight 超参数改变了混淆矩阵中的样本数量

来自分类Dev

什么 SKLearn 分类器带有 class_weight 参数

Related 相关文章

热门标签

归档