scikit-learn:随机森林的class_weight和sample_weight参数

用户名

我有一个类不平衡问题,并且正在使用scikit-learn(> = 0.16)中的实现进行加权随机森林实验。

我注意到,该实现在树构造函数中使用class_weight参数,在fit方法中采用sample_weight参数来帮助解决类不平衡问题。尽管这两个决定最终的权重,但两者似乎相乘。

我无法理解以下内容:

  • 在树的构造/训练/预测的哪个阶段使用这些权重?我看过一些有关加权树的论文,但是我不确定scikit会实现什么。
  • class_weight和sample_weight之间到底有什么区别?
安德烈斯

RandomForests建立在很好的树上。检查树木如何使用样本权重:

  • 决策树用户指南-准确说明所使用的算法
  • 决策树API-解释树木如何使用sample_weight(您确定的随机森林是class_weight和sample_weight的乘积)。

至于class_weight之间的区别sample_weight:可以简单地通过其数据类型的性质来确定。sample_weight是一维length数组,n_samples为用于训练的每个示例分配明确的权重。class_weight是每个类别的字典,具有该类别的统一权重(例如{1:.9, 2:.5, 3:.01}),或者是一个字符串,告诉sklearn如何自动确定该字典。

因此,对于一个给定的例子训练重量是它的产品的明确指定的sample_weight(或者1,如果sample_weight没有提供),以及它的class_weight(或者1,如果class_weight未提供)。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类常见问题

scikit-learn中的class_weight参数如何工作?

来自分类Dev

使用scikit-learn消除随机森林上的递归特征

来自分类Dev

导出Scikit Learn随机森林以在Hadoop平台上使用

来自分类Dev

结合scikit学习中的随机森林模型

来自分类Dev

为什么scikit-learn的随机森林使用这么多内存?

来自分类Dev

scikit学习随机森林的输入

来自分类Dev

使用scikit随机森林sample_weights

来自分类Dev

scikit-learn 0.15上带有class_weight = auto的SGDClassifier失败,但不是0.14

来自分类Dev

使用scikit-learn并行生成随机森林

来自分类Dev

.arff文件与scikit-learn?

来自分类Dev

如何在scikit-learn中保存一个随机森林?

来自分类Dev

Python scikit-learn-TypeError

来自分类Dev

scikit-learn中的“ verbose”参数

来自分类Dev

scikit-learn中SGDClassifier的正则化参数和迭代

来自分类Dev

Scikit Learn中的交叉验证

来自分类Dev

scikit-learn / python中带有字符的随机森林

来自分类Dev

SciKit-Learn随机森林子样本大小如何等于原始训练数据大小?

来自分类Dev

在随机森林模型(Python,scikit-learn)中访问单个树的底层(tree_)对象

来自分类Dev

scikit-learn和sklearn之间的区别

来自分类Dev

如何在Python scikit-learn中从随机森林中的每棵树输出回归预测?

来自分类Dev

scikit-learn StratifiedKFold实现

来自分类Dev

scikit随机森林的使用sample_weights

来自分类Dev

使用scikit-learn消除随机森林上的递归特征

来自分类Dev

Scikit Learn中的距离指标

来自分类Dev

SciKit-Learn:使用随机森林时的 JoblibException

来自分类Dev

输出 Scikit Learn OLS 报告

来自分类Dev

随机森林中的 class_weight 超参数改变了混淆矩阵中的样本数量

来自分类Dev

scikit-learn:最近的邻居

来自分类Dev

Scikit-learn 导入约定

Related 相关文章

  1. 1

    scikit-learn中的class_weight参数如何工作?

  2. 2

    使用scikit-learn消除随机森林上的递归特征

  3. 3

    导出Scikit Learn随机森林以在Hadoop平台上使用

  4. 4

    结合scikit学习中的随机森林模型

  5. 5

    为什么scikit-learn的随机森林使用这么多内存?

  6. 6

    scikit学习随机森林的输入

  7. 7

    使用scikit随机森林sample_weights

  8. 8

    scikit-learn 0.15上带有class_weight = auto的SGDClassifier失败,但不是0.14

  9. 9

    使用scikit-learn并行生成随机森林

  10. 10

    .arff文件与scikit-learn?

  11. 11

    如何在scikit-learn中保存一个随机森林?

  12. 12

    Python scikit-learn-TypeError

  13. 13

    scikit-learn中的“ verbose”参数

  14. 14

    scikit-learn中SGDClassifier的正则化参数和迭代

  15. 15

    Scikit Learn中的交叉验证

  16. 16

    scikit-learn / python中带有字符的随机森林

  17. 17

    SciKit-Learn随机森林子样本大小如何等于原始训练数据大小?

  18. 18

    在随机森林模型(Python,scikit-learn)中访问单个树的底层(tree_)对象

  19. 19

    scikit-learn和sklearn之间的区别

  20. 20

    如何在Python scikit-learn中从随机森林中的每棵树输出回归预测?

  21. 21

    scikit-learn StratifiedKFold实现

  22. 22

    scikit随机森林的使用sample_weights

  23. 23

    使用scikit-learn消除随机森林上的递归特征

  24. 24

    Scikit Learn中的距离指标

  25. 25

    SciKit-Learn:使用随机森林时的 JoblibException

  26. 26

    输出 Scikit Learn OLS 报告

  27. 27

    随机森林中的 class_weight 超参数改变了混淆矩阵中的样本数量

  28. 28

    scikit-learn:最近的邻居

  29. 29

    Scikit-learn 导入约定

热门标签

归档