scikit中的RandomForestClassifier与ExtraTreesClassifier学习

丹森

谁能解释scikit learning中RandomForestClassifier和ExtraTreesClassifier之间的区别。我花了很多时间阅读本文:

P. Geurts,D.Ernst。和L.Wehenkel,“极随机树”,Machine Learning,63(1),3-42,2006年

看来这些是ET的区别:

1)在拆分时选择变量时,将从整个训练集中抽取样本,而不是从训练集中的引导样本中抽取样本。

2)每次从样本中的值范围中完全随机选择分割。

这两件事的结果是更多的“叶子”。

奥格里塞尔

是的,两个结论都是正确的,尽管scikit-learn中的Random Forest实现使启用或禁用引导程序重采样成为可能。

实际上,RF通常比ET更紧凑。从计算的角度来看,ET通常较便宜,但会变得更大。ET有时可以比RF更好地进行泛化,但是如果不先尝试(和进行调优n_estimatorsmax_featuresmin_samples_split通过交叉验证的网格搜索)很难猜测是什么情况

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

scikit学习RandomForestClassifier中的子样本大小

来自分类Dev

scikit-学习RandomForestClassifier中的功能重要性和森林结构如何相关?

来自分类Dev

scikit学习中的NuSVR与SVR

来自分类Dev

scikit中的OneHotEncoder混淆学习

来自分类Dev

scikit中的分类报告学习

来自分类Dev

Python中的Scikit学习更新

来自分类Dev

R中的Scikit学习样式“管道”

来自分类Dev

结合scikit学习中的随机森林模型

来自分类Dev

在scikit学习中更改数字格式

来自分类Dev

scikit-学习CountVectorizer中的TypeError

来自分类Dev

Scikit学习中的特征选择算法

来自分类Dev

Sage 7.2中的Scikit学习和熊猫

来自分类Dev

Scikit学习KNN中的规范化

来自分类Dev

SciKit中的多类逻辑回归学习

来自分类Dev

scikit-学习CountVectorizer中的TypeError

来自分类Dev

在scikit-learn中使用ExtraTreesClassifier时出错

来自分类Dev

将csv中的数据加载到Scikit中以学习SVM

来自分类Dev

将csv中的数据加载到Scikit中以学习SVM

来自分类Dev

Scikit学习MultinomialNB中的内存不足错误

来自分类Dev

在scikit学习中评估SGD分类器的收敛性

来自分类Dev

Scikit中的线性回归和梯度下降学习吗?

来自分类Dev

python scikit中更快的数据拟合(或学习)功能

来自分类Dev

如何标准化scikit学习中的排名数据?

来自分类Dev

scikit-学习CountVectorizer中的术语频率如何计算

来自分类Dev

使用Scikit学习的DictVectorizer时toarray中的MemoryError

来自分类Dev

PCA如何为scikit中的Kmeans算法中心提供学习

来自分类Dev

LassoCV如何在scikit学习分区数据中?

来自分类Dev

scikit学习管道中的后处理分类器输出

来自分类Dev

将Scikit学习中SGDRegressor的预测限制为正值

Related 相关文章

热门标签

归档