我现在正在运行以下代码,使用 ML 库中的分类器:
val decisionTree = new DecisionTreeClassifier().setLabelCol("label").setFeaturesCol("features").setMaxDepth(7).setImpurity("gini")
val model = decisionTree.fit(df3)
val prediction = model.transform(df3)
为什么我的单个决策树使用 randomForest 方法,我做错了什么?还有为什么有些任务与其他任务相比真的很长?(如果我可以做些什么来加快速度,我想知道)
ML 文档没有提供太多关于这个的信息......
随机森林是决策树的集合
所以这与决策树相同。如果您将最大深度从 7 调整为 1,则花费的时间会更少,但会出现欠拟合。它也基于内存大小。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句