使用libSVM的SVM中的数据不平衡

阿图罗

当我使用由75%的“ true”标签和25%的“ false”标签组成的不平衡数据集时,如何在libSVM中设置gamma和Cost参数?由于数据不平衡,将所有预测标签都设置为“ True”时经常出现错误。

如果问题不是libSVM,而是我的数据集,那么我应该如何从理论机器学习的角度处理这种不平衡?*我正在使用的功能数量在4到10之间,而我只有250个数据点。

Lejlot

类的不平衡与C和gamma的选择无关,要解决此问题,您应该使用类加权方案,例如,在scikit-learn程序包(基于libsvm)中可用

最好选择Cgamma使用具有交叉验证网格搜索执行。您应该在此处尝试广泛的值范围,因为C在之间选择值是合理的110^15gamma范围值的简单而有效的启发方法是计算所有数据点之间的成对距离,并根据此分布的百分位数选择伽玛-考虑一下在每个点中放置一个方差等于1/gamma-的高斯分布,如果选择gamma该分布以使许多点重叠,则会得到非常“平滑”的模型,而使用较小的方差会导致过度拟合。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

使用TensorFlow训练不平衡数据

来自分类Dev

带有不平衡数据的SKlearn SVM RBF

来自分类Dev

如何平衡不平衡的面板数据?

来自分类Dev

根据不平衡数据在ggplot中创建重叠直方图

来自分类Dev

在Spark MLlib中处理不平衡的数据集

来自分类Dev

如何处理R中不平衡的数据集?

来自分类Dev

SAS中不平衡数据集的滚动窗口模型

来自分类Dev

从长到宽的不平衡数据帧

来自分类Dev

iOS 8中的通话不平衡

来自分类Dev

Chrome中不平衡的CSS列

来自分类Dev

Matlab中不平衡的Anova

来自分类Dev

DEoptim中的堆栈不平衡

来自分类Dev

使用RcppParallel的堆栈不平衡

来自分类Dev

如何通过svmlight中可用的不平衡训练数据集来提供平衡训练的成本?

来自分类Dev

如何通过svmlight中可用的不平衡训练数据集来提供平衡训练的成本?

来自分类Dev

SVM硬边距:为什么数据集不平衡可能会导致不良结果?

来自分类Dev

在R中的不平衡面板数据中创建滞后变量

来自分类Dev

如何在R中的不平衡面板数据中创建自上次事件以来的时间?

来自分类Dev

Cassandra不平衡集群中现有节点上的数据

来自分类Dev

如何在Pandas数据框中为不平衡面板生成滞后变量?

来自分类Dev

如何在sklearn中对不平衡数据集执行交叉验证

来自分类Dev

r Caret软件包中的prSummary用于不平衡数据

来自分类Dev

如何在r中从长到宽传播不平衡的数据

来自分类Dev

重新采样不平衡数据集的数据框

来自分类Dev

R不平衡数据帧数据清理

来自分类Dev

来自不平衡面板数据的R样本

来自分类Dev

不平衡训练数据集和回归模型

来自分类Dev

迷你图数据帧不平衡

来自分类Dev

大型不平衡数据的机器学习模型建议

Related 相关文章

热门标签

归档