使用libSVM的SVM中的数据不平衡

Arturo 发表于 Dev

阿图罗

当我使用由75％的“ true”标签和25％的“ false”标签组成的不平衡数据集时，如何在libSVM中设置gamma和Cost参数？由于数据不平衡，将所有预测标签都设置为“ True”时经常出现错误。

如果问题不是libSVM，而是我的数据集，那么我应该如何从理论机器学习的角度处理这种不平衡？*我正在使用的功能数量在4到10之间，而我只有250个数据点。

Lejlot

类的不平衡与C和gamma的选择无关，要解决此问题，您应该使用类加权方案，例如，在scikit-learn程序包（基于libsvm）中可用

最好选择C和gamma使用具有交叉验证网格搜索执行。您应该在此处尝试广泛的值范围，因为C在之间选择值是合理的1，10^15而gamma范围值的简单而有效的启发方法是计算所有数据点之间的成对距离，并根据此分布的百分位数选择伽玛-考虑一下在每个点中放置一个方差等于1/gamma-的高斯分布，如果选择gamma该分布以使许多点重叠，则会得到非常“平滑”的模型，而使用较小的方差会导致过度拟合。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2020-11-28

我来说两句

0条评论

登录后参与评论

上一篇：删除多余的空间并在极坐标图的边缘敲响

来自分类Dev

Related 相关文章

文章

使用libSVM的SVM中的数据不平衡

使用libSVM的SVM中的数据不平衡

使用TensorFlow训练不平衡数据

带有不平衡数据的SKlearn SVM RBF

如何平衡不平衡的面板数据？

根据不平衡数据在ggplot中创建重叠直方图

在Spark MLlib中处理不平衡的数据集

如何处理R中不平衡的数据集？

SAS中不平衡数据集的滚动窗口模型

从长到宽的不平衡数据帧

iOS 8中的通话不平衡

Chrome中不平衡的CSS列

Matlab中不平衡的Anova

DEoptim中的堆栈不平衡

使用RcppParallel的堆栈不平衡

如何通过svmlight中可用的不平衡训练数据集来提供平衡训练的成本？

如何通过svmlight中可用的不平衡训练数据集来提供平衡训练的成本？

SVM硬边距：为什么数据集不平衡可能会导致不良结果？

在R中的不平衡面板数据中创建滞后变量

如何在R中的不平衡面板数据中创建自上次事件以来的时间？

Cassandra不平衡集群中现有节点上的数据

如何在Pandas数据框中为不平衡面板生成滞后变量？

如何在sklearn中对不平衡数据集执行交叉验证

r Caret软件包中的prSummary用于不平衡数据

如何在r中从长到宽传播不平衡的数据

重新采样不平衡数据集的数据框

R不平衡数据帧数据清理

来自不平衡面板数据的R样本

不平衡训练数据集和回归模型

迷你图数据帧不平衡

大型不平衡数据的机器学习模型建议