提高二元分类模型的准确性

猎莓

所以,我正在研究一个基本的机器学习算法,作为一个更大项目的一部分。在本节中,我试图教机器使用两组数据,一组仅包含一个特征的较小数据集,另一组使用六个特征的较大数据集。这两者都可以在下面看到。

大数据集

小数据集

“标志”是我试图预测的。标志 0 表示真实/正常数据,而标志 1 表示“异常”数据。那么,我的目标是允许预测“异常”数据输入。从照片中可以看出,用于这些目的的“异常”数据与之前的数据点相比发生了重大变化。问题是,计算机只预测了我插入数据的 450 个左右“假”数据中的 80 个。第二个问题是计算机对某些数据进行了错误分类,将某些真实数据称为假数据。

我现在一直在对小数据集进行大部分测试,只是为了让一切正常。我正在使用 XGBoost 算法,n_estimators 等于 1000,学习率为 0.05。代码非常简单。

data = pd.read_csv('final_angles.csv')
data.dropna(axis=0, subset=['steering_angle'], inplace=True)
y = data.flag
X = data.drop(['flag', 'frame_id'], axis=1)
train_X, test_X, train_y, test_y = train_test_split(X.as_matrix(), y.as_matrix(), test_size=0.25, shuffle=False)

my_model = XGBRegressor(n_estimators=1000, learning_rate=0.05) 
my_model.fit(train_X, train_y, early_stopping_rounds=5, 
             eval_set=[(test_X, test_y)], verbose=False)

predictions = my_model.predict(test_X)

如果预测值超过 0.5,任何东西都被认为是“假的”或“异常的”。

例如,这是我生产的:

文件中有 457 节“假”数据。我们猜测 108 个数据点是假的。其中只有 69 个实际上是假的。我们得到了 457 个中的 69 个(0.15098468271334792)。

我可以做些什么来改善结果?我可能想过改变算法,虽然我不知道它会有多大帮助。使用随机森林或其他东西是否有帮助,或者可能会更多地调整参数?我愿意接受任何想法。

Yuan JI

我不会说改变算法/搜索超参数会显着提高分类性能。

在我看来,你应该处理你的数据

在您的数据中,机器看到的是行数据,但是您说决定 flag 值的因素是与先前数据点实质性变化

所以你应该考虑:

  • 尝试使用适用于时间序列数据的算法
  • 或者尝试进行一些特征工程,以便机器能够在每一行/行中查看与前一行/行相比变化是否显着

以下是一些有用的链接:

如何对运动数据(时间序列)进行实时分类

使用来自传感器的时间序列数据进行 ML

如何训练模型从多维时间序列预测 30 分钟前的事件

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

二元分类模型不准确

来自分类Dev

验证准确性如何决定使用 Keras 进行二元分类中哪个类是正确的?

来自分类Dev

提高多类别图像分类器的准确性

来自分类Dev

如何提高模型损失和准确性?

来自分类Dev

提高WEKA多层感知器模型的准确性

来自分类Dev

一类分类-解释模型的准确性

来自分类Dev

提高SVM的准确性

来自分类Dev

二项式glmer()预测的分类准确性

来自分类Dev

为什么数据增强不能提高CNN中纹理分类的准确性?

来自分类Dev

如何在Keras中提高CNN分类器的准确性?

来自分类Dev

神经网络模型无法提高准确性。缩放问题或模型问题?

来自分类Dev

提高缩小图像的准确性

来自分类Dev

辍学层将提高准确性

来自分类Dev

验证损失和准确性提高

来自分类Dev

随机森林提高准确性

来自分类Dev

提高QR码读取的准确性

来自分类Dev

计算分类准确性的最佳方法?

来自分类Dev

计算分类准确性的最佳方法?

来自分类Dev

最佳的神经元和神经层大小,以提高准确性和效率

来自分类Dev

如何在Scikit python中提高逻辑回归的模型准确性?

来自分类Dev

如何使用sklearn从决策树模型提高预测的准确性?

来自分类Dev

仅当验证准确性提高时,如何才能保存/覆盖我的TensorFlow / Keras模型?

来自分类Dev

训练模型字符识别的准确性并未提高

来自分类Dev

如何提高模型的准确性?(猫vs狗图像识别)

来自分类Dev

Keras二进制分类器教程示例仅提供50%的验证准确性

来自分类Dev

多个二元分类器组合

来自分类Dev

客户旅程的二元分类

来自分类Dev

Keras的CNN模型的准确性差

来自分类Dev

如何在深度学习中提高准确性和验证准确性

Related 相关文章

热门标签

归档