如何识别 Python 中的过拟合和欠拟合

debugcn 发表于 Dev

马赫迪莫吉米

我有一个回归模型。我写了这个算法的代码：

将 10 个训练数据随机拆分为训练数据和验证数据。从以下集合中选择最佳 alpha 值：{0.1, 1, 3, 10, 33, 100, 333, 1000, 3333, 10000, 33333}。

要选择最佳 alpha 超参数值，您必须执行以下操作：

• 对于超参数的每个值，如上所述将训练数据随机拆分为 10 次，分为训练数据和验证数据。

• 对于超参数的每个值，使用其 10 个随机分割并找到平均训练和验证准确度。

• 在图表上，绘制每个超参数设置的平均训练准确度（红色）和平均验证准确度（蓝色）。通过识别过拟合和欠拟合的区域来评论该图。

• 打印 alpha 超参数的最佳值。

2- 评估测试数据的预测性能并报告以下内容： • 最终模型中非零特征的总数。• 混淆矩阵 • 每个类别的精度、召回率和准确度。

最后，通过适当的推理讨论是否有任何欠拟合或过拟合的迹象

我写这段代码：

print('Accuracy of logistic regression classifier on test set: {:.2f}'.format(Newclassifier.score(X_test, y_test)))
from sklearn.metrics import classification_report
print(classification_report(y_test, y_pred))

我的问题是： 1- 为什么每次迭代的准确性会降低？2- 我的模型是过拟合还是欠拟合？3- 我的模型工作正常吗？

blue_note

没有官方/绝对的衡量标准来决定您是欠拟合还是过拟合。在实践中

欠拟合：你的模型太简单了。训练集和验证集之间不会有太大区别，但是它们的准确率会很低
过拟合：你的模型太复杂了。它不是学习底层模式，而是记住你的训练集。所以，训练误差会减少，但验证误差会在某个时间点后开始增加

在你的情况下，你的训练和测试错误似乎是并行的，所以你似乎没有过度拟合的问题。您的模型可能欠拟合，因此您可以尝试使用更复杂的模型。但是，这可能就是该算法在此特定训练集上的表现。在大多数实际问题中，没有算法可以达到零错误。

至于为什么你的错误会增加，我不知道这个特定的算法是如何工作的，但由于它似乎依赖于随机方法，它似乎是合理的行为。有一点起起落落，但并没有稳步增加，所以看起来没有问题。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-07-21

我来说两句

0条评论

登录后参与评论

来自分类Dev

python＆scikit：如何从高斯混合模型拟合中获得拟合模型的参数？

来自分类Dev

如何判断模型是否过拟合

来自分类Dev

如何在Python中应用分段线性拟合？

来自分类Dev

如何在python中拟合三个高斯峰？

来自分类Dev

如何使用Selenium和Python识别元素

来自分类Dev

如何在Python / Qt中识别QListWidget

来自分类Dev

如何识别python中的空查询参数？

来自分类Dev

如何识别和捕获Python列表中的特定URL元素？

来自分类Dev

如何从拟合表python进行排序

来自分类Dev

如何使用python拟合多条指数曲线

来自分类Dev

如何从python中的离散数据中获得周期性曲线拟合？

来自分类Dev

过拟合和ROC曲线

来自分类Dev

如何在Python中的某些点上拟合二次曲面？

来自分类Dev

如何在python中做一个简单的“模型拟合”？

来自分类Dev

R：如何从分布拟合中获得拟合值？

来自分类Dev

如何使用Python和Gracenote识别音乐样本？

来自分类Dev

如何识别从python中的set（）中删除的元素？

来自分类Dev

如何在python中识别时间序列中的频繁区域

来自分类Dev

如何通过 Python 中的位置从列表中识别海龟？

来自分类Dev

如何识别在Python Flask中通过AJAX发出的请求？

来自分类Dev

如何使用docx中的python-docx识别分页符

来自分类Dev

如何绕过python中的base-8数字识别？

来自分类Dev

如何在Python中识别默认方法值设置？

来自分类Dev

如何识别句子中单词的正确定义，Python？

来自分类Dev

如何从python中的短语识别并执行多个命令？

来自分类Dev

python如何使用os.popen在linux命令中识别：

来自分类Dev

如何使用python opencv中的阈值识别视频的镜头边界？

来自分类Dev

机器学习中的过拟合和噪声是什么？

来自分类Dev

在python中拟合线性变换

Related 相关文章

文章