是什么导致训练准确性大幅度提高以及各个时期之间的损失？

debugcn 发表于 Dev

朝鲜人

在python中使用Tensorflow 2.0训练神经网络时，我注意到训练准确性和损失在各个时期之间发生了巨大变化。我知道打印的度量标准是整个时期的平均值，但是每次平均值之后，准确性似乎都会大大下降，尽管平均值总是在增加。

损失也表现出这种行为，每个时期显着下降，但平均值增加。这是我的意思的图片（来自Tensorboard）：

我已经在自己实现的所有模型中都注意到了这种行为，所以这可能是一个错误，但是我想对这种行为是否正常以及是否是正常行为有其他看法？

Also, I'm using a fairly large dataset (roughly 3 million examples). Batch size is 32 and each dot in the accuracy/loss graphs represent 50 batches (2k on the graph = 100k batches). The learning rate graph is 1:1 for batches.

ChosunOne

It seems this phenomenon comes from the fact that the model has a high batch-to-batch variance in terms of accuracy and loss. This is illustrated if I take a graph of the model with the actual metrics per step as opposed to the average over the epoch:

Here you can see that the model can vary widely. (This graph is just for one epoch, but the fact remains).

Since the average metrics were being reported per epoch, at the beginning of the next epoch it is highly likely that the average metrics will be lower than the previous average, leading to a dramatic drop in the running average value, illustrated in red below:

如果您将红色图表中的不连续性想象为历时的过渡，那么您会明白为什么会在问题中观察到这种现象。

TL; DR对于每个批次，模型的输出差异很大。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-04-1

我来说两句

0条评论

登录后参与评论

来自分类Dev

Related 相关文章

文章

是什么导致训练准确性大幅度提高以及各个时期之间的损失？

是什么导致训练准确性大幅度提高以及各个时期之间的损失？

什么代表了 Keras 中训练结果的损失或准确性

为什么训练准确性没有提高？

验证损失和准确性提高

ConvNet：验证损失并未大幅减少，但准确性正在提高

什么是训练准确性和训练损失？为什么我们需要计算它们？

如何提高模型损失和准确性？

Keras / Tensoflow训练期间报告的“准确性”是什么意思？

为什么我的Tensorflow Keras模型在训练时会输出奇怪的损失和准确性值？

验证准确性和验证损失几乎在每个时期都保持恒定

提高SVM的准确性

当我训练我的Caffe模型时，损失总是保持很大的值，并且准确性并没有提高。

训练准确性好，但验证准确性差

在训练阶段，我的CNN验证准确性和损失函数的行为怪异

CNN准确性与损失选择

损失或准确性没有变化

训练模型字符识别的准确性并未提高

提高缩小图像的准确性

辍学层将提高准确性

随机森林提高准确性

提高QR码读取的准确性

训练CNN后准确性低

为什么将官方Keras mnist示例的非常简单的移植到tensorflow 2.x会导致准确性大幅下降？

比较模型之间的AUC，对数损失和准确性得分

为什么并行化会如此大幅度地降低性能？

为什么并行化会如此大幅度地降低性能？

为什么我的损失和准确性图有些不稳定？

Tensorflow二进制分类训练的损失不会减少，准确性会保持在50％左右

为什么数据增强不能提高CNN中纹理分类的准确性？

如何在深度学习中提高准确性和验证准确性