Tensorflow model.fit()可再现性

海关
import tensorflow as tf

RANDOM_SEED_CONSTANT = 42  # FOR_REPRODUCIBILITY
tf.random.set_seed(RANDOM_SEED_CONSTANT)

# Prevent NHWC errors https://www.nuomiphp.com/eplan/en/50125.html
from tensorflow.keras import backend as K
K.set_image_data_format("channels_last")

from tensorflow import keras
from tensorflow.keras import datasets, layers, models

(train_images, train_labels), (test_images, test_labels) = datasets.cifar10.load_data()
train_images, test_images = train_images / 255.0, test_images / 255.0 # Normalize pixel values to be between 0 and 1

# Create a simple CNN
model = models.Sequential()
model.add(layers.Conv2D(32, (3, 3), activation='relu', input_shape=(32, 32, 3)))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation='relu'))
model.add(layers.Flatten())
model.add(layers.Dense(64, 
                       activation='relu', 
                       kernel_initializer=tf.keras.initializers.HeNormal(seed=RANDOM_SEED_CONSTANT)))
model.add(layers.Dense(10, 
                       kernel_initializer=tf.keras.initializers.HeNormal(seed=RANDOM_SEED_CONSTANT)))

print(model.summary())

model.compile(optimizer='adam',
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              metrics=['accuracy'])

model.save_weights('myweights.h5')

# Run1
history = model.fit(train_images, train_labels, epochs=1, 
                    shuffle=False,
                    validation_data=(test_images, test_labels))

# Run2
model.load_weights('myweights.h5')
history = model.fit(train_images, train_labels, epochs=1, 
                    shuffle=False,
                    validation_data=(test_images, test_labels))

# Run3
model.load_weights('myweights.h5')
history = model.fit(train_images, train_labels, epochs=1, 
                    shuffle=False,
                    validation_data=(test_images, test_labels))

上面的3个model.fit()调用给我以下结果:

1563/1563 [==============================] - 7s 4ms/step - loss: 1.4939 - accuracy: 0.4543 - val_loss: 1.2516 - val_accuracy: 0.5567

1563/1563 [==============================] - 6s 4ms/step - loss: 1.6071 - accuracy: 0.4092 - val_loss: 1.3857 - val_accuracy: 0.4951

1563/1563 [==============================] - 7s 4ms/step - loss: 1.5538 - accuracy: 0.4325 - val_loss: 1.3187 - val_accuracy: 0.5294

产生这种差异的原因是什么?我试图了解可能阻碍从模型再现结果的来源。除了随机种子,密集层初始化之外,我还缺少什么?

莱斯库雷尔

您测试可重复性的方法不正确。您需要关闭程序并重新运行,以查看结果是否相同。否则,运行2取决于运行1期间发生的事件,而运行3取决于运行1和2期间发生的事件。

原因是Tensorflow维护一个内部计数器来随机生成,如tf.random.set_seed重点是我的)的文档中所述

print(tf.random.uniform([1], seed=1))  # generates 'A1'
print(tf.random.uniform([1], seed=1))  # generates 'A2'

我们在上面的第二次tf.random.uniform调用中获得'A2'而不是'A1'的原因是因为TensorFlow使用相同的tf.random.uniform内核(即内部表示)对所有具有相同参数的调用,内核维护一个内部计数器,该计数器在每次执行时都会增加,从而产生不同的结果。

如果我只运行程序的第一次运行两次,然后在每次运行之间关闭程序(在这种情况下为IPython),则会得到:

In [1]: run program.py
1563/1563 [==============================] - 13s 8ms/step - loss: 1.4997 - accuracy: 0.4540 - val_loss: 1.2528 - val_accuracy: 0.5494
{'loss': [1.4996991157531738], 'accuracy': [0.4540199935436249], 'val_loss': [1.2527965307235718], 'val_accuracy': [0.5493999719619751]}
In [2]: run program.py
1563/1563 [==============================] - 12s 8ms/step - loss: 1.4997 - accuracy: 0.4540 - val_loss: 1.2528 - val_accuracy: 0.5494
{'loss': [1.4996991157531738], 'accuracy': [0.4540199935436249], 'val_loss': [1.2527965307235718], 'val_accuracy': [0.5493999719619751]}

减去执行计算所需的时间(可能会有所不同,具体取决于计算机上的负载),结果是完全相同的。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何获得可再现的结果(Keras,Tensorflow):

来自分类Dev

Tensorflow`model.fit()`打印输出

来自分类Dev

Tensorflow-model.fit中的值错误-如何修复

来自分类Dev

TensorFlow的model.fit()函数中的batchSize是多少?

来自分类Dev

Tensorflow中带有model.fit的InvalidArgumentError

来自分类Dev

当调用tf.keras.model.fit时,Tensorflow 2.0不会迭代整个数据集

来自分类Dev

如何在Kaggle Notebook中的GPU上运行Tensorflow的Keras model.fit()函数?

来自分类Dev

Python Tensorflow-多次运行model.fit而不重新初始化模型

来自分类Dev

Tensorflow:Model.fit()InvalidArgumentError:索引[28,13] = -2147483648不在[0,1193514)

来自分类Dev

TensorFlow GradCAM-model.fit()-ValueError:形状(None,1)和(None,2)不兼容

来自分类Dev

Tensorflow 2.0:如何从MapDataset(从TFRecord读取后)转换为可以输入到model.fit的某些结构

来自分类Dev

Tensorflow(Keras API)`model.fit`方法返回“无法将类型<class'tuple'>的对象转换为Tensor”错误

来自分类Dev

tensorflow中的model.evaluate()如何工作?

来自分类Dev

TensorFlow`fit()`方法上的`AssertionError`

来自分类Dev

在TensorFlow Udacity课程中找不到sklearn.linear_model

来自分类Dev

ImageNet (Inception v3) model missing from Anaconda Tensorflow?

来自分类Dev

Tensorflow Keras load_model来自内存还是变量?

来自分类Dev

如何修复“ model.predict不是函数”(tensorflow.js)?

来自分类Dev

使用带有ssl配置的tensorflow_model_server

来自分类Dev

转换TensorFlow模型时的OpenVino Model Optimizer错误

来自分类Dev

为什么model.get_weights()为空Tensorflow错误?

来自分类Dev

(Windows 上的 TensorFlow)ImportError:无法导入名称“model_analyzer”

来自分类Dev

如何查询在 tensorflow_model_server 上运行的 REST API?

来自分类Dev

何时在Tensorflow中使用model.predict(x)vs model(x)

来自分类Dev

将model.fit_generator转换为model.fit

来自分类Dev

可重用的Tensorflow卷积网络

来自分类Dev

Tensorflow:可训练变量掩蔽

来自分类Dev

如何将自定义数据生成器输入到model.fit中,该生成器生成X,y和一个附加数组到tensorflow.keras模型中?

来自分类Dev

model.predict()和model.fit()有什么作用?

Related 相关文章

  1. 1

    如何获得可再现的结果(Keras,Tensorflow):

  2. 2

    Tensorflow`model.fit()`打印输出

  3. 3

    Tensorflow-model.fit中的值错误-如何修复

  4. 4

    TensorFlow的model.fit()函数中的batchSize是多少?

  5. 5

    Tensorflow中带有model.fit的InvalidArgumentError

  6. 6

    当调用tf.keras.model.fit时,Tensorflow 2.0不会迭代整个数据集

  7. 7

    如何在Kaggle Notebook中的GPU上运行Tensorflow的Keras model.fit()函数?

  8. 8

    Python Tensorflow-多次运行model.fit而不重新初始化模型

  9. 9

    Tensorflow:Model.fit()InvalidArgumentError:索引[28,13] = -2147483648不在[0,1193514)

  10. 10

    TensorFlow GradCAM-model.fit()-ValueError:形状(None,1)和(None,2)不兼容

  11. 11

    Tensorflow 2.0:如何从MapDataset(从TFRecord读取后)转换为可以输入到model.fit的某些结构

  12. 12

    Tensorflow(Keras API)`model.fit`方法返回“无法将类型<class'tuple'>的对象转换为Tensor”错误

  13. 13

    tensorflow中的model.evaluate()如何工作?

  14. 14

    TensorFlow`fit()`方法上的`AssertionError`

  15. 15

    在TensorFlow Udacity课程中找不到sklearn.linear_model

  16. 16

    ImageNet (Inception v3) model missing from Anaconda Tensorflow?

  17. 17

    Tensorflow Keras load_model来自内存还是变量?

  18. 18

    如何修复“ model.predict不是函数”(tensorflow.js)?

  19. 19

    使用带有ssl配置的tensorflow_model_server

  20. 20

    转换TensorFlow模型时的OpenVino Model Optimizer错误

  21. 21

    为什么model.get_weights()为空Tensorflow错误?

  22. 22

    (Windows 上的 TensorFlow)ImportError:无法导入名称“model_analyzer”

  23. 23

    如何查询在 tensorflow_model_server 上运行的 REST API?

  24. 24

    何时在Tensorflow中使用model.predict(x)vs model(x)

  25. 25

    将model.fit_generator转换为model.fit

  26. 26

    可重用的Tensorflow卷积网络

  27. 27

    Tensorflow:可训练变量掩蔽

  28. 28

    如何将自定义数据生成器输入到model.fit中,该生成器生成X,y和一个附加数组到tensorflow.keras模型中?

  29. 29

    model.predict()和model.fit()有什么作用?

热门标签

归档