在 tensorflow 中重新初始化迭代器后打乱数据集

debugcn 发表于 Dev

一、A

我正在使用 tensorflow 数据集 api 将数据输入模型。据我所知，我应该打乱数据集以实现模型的最佳性能。但是，由于我正在训练一个时期，然后测试一个时期等等......我不太确定我是否以不同的方式执行洗牌。为了更好地说明，下面是我的代码：

train_dataset = tf.data.TFRecordDataset(filename_train).map(_parse_function).filter(filter_examples)\
            .shuffle(60000, seed=mseed, reshuffle_each_iteration=False) \
            .batch(train_batch_size)
train_iterator = train_dataset.make_initializable_iterator(shared_name="Training_iterator")

因此，每当我使用整个数据集时，我都会将迭代器重新初始化为：

sess.run(train_iterator.initializer)

那安全吗？我问是因为在训练时我得到了以下损失函数的形状

因此，不同时期之间的洗牌是确定性的吗？

请注意，我使用种子shuffle只是为了使结果在不同的代码运行之间可重现。

鲨鱼

种子影响整个默认图表。通过设置种子，您可以确定洗牌，这意味着每次洗牌都会保持相同的顺序。所以是的，您将在第二个时代获得相同的订单。您还可以为种子设置占位符并在每个时期更改它，更多关于这里https://github.com/tensorflow/tensorflow/issues/13446没有种子改组成为伪随机

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-07-24

我来说两句

0条评论

登录后参与评论

来自分类Dev

Related 相关文章

文章

在 tensorflow 中重新初始化迭代器后打乱数据集

在 tensorflow 中重新初始化迭代器后打乱数据集

在Tensorflow中重新初始化变量

初始化后如何覆盖tensorflow变量？

动态确定在 TensorFlow 中初始化变量的张量

TensorFlow：变量初始化中的“尝试使用未初始化的值”

Tensorflow shuffle 迭代器

Tensorflow 的占位符初始化与 tensorflow 的常量初始化不同。为什么？

Tensorflow 数据集使用

Python Tensorflow-多次运行model.fit而不重新初始化模型

Tensorflow：重新训练期间的预训练嵌入初始化问题

在Tensorflow中过滤数据

如何在TensorFlow上进行Xavier初始化

TensorFlow初始化一个的Tensor

Tensorflow 2.0 stack（）引发未初始化的张量错误

Tensorflow：初始化串联张量的正确方法？

LSTMCell单元中的权重是如何在TensorFlow中初始化的

在 tensorflow 中读取 SVHN 数据集

Tensorflow 数据集 api 问题

什么时候必须在Tensorflow中初始化变量？

为什么设置初始化值会阻止在TensorFlow中的GPU上放置变量？

TensorFlow中有什么方法可以初始化未初始化的变量吗？

安装tensorflow后的消息

Tensorflow初始重新训练：创建瓶颈文件

TensorFlow：取消池化

Pandas数据框，TensorFlow数据集：在哪里进行TensorFlow令牌化步骤？

Tensorflow 2.0数据集和数据加载器

Tensorflow中的多维聚集

TensorFlow中的序列标记

TensorFlow中的缓存计算

TensorFlow中的索引矩阵