同时读取同一PyTorch torchvision.datasets对象

debugcn 发表于 Dev

请考虑以下代码，以从中获取数据进行训练torchvision.datasets并为其创建数据集DataLoader。

import torch
from torchvision import datasets, transforms

training_set_mnist = datasets.MNIST('./mnist_data', train=True, download=True)
train_loader_mnist = torch.utils.data.DataLoader(training_set_mnist, batch_size=128,
                                                 shuffle=True)

假设有几个Python进程可以访问该文件夹./mnist_data并同时执行上述代码；在我的情况下，每个进程都是群集上的不同机器，数据集存储在每个人都可以访问的NFS位置。您可能还假定数据已经下载到此文件夹中，因此download=True应该无效。而且，每个进程都可以使用设置的不同种子torch.manual_seed()。

我想知道PyTorch是否允许这种情况。我主要关心的是上面的代码是否可以更改数据文件夹或文件，./mnist_data以便如果由多个进程运行，则有可能导致意外行为或其他问题。另外，假设shuffle=True我希望两个或多个进程尝试创建DataLoader它们，那么假设种子不同，则每个进程都会得到不同的数据改组。这是真的？

希蒙·马斯凯（Szymon Maszke）

我主要关心的是上面的代码是否可以更改./mnist_data中的数据文件夹或文件，以便如果由多个进程运行，则有可能导致意外行为或其他问题。

您会很好的，因为进程仅读取数据，而不进行修改（如果为，则将数据加载tensors到RAM中MNIST）。请注意，进程不共享内存地址，因此tensor数据将被多次加载（对于来说，这不是一个大问题MNIST）。

另外，假设shuffle=True我希望两个或多个进程尝试创建DataLoader，则假定种子不同，每个进程都会得到不同的数据改组。

shuffle=True 与数据本身无关。它能做什么，是不是得到__len__()的提供dataset，生产一系列[0, __len__())与这个范围洗牌，用于索引dataset的__getitem__。请查看本节以获取有关的更多信息Samplers。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-04-5

我来说两句

0条评论

登录后参与评论

来自分类Dev

Related 相关文章

文章

同时读取同一PyTorch torchvision.datasets对象

同时读取同一PyTorch torchvision.datasets对象

从pytorch的torchvision.datasets在Colab中下载“ MINST”

从pytorch的torchvision.datasets在Colab中下载“ MINST”

如何从torchvision.datasets.ImageFolder获取n个图像

torchvision.datasets.cifar.CIFAR10 是否是列表？

尝试在计算机上使用“ torchvision.datasets”下载CIFAR10数据集

将Torchvision ImageFolder与测试集一起使用

java多线程两个线程尝试同时从同一对象输入流中读取object（）

使用PyTorch和TorchVision对自定义数据集进行训练有效测试拆分

如何制作类似Torchvision数据集的自定义pytorch数据集？

同时从同一SslStream读取？

对同一对象同时使用映射和列表

在同一图像张量上两次使用torchvision.utils.save_image会使第二次保存不起作用。这是怎么回事？

无法安装pip install torchvision

如何使用Torchvision的导入数据集访问MNIST数据的各个数据点并从火车组对象检查其大小，形状等

如何在对象位于同一位置的同时旋转画布对象

以下对象被'package：datasets'屏蔽：

并发线程可以同时检查同一对象锁吗？

SVG animateTransform同时旋转和缩放同一对象？

Firebase-多个用户使用其旧值同时更新同一对象

AWS s3同时移动同一对象

在python中同时生成同一对象的多个实例

SVG animateTransform同时旋转和缩放同一对象？

同一只熊猫DatetimeIndex对象中具有不同时区的时间戳？

WPF中同一对象上的两个动画同时进行

在保持串行读取的同时压缩一系列JSON对象？

在保持串行读取的同时压缩一系列JSON对象？

无法从torchvision.models.resnet导入“ BasicBlock”

可以使用同一文件对象多次读取文件吗？

Java多个对象读取同一文件的不同部分