在Python中对大图像数据集进行多处理

debugcn 发表于 Dev

围棋

我有一个非常大的图像数据集（> 50G，一个文件夹中的单个图像）用于训练，为了使图像的加载更加高效，我首先将部分图像加载到RAM中，然后将小批量的图像发送到GPU进行训练。

我想进一步加快数据准备过程，然后再将图像提供给GPU，并正在考虑进行多处理。但是我不确定应该怎么做，有什么想法吗？

奥德诺格

为了提高速度，我建议您使用HDF5或LMDB：

我已成功使用ml-pyxis使用LMDB创建深度学习数据集。

它允许创建二进制Blob（LMDB），并且可以非常快速地读取它们。上面的链接带有一些有关如何创建和读取数据的简单示例。包括python generators / iteratos

对于多处理：

我亲自与Keras一起工作，通过使用python生成器，可以使用fit_generator方法对数据进行多重处理。

fit_generator(self, generator, samples_per_epoch,
              nb_epoch, verbose=1, callbacks=[],
              validation_data=None, nb_val_samples=None,
              class_weight={}, max_q_size=10, nb_worker=1,
              pickle_safe=False)

使模型适合Python生成器逐批生成的数据。生成器与模型并行运行以提高效率。例如，这使您可以并行地对CPU上的图像进行实时数据增强，从而在GPU上训练模型。您可以在此处找到源代码，并在此处找到文档。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-07-4

我来说两句

0条评论

登录后参与评论

来自分类Dev

Python中的多处理图像批处理流和处理

来自分类Dev

在python多处理中从子进程返回大对象

来自分类Dev

使用Python进行多处理？

来自分类Dev

在没有Parallel Processing Toolkit的情况下在MATLAB中对非常大的图像集进行图像处理的并行化

来自分类Dev

在python中对具有多个参数的函数进行多处理

来自分类Dev

Python多处理大量数据

来自分类Dev

使用Python处理图像以进行图像测验（大像素区域）

来自分类Dev

Python 中的 Spider/Scraper，从多处理插入数据

来自分类Dev

对象中的Python多处理

来自分类Dev

python moviepy中的多处理

来自分类Dev

Flask中的Python多处理

来自分类Dev

对象中的Python多处理

来自分类Dev

使用 Pool() 进行 Python 多处理

来自分类Dev

python中的多处理（从for循环转到for循环的多处理）

来自分类Dev

在Python中对图像进行动画处理

来自分类Dev

在hadoop中实时处理非常大的数据集

来自分类Dev

在Python中分析来自连续输入流的数据（记录），进行多处理？

来自分类Dev

正确使用多处理程序进行图像下载

来自分类Dev

有什么方法可以将JSON文件与python中的数据集（图像）进行匹配

来自分类Dev

在Python中进行多处理以处理参数列表

来自分类Dev

python中需要与多处理器进行同步吗？

来自分类Dev

Python中多处理的内存错误

来自分类Dev

python多处理中的调试错误

来自分类Dev

Python中的多处理HTTP获取请求

来自分类Dev

在python中多处理shell脚本

来自分类Dev

python中的多处理成本

来自分类Dev

kafka-python中的多处理

来自分类Dev

Python2.7中的多处理

来自分类Dev

如何在Python中实现多处理？

Related 相关文章

文章