使用回归输出处理张量流中的大型numpy数组(51个输出)

阿明元帅

我有一个非常大的数据集,它是一个单个的npy文件,其中包含约1.5m个元素,每个元素为150x150x3图像。输出具有51列(51个输出)。由于数据集无法放入内存,如何加载它并使用它来拟合模型?一种有效的方法是使用TFRecords和tf.data,但我不知道该怎么做。我会很感激的。谢谢。

沉思

一种方法是逐个片段加载NPY文件(用它来馈入神经网络),而不是一次将其加载到内存中。您可以numpy.load像往常一样使用并指定mmap_mode关键字,以便将数组保留在磁盘上,并且仅在访问时将必要的位加载到内存中(此处有更多详细信息

numpy.load(file, mmap_mode=None, allow_pickle=False, fix_imports=True, encoding='ASCII')

内存映射文件用于访问磁盘上大文件的小片段,而无需将整个文件读入内存。NumPy的memmap是类似数组的对象。这与Python的mmap模块不同,后者使用类似文件的对象。

如果您想知道如何tfrecordsnumpy数组创建一个,然后tfrecords使用Dataset API阅读,则此链接提供了一个很好的答案。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

SSH - 输出处理

来自分类Dev

如何使用python和gnu-parallel在输出处理测试中仅保留一个标题行?

来自分类Dev

分层KFold输出处理

来自分类Dev

分层KFold输出处理

来自分类Dev

将sqlite db的输出处理到带空格的ksh数组中

来自分类Dev

如何使用Scrapy的ItemLoader中的输出处理器对列表进行排序?

来自分类Dev

使用numpy数组在列表中输出第n个值

来自分类Dev

理解张量流函数输出

来自分类Dev

张量流一个数值输出

来自分类Dev

在张量流中可视化卷积层的输出

来自分类Dev

如何使用完整LSTM序列的输出?张量流

来自分类Dev

如何在Python中为argparse设置自定义输出处理程序?

来自分类Dev

为什么我在Scrapy中的输入/输出处理器不起作用?

来自分类Dev

dplyr中的回归输出

来自分类Dev

使用ImageDataGenerator与回归输出

来自分类Dev

C ++套接字,多线程和输出处理

来自分类Dev

TCL 三元 expr 做输出处理

来自分类Dev

通过标准输入/标准输出处理交互

来自分类Dev

使用张量流实现 LSTM 回归模型

来自分类Dev

SGD收敛,但批处理学习不收敛,张量流中的简单回归

来自分类Dev

为什么张量流和numpy的特征值输出不同?

来自分类Dev

为什么张量流和numpy的特征值输出不同?

来自分类Dev

将CSV值分配给类属性,使用抽象类将输出处理为csv

来自分类Dev

处理FileSystemInfo数组的输出

来自分类Dev

在回归输出中添加列

来自分类Dev

使用 dplyr 存储回归的输出

来自分类Dev

使用流输出pdf

来自分类Dev

在张量流回归上接收随机成本输出-python

来自分类Dev

如何读取批处理文件中的错误输出流?