加载速度更快:Python中的pickle或hdf5

丹佛

给定一个1.5 Gb的熊猫数据帧列表,哪种格式是加载压缩数据最快的格式:pickle(通过cPickle),hdf5或Python中的其他格式?

  • 我只关心最快的速度将数据加载到内存中
  • 我不在乎转储数据,它很慢,但是我只做一次。
  • 我不在乎磁盘上的文件大小
最大容量

我只考虑两种存储格式:HDF5(PyTables)和Feather

这是我对DF(形状:4000000 x 6,内存大小183.1 MB,未压缩CSV大小-492 MB)进行读写比较的结果

以下存储格式比较:( ,CSVCSV.gzip [各种压缩]):PickleHDF5

                  read_s  write_s  size_ratio_to_CSV
storage
CSV               17.900    69.00              1.000
CSV.gzip          18.900   186.00              0.047
Pickle             0.173     1.77              0.374
HDF_fixed          0.196     2.03              0.435
HDF_tab            0.230     2.60              0.437
HDF_tab_zlib_c5    0.845     5.44              0.035
HDF_tab_zlib_c9    0.860     5.95              0.035
HDF_tab_bzip2_c5   2.500    36.50              0.011
HDF_tab_bzip2_c9   2.500    36.50              0.011

但这对您来说可能有所不同,因为我的所有数据都是datetimedtype,因此最好将它与您的真实数据或至少与相似数据进行比较...

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

在Python中加载csv并保存HDF5

来自分类Dev

如何使用HDF5存储和加载Python词典

来自分类Dev

将数据从HDF5加载到C ++中的矢量

来自分类Dev

在Keras中从.hdf5加载模型权重时出错

来自分类Dev

将数据从HDF5加载到C ++中的矢量

来自分类Dev

无法在Python中创建HDF5数据集的引用

来自分类Dev

无法在 Python 中创建 HDF5 数据集的引用

来自分类Dev

Python numpy MemoryError-将多个CSV文件加载到HDF5存储中并读入DataFrame

来自分类Dev

您能解释keras模型中的tensorflow加载和hdf5加载之间的区别吗

来自分类Dev

加快向HDF5写入数十亿行的速度

来自分类常见问题

如何在Keras中从HDF5文件加载模型?

来自分类Dev

如何将数组存储在无法加载到内存的hdf5文件中?

来自分类Dev

在熊猫中查询HDF5

来自分类Dev

查看 HDF5 表中的列

来自分类Dev

HDF5的行数

来自分类Dev

HDF5:是否可以重命名现有HDF5表中的列名?

来自分类Dev

在Python中读取HDF5复合dtype数组的快速方法是什么?

来自分类Dev

Python(Pandas):将数据框存储在具有多索引的hdf5中

来自分类Dev

如何将HDF5数据映射到多个Python进程中?

来自分类Dev

python中是否有单个函数可以显示.hdf5文件的完整结构?

来自分类Dev

有没有办法在 Python 中逐行写入 hdf5 文件?

来自分类Dev

HDF5和Pickle比原始的CSV文件占用更多空间

来自分类Dev

HDF5和Pickle比原始的CSV文件占用更多空间

来自分类Dev

HDF5文件中名称中的'/'混淆

来自分类Dev

Python:更改hdf5数组的数据类型

来自分类Dev

hdf5和tensorflow和python 3.7错误

来自分类Dev

Python HDF5 / NumPy打印数组不同

来自分类Dev

Python:更改hdf5数组的数据类型

来自分类Dev

格式良好的 html5 加载速度是否比蹩脚的更快?

Related 相关文章

热门标签

归档