何时使用数组,缓冲区或直接缓冲区

两个

在编写用于OpenGL库的Matrix类时,我遇到了一个问题,即使用Java数组还是使用Buffer策略存储数据(JOGL为Matrix操作提供直接缓冲区复制)。为了对此进行分析,我编写了一个小型性能测试程序,该程序比较了Arrays vs Buffers和Direct Buffers上循环和批量操作的相对速度。

我想在这里与您分享我的结果(因为我发现它们很有趣)。请随时发表评论和/或指出任何错误。
可以在pastebin.com/is7UaiMV上查看该代码

笔记

  • 循环读取数组实现为A [i] = B [i],否则JIT优化器将完全删除该代码。实际var = A [i]似乎几乎相同。

  • 在10,000个数组大小的示例结果中,JIT优化器很可能已用类似System.arraycopy的实现代替了循环数组访问。

  • 由于Java将A.get(B)实现B.put(A),因此没有大容量获取缓冲区-> buffer ,因此结果将与大容量获取结果相同。

结论

在几乎所有情况下,强烈建议使用Java内部数组。不仅放置/获取速度大大提高了,而且JIT还能对最终代码执行更好的优化。

只有同时满足以下两个条件时才应使用缓冲区

  • 您需要处理大量数据。
  • 该数据大部分或始终被批量处理

请注意,backened-buffer具有Java Array来备份缓冲区的内容。建议在此后​​缓冲区上执行操作,而不是循环放置/获取。

当您担心内存使用情况且从不访问基础数据时,应使用直接缓冲区它们比非直接缓冲区要慢一些,如果访问基础数据则要慢得多,但使用的内存更少。此外,使用直接缓冲区将非字节数据(如float数组)转换为字节时,会产生额外的开销。

有关更多详细信息,请参见此处:

样品结果

注意:百分比仅是为了易于阅读,没有实际意义。

使用大小为16的数组进行10,000,000次迭代...

-- Array tests: -----------------------------------------

Loop-write array:           87.29 ms  11,52%
Arrays.fill:                64.51 ms   8,51%
Loop-read array:            42.11 ms   5,56%
System.arraycopy:           47.25 ms   6,23%

-- Buffer tests: ----------------------------------------

Loop-put buffer:           603.71 ms  79,65%
Index-put buffer:          536.05 ms  70,72%
Bulk-put array->buffer:    105.43 ms  13,91%
Bulk-put buffer->buffer:    99.09 ms  13,07%

Bulk-put bufferD->buffer:   80.38 ms  10,60%
Loop-get buffer:           505.77 ms  66,73%
Index-get buffer:          562.84 ms  74,26%
Bulk-get buffer->array:    137.86 ms  18,19%

-- Direct buffer tests: ---------------------------------

Loop-put bufferD:          570.69 ms  75,29%
Index-put bufferD:         562.76 ms  74,25%
Bulk-put array->bufferD:   712.16 ms  93,96%
Bulk-put buffer->bufferD:   83.53 ms  11,02%

Bulk-put bufferD->bufferD: 118.00 ms  15,57%
Loop-get bufferD:          528.62 ms  69,74%
Index-get bufferD:         560.36 ms  73,93%
Bulk-get bufferD->array:   757.95 ms 100,00%

使用大小为1,000的数组进行100,000次迭代...

-- Array tests: -----------------------------------------

Loop-write array:           22.10 ms   6,21%
Arrays.fill:                10.37 ms   2,91%
Loop-read array:            81.12 ms  22,79%
System.arraycopy:           10.59 ms   2,97%

-- Buffer tests: ----------------------------------------

Loop-put buffer:           355.98 ms 100,00%
Index-put buffer:          353.80 ms  99,39%
Bulk-put array->buffer:     16.33 ms   4,59%
Bulk-put buffer->buffer:     5.40 ms   1,52%

Bulk-put bufferD->buffer:    4.95 ms   1,39%
Loop-get buffer:           299.95 ms  84,26%
Index-get buffer:          343.05 ms  96,37%
Bulk-get buffer->array:     15.94 ms   4,48%

-- Direct buffer tests: ---------------------------------

Loop-put bufferD:          355.11 ms  99,75%
Index-put bufferD:         348.63 ms  97,93%
Bulk-put array->bufferD:   190.86 ms  53,61%
Bulk-put buffer->bufferD:    5.60 ms   1,57%

Bulk-put bufferD->bufferD:   7.73 ms   2,17%
Loop-get bufferD:          344.10 ms  96,66%
Index-get bufferD:         333.03 ms  93,55%
Bulk-get bufferD->array:   190.12 ms  53,41%

使用大小为10,000的数组进行100,000次迭代...

-- Array tests: -----------------------------------------

Loop-write array:          156.02 ms   4,37%
Arrays.fill:               109.06 ms   3,06%
Loop-read array:           300.45 ms   8,42%
System.arraycopy:          147.36 ms   4,13%

-- Buffer tests: ----------------------------------------

Loop-put buffer:          3385.94 ms  94,89%
Index-put buffer:         3568.43 ms 100,00%
Bulk-put array->buffer:    159.40 ms   4,47%
Bulk-put buffer->buffer:     5.31 ms   0,15%

Bulk-put bufferD->buffer:    6.61 ms   0,19%
Loop-get buffer:          2907.21 ms  81,47%
Index-get buffer:         3413.56 ms  95,66%
Bulk-get buffer->array:    177.31 ms   4,97%

-- Direct buffer tests: ---------------------------------

Loop-put bufferD:         3319.25 ms  93,02%
Index-put bufferD:        3538.16 ms  99,15%
Bulk-put array->bufferD:  1849.45 ms  51,83%
Bulk-put buffer->bufferD:    5.60 ms   0,16%

Bulk-put bufferD->bufferD:   7.63 ms   0,21%
Loop-get bufferD:         3227.26 ms  90,44%
Index-get bufferD:        3413.94 ms  95,67%
Bulk-get bufferD->array:  1848.24 ms  51,79%
霍尔格

直接缓冲区并不旨在加速从Java代码的访问。(如果可能的话,JVM自己的数组实现有问题。)

这些字节缓冲区用于与其他组件接口,因为您可以向a写入字节缓冲区,ByteChannel并且可以将直接缓冲区与本机代码(例如您提到的OpenGL库)结合使用。旨在加速这些操作。使用图形卡的芯片进行渲染可以加快整体操作的速度,而不是补偿Java代码对缓冲区的较慢访问。

顺便说一句,如果您测量对字节缓冲区(尤其是直接字节缓冲区)的访问速度,那么在获取视图之前,有必要将字节顺序更改为本字节顺序FloatBuffer

FloatBuffer bufferD = ByteBuffer.allocateDirect(SIZE * 4)
                                .order(ByteOrder.nativeOrder())
                                .asFloatBuffer();

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

缓冲区何时刷新

来自分类Dev

直接字节缓冲区

来自分类Dev

何时清除顶点缓冲区对象

来自分类Dev

何时清除顶点缓冲区对象

来自分类Dev

缓冲区-索引或直接,隔行或单独

来自分类Dev

缓冲区-索引或直接,隔行或单独

来自分类Dev

比较缓冲区

来自分类Dev

请求缓冲区

来自分类Dev

了解何时使用缓冲区在Java中处理文件以及何时不使用缓冲区

来自分类Dev

直接使用QtMultimedia.QAudioOutput播放gtts缓冲区

来自分类Dev

在Numpy数组中创建缓冲区

来自分类Dev

数组作为缓冲区VHDL

来自分类Dev

如何使数组充当缓冲区?

来自分类Dev

OpenCL缓冲区数组-clEnqueueWriteBuffer -36

来自分类Dev

线程安全的缓冲区数组

来自分类Dev

JNI直接缓冲区。谁负责释放本机缓冲区?

来自分类Dev

使用WriteableBitmap的缓冲区大小不足?

来自分类Dev

在Android AudioTrack中使用缓冲区

来自分类Dev

使用OpenCL获取OpenGL缓冲区

来自分类Dev

使用删除[]导致缓冲区溢出

来自分类Dev

使用strcpy的基本缓冲区溢出

来自分类Dev

在Android AudioTrack中使用缓冲区

来自分类Dev

/记忆/使用中间缓冲区吗?

来自分类Dev

缓冲区使用哪种硬件

来自分类Dev

在磁盘上使用循环缓冲区

来自分类Dev

使用 memcpy 处理缓冲区

来自分类Dev

使用 Cocoa 渲染像素缓冲区

来自分类Dev

使用 Vader 测试缓冲区列表

来自分类Dev

NodeJS缓冲区-读取小端缓冲区