GPU上的向量化代码

莫斯塔拉卜

我正在使用OpenCL在不同的GPU和CPU上同时执行一个过程,以获得高性能的结果。英特尔OpenCL始终显示一条消息,指出内核未向量化,因此它将仅在不同的内核上运行,而不会使用SIMD指令运行。我的问题是,如果我重写代码以便可以通过OpenCL代码利用SIMD指令,它还会提高GPU性能吗?

杰森·牛顿

是的-但是请注意,在基于AMD GCN的APU / GPU或Nvidia Fermi或更高的GPU硬件上,为了获得良好的性能,这不是必需的-它们会以很高的利用率进行标量运算。然而,CPU和Intel GPU可以通过SIMD指令极大地受益,这就是矢量运算的基础。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

小代码段的向量化

来自分类Dev

如何向量化此代码?

来自分类Dev

在MATLAB中向量化代码

来自分类Dev

向量化向量元素上的循环

来自分类Dev

向量化倍频程/ matlab代码

来自分类Dev

如何向量化以下python代码?

来自分类Dev

如何“向量化”此重复的C ++代码?

来自分类Dev

在 Matlab 中使用 xor 向量化代码

来自分类Dev

如何使用 mvnpdf 向量化 Matlab 代码?

来自分类Dev

在numpy数组上向量化python循环

来自分类Dev

Numpy数组上的向量化计算

来自分类Dev

向量化索引识别以更快地进行GPU处理

来自分类Dev

我可以向量化此python代码吗?

来自分类Dev

为什么gcc无法向量化此直线代码?

来自分类Dev

有什么办法可以向量化这个Matlab代码吗?

来自分类Dev

将向量化的Matlab代码传输到python,numpy

来自分类Dev

我可以向量化此Python代码吗?

来自分类Dev

为什么numpy向量化不能提高我的代码速度

来自分类Dev

我如何向量化以下python代码(图像过渡)?

来自分类Dev

如何在R中向量化此代码

来自分类Dev

如何以向量化形式编写此numpy代码?

来自分类Dev

有什么办法可以向量化这个Matlab代码吗?

来自分类Dev

向量化代码-如何减少MATLAB计算时间

来自分类Dev

如何使用for循环在r中向量化我的代码?

来自分类Dev

C ++向量化向量

来自分类Dev

在多个数组上的向量化结构过滤Matlab

来自分类Dev

在start =和end =上向量化window.zoo

来自分类Dev

在2D数组上向量化NumPy三乘积

来自分类Dev

在Matlab上向量化2D卷积