我正在使用OpenCL在不同的GPU和CPU上同时执行一个过程,以获得高性能的结果。英特尔OpenCL始终显示一条消息,指出内核未向量化,因此它将仅在不同的内核上运行,而不会使用SIMD指令运行。我的问题是,如果我重写代码以便可以通过OpenCL代码利用SIMD指令,它还会提高GPU性能吗?
是的-但是请注意,在基于AMD GCN的APU / GPU或Nvidia Fermi或更高的GPU硬件上,为了获得良好的性能,这不是必需的-它们会以很高的利用率进行标量运算。然而,CPU和Intel GPU可以通过SIMD指令极大地受益,这就是矢量运算的基础。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句