在英特尔 FPGA 上如何安排 OpenCL 工作组？

debugcn 发表于 Dev

哈斯塔图斯XXI

我有一个关于英特尔 FPGA 中多个 CU 上的工作组调度的问题。当工作组被分配给可用的 CU 时，CU 什么时候被认为是可用的？是在前一个工作组的最后一个工作项已经放弃管道时还是在它处于第二阶段时（因此管道的每个阶段都被前一个工作组占用，除了第一个）？这个决定是由硬件调度程序做出的，但我还没有找到任何解释这些的公共文档。

编辑：我说的是使用面向 FPGA 的英特尔 OpenCL SDK 时发生的自动过程，而不是使用 HDL 的自定义设计。

赫兹

除了工作项，工作组也在每个 CU 中流水线化。因此，您可以同时在同一个 CU 中运行多个工作组，以最大限度地提高管道效率。如果您的设计使用基于本地内存的缓冲区，当您检查 HTML 报告时，您将看到编译器正在进一步复制这些缓冲区以支持特定数量的“同时工作组”。此类工作组的数量似乎等于每个 CU 的管道深度除以工作组大小。最后，在同一 CU 中同时运行的所有工作组中的所有工作项都被一个接一个地流水线化，属于每个 CU 的工作项使用它们自己的本地缓冲区，并且每个工作组强制执行屏障同步。将在每个 CU 中安排一个新的工作组，

PS 在他们自己的论坛中获得与面向 OpenCL 的英特尔 FPGA SDK 相关的帮助可能更容易。

PPS 英特尔的 OpenCL 工作项调度程序的详细信息没有记录在任何地方。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-07-29

我来说两句

0条评论

登录后参与评论

来自分类Dev

Related 相关文章

文章

在英特尔 FPGA 上如何安排 OpenCL 工作组？

在英特尔 FPGA 上如何安排 OpenCL 工作组？

英特尔Turbo Boost如何工作？

英特尔OpenCL与 Khronos OpenCL

OpenCL clEnqueueNDRangeKernel如何正确设置工作组大小

英特尔高清显卡4000和Nvidia GeForce GT 650M上的openCL无法正常工作：CL_INVALID_DEVICE错误

带有集成英特尔图形芯片的Linux上的OpenCL

英特尔Ivy Bridge GPU OpenCL无法在Windows 8上运行

英特尔OpenCL Beignet问题

OpenCL：工作组概念

英特尔De2i-FPGA板PCI

英特尔De2i-FPGA板PCI

在英特尔的Z87芯片组上构建降级的RAID 1？

“英特尔图形”如何在微处理器和芯片组之间划分？

带有openCV的英特尔编译器如何工作

本地工作组大小= NULL OpenCL

英特尔OpenCL SDK-头文件在哪里？

英特尔 AC 9560 不工作

英特尔无线 3165 不工作

如何正确更新英特尔微码？

如何升级OpenGL？英特尔

如何在配备nVidia离散卡/英特尔集成显卡的笔记本电脑上使用nVidia CUDA或OpenCL？

如何在配备nVidia离散卡/英特尔集成显卡的笔记本电脑上使用nVidia CUDA或OpenCL？

英特尔MIC上的英特尔TBB和Cilk Plus线程关联

英特尔 ixgbe 上的 Ubuntu 18.04 SR-IOV - 英特尔 X550

opencl-同步工作组副本和最大工作组大小

opencl-同步工作组副本和最大工作组大小

如何确定Linux上英特尔管理引擎的版本？

如何在 Ubuntu 上安装英特尔 AVX 2

英特尔芯片组-GPIO编程

OpenCL 2D工作组尺寸