将选择性元素存储在GPU全局内存中

阿卜杜勒

我们正在使用CUDAfy.NET在GPU上进行比较。为此,我们传递了两个数组,其中一个包含数据,另一个存储结果。我只想将满足特定条件的那些元素存储在结果数组中。但是,数组最终会出现条件不满足的不需要的条目。如何从结果数组中过滤掉这些不需要的条目,然后将过滤后的数组返回给主函数?

[Cudafy]
public static void Comparisons(GThread thread, int[] a,int[] c, int iter)
{
    int tx = thread.threadIdx.x;
    if(tx < iter)
    {
        if(a[tx] < tolerance)  //tolerance is some user defined number
        {
            c[tx] = a[tx];
        }
    }
}
歌曲

您将必须在多个内核通道中执行此操作。

例如:
a = [1,2,1,2,1,2]
公差= 2

第一遍:
创建一个数组,其中包含1表示“保留元素”或0表示“丢弃元素”
p = [1,0,1,0,1,0]

第二遍:
在p数组上执行并行前缀总和。
i = [0,1,1,2,2,3]
(有关此主题的白皮书很多)

第三遍:
使用a,p和i。
每个元素一个线程。
如果p [threadIdx.x]等于1,则将a [threadIdx.x]放在c [i [threadIdx.x]]中
(您可以在此处使用共享内存来更好地合并对c数组的写入)

结果数组c将包含[1,1,1]

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

CUDA将数据从全局内存缓存到统一缓存中,以将其存储到共享内存中吗?

来自分类Dev

CUDA中的全局内存与动态全局内存分配

来自分类Dev

Nvidia GPU同时访问全局内存中的单个位置

来自分类Dev

如何在git中删除选择性存储?

来自分类Dev

对GPU上的全局内存位置的合并访问与广播访问

来自分类Dev

OpenCL全局内存

来自分类Dev

使用向量将OpenCL中的全局内存读取最小化?

来自分类Dev

使用向量将OpenCL中的全局内存读取最小化?

来自分类Dev

移动OpenCL本地存储库冲突。为什么使用本地内存比内核中的全局内存要慢?

来自分类Dev

全局内存加载/存储是否正在通过具有计算功能1.x的设备中的缓存进行存储?

来自分类Dev

数据帧的选择性重新存储

来自分类Dev

如何在CUDA中安全地将全局内存中的数据加载到共享内存中?

来自分类Dev

全局内存加载/存储是否正在通过具有计算能力1.x的设备中的缓存?

来自分类Dev

CUDA内核中全局内存负载事务的计算

来自分类Dev

opencl内核中的动态全局内存分配

来自分类Dev

CUDA中的静态分配的全局内存结构

来自分类Dev

在CUDA中访问全局内存的速度很慢

来自分类Dev

如何找出GPU的共享内存和全局内存大小?

来自分类Dev

如何找出GPU的共享内存和全局内存大小?

来自分类Dev

线程与全局内存的交互

来自分类Dev

OpenCL同步全局内存

来自分类Dev

将表单本地内存写入全局时是否需要本地和全局内存屏障

来自分类Dev

将任意元素存储在连续内存中

来自分类Dev

JavaScript中的选择性随机颜色

来自分类Dev

Gradle中的选择性依赖

来自分类Dev

R中的选择性数据集成

来自分类Dev

mongodb中的选择性复制

来自分类Dev

bash中的选择性差异

来自分类Dev

从列表中检索选择性项目

Related 相关文章

  1. 1

    CUDA将数据从全局内存缓存到统一缓存中,以将其存储到共享内存中吗?

  2. 2

    CUDA中的全局内存与动态全局内存分配

  3. 3

    Nvidia GPU同时访问全局内存中的单个位置

  4. 4

    如何在git中删除选择性存储?

  5. 5

    对GPU上的全局内存位置的合并访问与广播访问

  6. 6

    OpenCL全局内存

  7. 7

    使用向量将OpenCL中的全局内存读取最小化?

  8. 8

    使用向量将OpenCL中的全局内存读取最小化?

  9. 9

    移动OpenCL本地存储库冲突。为什么使用本地内存比内核中的全局内存要慢?

  10. 10

    全局内存加载/存储是否正在通过具有计算功能1.x的设备中的缓存进行存储?

  11. 11

    数据帧的选择性重新存储

  12. 12

    如何在CUDA中安全地将全局内存中的数据加载到共享内存中?

  13. 13

    全局内存加载/存储是否正在通过具有计算能力1.x的设备中的缓存?

  14. 14

    CUDA内核中全局内存负载事务的计算

  15. 15

    opencl内核中的动态全局内存分配

  16. 16

    CUDA中的静态分配的全局内存结构

  17. 17

    在CUDA中访问全局内存的速度很慢

  18. 18

    如何找出GPU的共享内存和全局内存大小?

  19. 19

    如何找出GPU的共享内存和全局内存大小?

  20. 20

    线程与全局内存的交互

  21. 21

    OpenCL同步全局内存

  22. 22

    将表单本地内存写入全局时是否需要本地和全局内存屏障

  23. 23

    将任意元素存储在连续内存中

  24. 24

    JavaScript中的选择性随机颜色

  25. 25

    Gradle中的选择性依赖

  26. 26

    R中的选择性数据集成

  27. 27

    mongodb中的选择性复制

  28. 28

    bash中的选择性差异

  29. 29

    从列表中检索选择性项目

热门标签

归档