如何获得CUDA内核的汇编代码?

伪心理

我有一些用OpenCL和CUDA编写的内核。在AMD事件探查器中运行OpenCL程序时,它允许我查看内核的汇编代码。我想将此与CUDA内核的汇编代码进行比较,以比较两种语言之间的编译器优化。我一直在使用Nvidia Profiler,但是在获取内核的汇编代码方面仍然迷茫。如何做到这一点?

伪心理

正如Turboscrew提到的,最接近CUDA汇编的是PTX代码。我认为向此答案中添加实际生成PTX代码的方法会更有用。

这可以通过以下方式生成:

nvcc -ptx -o kernel.ptx kernel.cu

kernel.cu源文件在哪里kernel.ptx,目标PTX文件在哪里

另外,这是NVidia的PTX文档的链接:

http://docs.nvidia.com/cuda/parallel-thread-execution/index.html

如果您具有一些组装知识,那么大多数知识都非常简单。虽然有一些特殊的功能可能会有用,但在这些功能中查找更多详细信息将很有用。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何获得内核源代码?

来自分类Dev

如何获得内核源代码?

来自分类Dev

我如何获得CentOS内核源代码

来自分类Dev

如何从主机代码中中断或取消CUDA内核

来自分类Dev

如何组织汇编代码?

来自分类Dev

如何获得在其他过程中访问内存部分的汇编代码?- C#

来自分类Dev

如何优化此CUDA内核

来自分类Dev

汇编代码生成如何工作?

来自分类Dev

如何执行此汇编代码?

来自分类Dev

如何反汇编 .NET 代码?

来自分类Dev

在简单的32位内核中混合C和汇编代码

来自分类Dev

如何获得内核线程ID?

来自分类Dev

如何查看代码块中的汇编代码?

来自分类Dev

在反汇编的CUDA微代码中显然存在冗余操作

来自分类Dev

如何在CUDA内核中使用Eigen

来自分类Dev

如何测量CUDA中内核启动的开销

来自分类Dev

如何使用CUDA内核更新OpenGL VBO

来自分类Dev

如何在CUDA内核中使用Eigen

来自分类Dev

cuda 如何处理内核中的 __syncthreads()?

来自分类Dev

如何将汇编代码嵌入php?

来自分类Dev

如何查看Python文件的汇编代码?

来自分类Dev

如何使Eclipse以Intel语法反汇编代码

来自分类Dev

如何从C代码调用汇编函数?

来自分类Dev

如何查看Python文件的汇编代码?

来自分类Dev

如何从C代码调用汇编函数?

来自分类Dev

如何格式化汇编代码?

来自分类Dev

无法从静态初始化代码启动CUDA内核

来自分类Dev

如何获得Linux内核中CPU内核的能耗?

来自分类Dev

如何获得中断的内核时间戳?