具有更多线程的饱和后吞吐量下降

长龙

从理论上讲,当SM中的线程数增加直到达到峰值吞吐量时,吞吐量应该达到饱和,这意味着进一步增加线程,没有加速增益,并且吞吐量线应该是平坦的。

内核如下:

#pragma unroll UNROLL
for( int i = 0; i < N_ITERATIONS; i++ )
{ 
a = a * b + a;
}

但是,此内核的吞吐量在达到最大吞吐量后下降。经纱数量达到最大吞吐量(7.9个操作/时钟)为6经纱。我想知道什么因素会影响6次扭曲后吞吐量的下降。GPU是Tesla C1060,所有变形都在一个块中。

预先感谢您的时间和评论。

格雷格·史密斯

特斯拉架构的翘曲可以每4个调度周期发出一条指令,因此至少需要4条翘曲才能隐藏延迟。一些相关的指令等待时间和提取等待时间可能需要额外的扭曲来隐藏等待时间。所引用的内核是一串相关的ALU指令,这些指令可通过指令RAM快速发布。添加更多的扭曲可能会对获取单元施加压力。通常,长等待时间的存储器指令可减轻获取单元的负担。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

对所有线程具有完全的原子性,而不会影响性能或吞吐量

来自分类Dev

多线程会降低NUMA上的套接字吞吐量

来自分类Dev

分组后吞吐量缓慢

来自分类Dev

TCP的吞吐量

来自分类Dev

当操作具有不同的吞吐量时可视化ALU管道

来自分类Dev

具有高吞吐量的Spring集成的Redis队列丢失了消息

来自分类Dev

设计:具有高吞吐量的Java应用程序

来自分类Dev

具有高吞吐量的Spring集成的Redis队列丢失了消息

来自分类Dev

DDoS攻击后带宽使用/吞吐量增加

来自分类Dev

Wifi:仍处于连接状态,但没有吞吐量

来自分类Dev

为什么使用netperf会有不同的吞吐量?

来自分类Dev

是否有可能降低管道的吞吐量?

来自分类Dev

防火墙吞吐量与UTM吞吐量

来自分类Dev

Nginx反向代理的吞吐量周期性下降,那是什么?

来自分类Dev

从“单数据节点”移动到“双数据节点”cassandra 集群时,Cassandra 吞吐量下降

来自分类Dev

SIMD延迟吞吐量

来自分类Dev

Jmeter偏差与吞吐量

来自分类Dev

评估内存吞吐量

来自分类Dev

NodeJS数据吞吐量

来自分类Dev

蓝牙SPP吞吐量

来自分类Dev

低估 DynamoDb 吞吐量

来自分类Dev

链接速度与吞吐量

来自分类Dev

哪种pyzmq实现在@ gen.coroutine,@ asyncio.coroutine和异步之间具有最快的吞吐量?

来自分类Dev

使用具有不同吞吐量的三个 REST API 进行加特林负载测试

来自分类Dev

CUDA中的“请求的全局负载吞吐量”和“全局负载吞吐量”之间有什么区别

来自分类Dev

测量代码的吞吐量和延迟

来自分类Dev

Jmeter:摘要报告:吞吐量

来自分类Dev

使用RxJava限制吞吐量

来自分类Dev

增加多机的rabbitmq吞吐量

Related 相关文章

热门标签

归档