我制作了简单的深度学习模型。我现在桌面上只有 cpu。但是我必须在 gpu 设置中估计模型的训练时间。我不需要完全准确的训练时间估计。大约时间对我来说是可以的。是否有任何方法或指标?我的一个想法是比较 GFLOPs,但当我计算时也是无意义的。
前任。cpu:intel e5-2686 v4,gpu:nvidia k80
您可以使用一种非常幼稚的方法通过近似数据集中的并行度来估计速度(例如,如果并行度非常可笑,这可能等于数据集中的维数),假设最佳情况实现实际传输数据的开销为零的并发性,那么数学就变得简单了:
加速 = GPU 上的物理工作项目数(通常是典型 nvidia 实现中的 CUDA 核心数)除以 CPU 上的物理工作项目数(物理内核数)。
还有一些差异未考虑在内,与不同的硬件架构(ISR、设计等)有关。这些计算将与现实生活中的性能有很大差异,具体取决于您对模型并行性、并发性的实现和硬件。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句