Tensorflow Queue 会加速单 CPU 机器上的数据加载吗?

吉姆王 |

我目前有一些在 GPU 上运行良好的现有代码。我尝试在具有单个 GPU 的 Ubuntu 机器和具有多个 GPU 的集群服务器上运行它。这两个实验都非常快。

但是,当我尝试在我自己的笔记本电脑上用一个 CPU(没有 GPU)运行它时,它变得非常低......速度慢了 100 多倍。

我知道当我没有用于训练的 GPU 时它会慢得多。但我真的希望了解“队列”是否受这种硬件平台差异的影响。

通常,我们使用 CPU 通过“队列”将数据加载到 GPU,但玩一个 CPU 并使用 Tensorflow 队列没有任何意义。有人可以为我提供任何指导吗?

效果 - 英特尔

如果 CPU 具有多个内核,此建议可能会帮助您有效使用 CPU。

为了获得更好的性能,需要根据可用的物理内核数设置 OMP_NUM_THREADS、亲和域等几个参数。 

您可以尝试以下优化步骤,以帮助更好地利用您的处理器。

export OMP_NUM_THREADS=NUM_PARALLEL_EXEC_UNITS
export KMP_BLOCKTIME=30
export KMP_SETTINGS=1
export KMP_AFFINITY=granularity=fine,verbose,compact,1,0

NUM_PARALLEL_EXEC_UNITS 是物理内核的数量。

当 NUM_PARALLEL_EXEC_UNITS 等于物理内核数时,发现性能更好。但这可能会有所不同。您可以尝试不同的值以选择最佳值。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

GPU上的Tensorflow Matmul计算比CPU慢

来自分类Dev

在 CPU 上优化 Tensorflow 图像识别

来自分类Dev

Cython会加速erf()计算吗?

来自分类Dev

这会加速我的 GRUB 吗?

来自分类Dev

在单CPU上使用双CPU主板在成本/性能方面明智吗?

来自分类Dev

使用 python 3.6.2 CPU 在 Windows 上出现“导入 tensorflow”错误

来自分类Dev

将python文件编译为cython会加速程序吗?

来自分类Dev

这种“在哪里”条件会加速SQL查询吗

来自分类Dev

瞬变会加速读取操作吗?

来自分类Dev

Tensorflow:如何从CPU tf.data.Dataset(from_generator)预取GPU上的数据

来自分类Dev

带Numpy的TensorFlow并行CPU

来自分类Dev

TensorFlow是否将一台机器的所有CPU视为一台设备?

来自分类Dev

boost :: lockfree :: queue正在耗尽我的CPU

来自分类Dev

Tensorflow:在 GPU 上运行训练阶段,在 CPU 上运行测试阶段

来自分类Dev

TensorFlow-GPU加速仅用于培训吗?

来自分类Dev

在 CPU 上运行 tensorflow-gpu 时结果不正确

来自分类Dev

如何从 TensorFlow 图中获取 Queue 对象?

来自分类Dev

循环时,使变量成为局部别名会加速列表理解吗?

来自分类Dev

readyboost会加速次分区或硬盘驱动器吗?

来自分类Dev

Tensorflow GPU / CPU性能突然输入上限

来自分类Dev

TensorFlow CPU 和 CUDA 代码共享

来自分类Dev

bazel-run 不会加载所有在 bazel build 时加载的 tensorflow 包

来自分类Dev

系统进程CPU使用率高(Queue / Dequeue + TrimAlllSystemPagableMemory)

来自分类Dev

如果 CPU 支持 C# 上的硬件加速,如何检入代码?

来自分类Dev

为什么“ cpu”加速器报告supports_double_precision数据成员的“否”?

来自分类Dev

为什么“ cpu”加速器报告supports_double_precision数据成员的“否”?

来自分类Dev

multiprocessing.Queue和Queue.Queue不同吗?

来自分类Dev

是否可以使用在大型GPU上创建的Tensorflow保存的模型在小型CPU上进行预测?

来自分类Dev

我可以在异构机器上使用TensorFlow分布式培训吗?

Related 相关文章

  1. 1

    GPU上的Tensorflow Matmul计算比CPU慢

  2. 2

    在 CPU 上优化 Tensorflow 图像识别

  3. 3

    Cython会加速erf()计算吗?

  4. 4

    这会加速我的 GRUB 吗?

  5. 5

    在单CPU上使用双CPU主板在成本/性能方面明智吗?

  6. 6

    使用 python 3.6.2 CPU 在 Windows 上出现“导入 tensorflow”错误

  7. 7

    将python文件编译为cython会加速程序吗?

  8. 8

    这种“在哪里”条件会加速SQL查询吗

  9. 9

    瞬变会加速读取操作吗?

  10. 10

    Tensorflow:如何从CPU tf.data.Dataset(from_generator)预取GPU上的数据

  11. 11

    带Numpy的TensorFlow并行CPU

  12. 12

    TensorFlow是否将一台机器的所有CPU视为一台设备?

  13. 13

    boost :: lockfree :: queue正在耗尽我的CPU

  14. 14

    Tensorflow:在 GPU 上运行训练阶段,在 CPU 上运行测试阶段

  15. 15

    TensorFlow-GPU加速仅用于培训吗?

  16. 16

    在 CPU 上运行 tensorflow-gpu 时结果不正确

  17. 17

    如何从 TensorFlow 图中获取 Queue 对象?

  18. 18

    循环时,使变量成为局部别名会加速列表理解吗?

  19. 19

    readyboost会加速次分区或硬盘驱动器吗?

  20. 20

    Tensorflow GPU / CPU性能突然输入上限

  21. 21

    TensorFlow CPU 和 CUDA 代码共享

  22. 22

    bazel-run 不会加载所有在 bazel build 时加载的 tensorflow 包

  23. 23

    系统进程CPU使用率高(Queue / Dequeue + TrimAlllSystemPagableMemory)

  24. 24

    如果 CPU 支持 C# 上的硬件加速,如何检入代码?

  25. 25

    为什么“ cpu”加速器报告supports_double_precision数据成员的“否”?

  26. 26

    为什么“ cpu”加速器报告supports_double_precision数据成员的“否”?

  27. 27

    multiprocessing.Queue和Queue.Queue不同吗?

  28. 28

    是否可以使用在大型GPU上创建的Tensorflow保存的模型在小型CPU上进行预测?

  29. 29

    我可以在异构机器上使用TensorFlow分布式培训吗?

热门标签

归档