Tensorflow、OpenAI Gym、Keras-基本的な強化学習の例に関するrlのパフォーマンスの問題

ヨハン・レンシンク

強化学習を行っていますが、パフォーマンスに問題があります。

状況、カスタムコードなし:

  • Google Deep Learning VM(https://console.cloud.google.com/marketplace/details/click-to-deploy-images/deeplearning)をGoogleCloudにロードしましたこれには、NVidia K80ビデオカードにインストールされているすべての前提条件(CUDA、cuDNN、ドライバー)が付属しています。
  • インストールされたkeras-rlOpenAIジム
  • 46行でvisualize = Falseを指定て(標準の)例dqn_cartpole.pyを実行すると、GPUの約20%が使用され、1秒あたり約100ステップになります。これは、RazerBladeのCPUを使用する場合よりも約3倍遅くなります。 15(i7-8750H)。
  • 考えられるすべてのボトルネックを確認しました。CPU使用率、メモリ、HD I / Oはすべて正常です。

助けてください!

前もって感謝します

デニスソマーズ

これは必ずしも問題ではありません。GPUの使用は、パフォーマンスの点で「無料」ではなく、CPUよりも常に高速であるとは限りません。すべてがGPUで実行されるわけではないため(たとえば、ジム環境自体は引き続きCPUで実行されます)、「通信コスト」が発生します(たとえば、GPUとの間でメモリを移動する)。これは、GPUを実際にうまく利用できる場合にのみ価値があります。

現在、GPUは必ずしもCPUよりも高速であるとは限りません。GPUは、多くの同様の計算を並行して実行するのに非常に優れています。これは、たとえば、大規模でディープなニューラルネットワークをトレーニングするときに実際にかなり頻繁に発生する大規模な行列間の行列乗算に必要です。そのように並行して実行できる比較的少数の計算のみが必要で、ほとんどがシーケンシャルコードしかない場合、GPUはCPUよりも確実に低速になる可能性があります(そして、あなたが言及したCPUはかなり強力です)。

さて、あなたがリンクしたコードのニューラルネットワークが構築されている部分(22行目から)を見ると、それはかなり小さなニューラルネットワークのように見えます。それぞれ16ノードのほんの数層。これは巨大なニューラルネットワークではなく、畳み込み層の後に大きな(たとえば数百のノード)完全に接続された層が続きます(カートポールのような小さな問題では実際にやり過ぎになる可能性があります)。したがって、GPUの20%しか使用できないことは確かに驚くべきことではなく(乗算される行列が小さすぎるため、並列でそれ以上使用することはできません)、単に単純なものよりも遅くなることは必ずしも驚くべきことではありません。 CPUでも実行されています。

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

keras-rl / OpenAI GYMでカスタム環境を実装する方法は?

分類Dev

Google ColaboratoryのopenAI Gym NameError

分類Dev

Windows上のOpenAI Gym Atari

分類Dev

'gym.make()'を使用する代わりにOpenAI / Tensorflowカスタムゲーム環境

分類Dev

Pythonでのkerasとtensorflow.kerasの予期しないパフォーマンスの違い

分類Dev

init時にopenai-gym環境に引数を渡す方法

分類Dev

openai-gym環境を並行して実行する

分類Dev

OpenAI-gym step()で特定のアクションのタイマーを実装する方法

分類Dev

How to solve "Env not found" error in OpenAI Gym?

分類Dev

Is it possible to get an image of environment in OpenAI gym?

分類Dev

How to check the actions available in OpenAI gym environment?

分類Dev

openai-gymのLunarLanderでの自殺のシミュレーション

分類Dev

TensorflowとKeras:LSTMは、明確なソリューションを使用してseq2seq問題でパフォーマンスが低下します

分類Dev

OpenAI Gym: `action_space`表記について理解する(spaces.Box)

分類Dev

openAI 5のモデルを理解する(1024ユニットのLSTM強化学習)

分類Dev

openai-gym観測空間の値が何を意味するかを判断する方法

分類Dev

TensorflowとKerasを使用した転移学習の問題

分類Dev

Tensorflowのmatmul関数に相当するKeras

分類Dev

Kerasのインストールに関する問題

分類Dev

openai Gym env.P、AttributeError'TimeLimit 'オブジェクトに属性' P 'がありません

分類Dev

TensorflowでKerasモデルを実装する際の問題

分類Dev

GPUでtensorflowバックエンドでkerasを使用する際の問題

分類Dev

Keras + Tensorflowの奇妙な結果

分類Dev

AnacondaでのKerasのインストールに関する問題

分類Dev

Conda、Tensorflow、Kerasのバージョンの不一致の問題

分類Dev

Mac OS(10.12.1)へのTensorFlowのインストールに関する問題

分類Dev

MacへのTensorflowのインストールに関する問題

分類Dev

Tensorflowの多層パーセプトロンに関する問題

分類Dev

tensorflow.keras.models.Sequential.predictのマルチクラスマルチラベル問題の場合、0と1のみを取得することは可能ですか?

Related 関連記事

  1. 1

    keras-rl / OpenAI GYMでカスタム環境を実装する方法は?

  2. 2

    Google ColaboratoryのopenAI Gym NameError

  3. 3

    Windows上のOpenAI Gym Atari

  4. 4

    'gym.make()'を使用する代わりにOpenAI / Tensorflowカスタムゲーム環境

  5. 5

    Pythonでのkerasとtensorflow.kerasの予期しないパフォーマンスの違い

  6. 6

    init時にopenai-gym環境に引数を渡す方法

  7. 7

    openai-gym環境を並行して実行する

  8. 8

    OpenAI-gym step()で特定のアクションのタイマーを実装する方法

  9. 9

    How to solve "Env not found" error in OpenAI Gym?

  10. 10

    Is it possible to get an image of environment in OpenAI gym?

  11. 11

    How to check the actions available in OpenAI gym environment?

  12. 12

    openai-gymのLunarLanderでの自殺のシミュレーション

  13. 13

    TensorflowとKeras:LSTMは、明確なソリューションを使用してseq2seq問題でパフォーマンスが低下します

  14. 14

    OpenAI Gym: `action_space`表記について理解する(spaces.Box)

  15. 15

    openAI 5のモデルを理解する(1024ユニットのLSTM強化学習)

  16. 16

    openai-gym観測空間の値が何を意味するかを判断する方法

  17. 17

    TensorflowとKerasを使用した転移学習の問題

  18. 18

    Tensorflowのmatmul関数に相当するKeras

  19. 19

    Kerasのインストールに関する問題

  20. 20

    openai Gym env.P、AttributeError'TimeLimit 'オブジェクトに属性' P 'がありません

  21. 21

    TensorflowでKerasモデルを実装する際の問題

  22. 22

    GPUでtensorflowバックエンドでkerasを使用する際の問題

  23. 23

    Keras + Tensorflowの奇妙な結果

  24. 24

    AnacondaでのKerasのインストールに関する問題

  25. 25

    Conda、Tensorflow、Kerasのバージョンの不一致の問題

  26. 26

    Mac OS(10.12.1)へのTensorFlowのインストールに関する問題

  27. 27

    MacへのTensorflowのインストールに関する問題

  28. 28

    Tensorflowの多層パーセプトロンに関する問題

  29. 29

    tensorflow.keras.models.Sequential.predictのマルチクラスマルチラベル問題の場合、0と1のみを取得することは可能ですか?

ホットタグ

アーカイブ