Tensorflow、OpenAI Gym、Keras-基本的な強化学習の例に関するrlのパフォーマンスの問題

debugcn 投稿 Dev

ヨハン・レンシンク

強化学習を行っていますが、パフォーマンスに問題があります。

状況、カスタムコードなし：

Google Deep Learning VM（https://console.cloud.google.com/marketplace/details/click-to-deploy-images/deeplearning）をGoogleCloudにロードしました。これには、NVidia K80ビデオカードにインストールされているすべての前提条件（CUDA、cuDNN、ドライバー）が付属しています。
インストールされたkeras-rl、OpenAIジム
46行目でvisualize = Falseを指定して（標準の）例dqn_cartpole.pyを実行すると、GPUの約20％が使用され、1秒あたり約100ステップになります。これは、RazerBladeのCPUを使用する場合よりも約3倍遅くなります。 15（i7-8750H）。
考えられるすべてのボトルネックを確認しました。CPU使用率、メモリ、HD I / Oはすべて正常です。

助けてください！

前もって感謝します

デニスソマーズ

これは必ずしも問題ではありません。GPUの使用は、パフォーマンスの点で「無料」ではなく、CPUよりも常に高速であるとは限りません。すべてがGPUで実行されるわけではないため（たとえば、ジム環境自体は引き続きCPUで実行されます）、「通信コスト」が発生します（たとえば、GPUとの間でメモリを移動する）。これは、GPUを実際にうまく利用できる場合にのみ価値があります。

現在、GPUは必ずしもCPUよりも高速であるとは限りません。GPUは、多くの同様の計算を並行して実行するのに非常に優れています。これは、たとえば、大規模でディープなニューラルネットワークをトレーニングするときに実際にかなり頻繁に発生する大規模な行列間の行列乗算に必要です。そのように並行して実行できる比較的少数の計算のみが必要で、ほとんどがシーケンシャルコードしかない場合、GPUはCPUよりも確実に低速になる可能性があります（そして、あなたが言及したCPUはかなり強力です）。

さて、あなたがリンクしたコードのニューラルネットワークが構築されている部分（22行目から）を見ると、それはかなり小さなニューラルネットワークのように見えます。それぞれ16ノードのほんの数層。これは巨大なニューラルネットワークではなく、畳み込み層の後に大きな（たとえば数百のノード）完全に接続された層が続きます（カートポールのような小さな問題では実際にやり過ぎになる可能性があります）。したがって、GPUの20％しか使用できないことは確かに驚くべきことではなく（乗算される行列が小さすぎるため、並列でそれ以上使用することはできません）、単に単純なものよりも遅くなることは必ずしも驚くべきことではありません。 CPUでも実行されています。

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-08-11

コメントを追加

サインイン

分類Dev

Related 関連記事

記事

Tensorflow、OpenAI Gym、Keras-基本的な強化学習の例に関するrlのパフォーマンスの問題

Tensorflow、OpenAI Gym、Keras-基本的な強化学習の例に関するrlのパフォーマンスの問題

keras-rl / OpenAI GYMでカスタム環境を実装する方法は？

Google ColaboratoryのopenAI Gym NameError

Windows上のOpenAI Gym Atari

'gym.make（）'を使用する代わりにOpenAI / Tensorflowカスタムゲーム環境

Pythonでのkerasとtensorflow.kerasの予期しないパフォーマンスの違い

init時にopenai-gym環境に引数を渡す方法

openai-gym環境を並行して実行する

OpenAI-gym step（）で特定のアクションのタイマーを実装する方法

How to solve "Env not found" error in OpenAI Gym?

Is it possible to get an image of environment in OpenAI gym?

How to check the actions available in OpenAI gym environment?

openai-gymのLunarLanderでの自殺のシミュレーション

TensorflowとKeras：LSTMは、明確なソリューションを使用してseq2seq問題でパフォーマンスが低下します

OpenAI Gym： `action_space`表記について理解する（spaces.Box）

openAI 5のモデルを理解する（1024ユニットのLSTM強化学習）

openai-gym観測空間の値が何を意味するかを判断する方法

TensorflowとKerasを使用した転移学習の問題

Tensorflowのmatmul関数に相当するKeras

Kerasのインストールに関する問題

openai Gym env.P、AttributeError'TimeLimit 'オブジェクトに属性' P 'がありません

TensorflowでKerasモデルを実装する際の問題

GPUでtensorflowバックエンドでkerasを使用する際の問題

Keras + Tensorflowの奇妙な結果

AnacondaでのKerasのインストールに関する問題

Conda、Tensorflow、Kerasのバージョンの不一致の問題

Mac OS（10.12.1）へのTensorFlowのインストールに関する問題

MacへのTensorflowのインストールに関する問題

Tensorflowの多層パーセプトロンに関する問題

tensorflow.keras.models.Sequential.predictのマルチクラスマルチラベル問題の場合、0と1のみを取得することは可能ですか？