Python-プーリングはすべてのコアを使用するわけではありません

debugcn 投稿 Dev

ビニャミンも

Poolfrommultiprocessingパッケージ（from multiprocessing.dummy import Pool）を使用しています。テキストファイルを読み取り、将来の関数のために前処理する関数を作成しました。私は約20,000のそのようなテキストファイルを持っているので、プロセスを並列化したかったので、このためにプールを使用しました。コードを実行しているリモートサーバーに32個のコアがあるため、70個のプロセスを開こうとしました（これも試しませんでしたが、問題は残ります）。これがシステムモニターの外観です。

ご覧のとおり、32コアのうち16コアはまったく機能しません。

どんな助けでもいただければ幸いです。

zwer

コメントで述べたように、すべてのmultiprocessing.dummy構造は、テスト、デバッグ、プロファイリングなどに非常に役立つ通常のスレッドを使用してマルチプロセッシングインターフェイスをシミュレートすることを目的としています。または、公式ドキュメントにあるように：

multiprocessing.dummyのAPIを複製しますがmultiprocessing、threadingモジュールのラッパーにすぎません。

Python（CPython）threadingは実際のシステムスレッドを使用するため、理論的には、スレッド化されたコードを異なるCPUで実行することが可能です。これは、恐ろしいGILにより、これらのスレッドの2つが同時に実行されることはありません。そのルールには例外があります。システムコールを抽象化し、イベント（I / Oなど）を待機するすべてのタスクは並行して実行できますが、処理がPythonドメインに移動すると、GILによってロックアウトされ、実行されません。 opt-codeカウンターがコンテキストを切り替えるまで実行を継続できます。

簡単に言うと、multiprocessingプールを介して複数のコアを利用する場合は、multiprocessing.dummy（他のdummyパッケージにも当てはまります）の適応と抽象化を使用せず、ルートmultiprocessingモジュール自体を使用します-あなたの場合はmultiprocessing.pool.Pool。

ことではことを考えると、言っthreadingモジュールは、私は頻繁に自分自身を使用して見つけるのインターフェイスプールが付属していませんmultiprocessing.dummy.Pool（またはmultiprocessing.pool.ThreadPool共有メモリがより重要であるとき、I / O重いもの（すなわちGILによって制限されない）のための代わりに）共有処理と発生するオーバーヘッド。multiprocessing.pool.Poolファイルを取得するときに重い後処理を行わなければ、スイッチを切り替えても大きな違いに気付かない可能性があります。

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-06-1

コメントを追加

サインイン

分類Dev

Related 関連記事

記事

Python-プーリングはすべてのコアを使用するわけではありません

Python-プーリングはすべてのコアを使用するわけではありません

Python forループは、リスト内のすべての要素を取得するわけではありません

PythonのStripメソッドはすべてをクリアするわけではありません

Python OpenGLは、四辺形のすべての三角形をレンダリングするわけではありません

Pythonを使用したSeleniumを使用したWebスクレイピング-すべての要素を取得するわけではありません

Pythonの美しいスープetsyスクレーパーがすべてのアイテムを集めているわけではありません

PythonのSelenium（Webdriver）は、GoogleAdWordsページのすべてのリンクを返すわけではありません

Pythonのsqlite3はすべての結果をフェッチするわけではありません

Pythonを使用してCSVファイルを分割すると、Excelのすべてのデータが表示されるわけではありません

再帰的なPython呼び出しは、すべてのオプションを検証するわけではありません

フラグ付きのPython re.subがすべてのオカレンスを置き換えるわけではありません

TypeError：Pythonスクリプト出力の文字列フォーマット中にすべての引数が変換されるわけではありません

Python書き込み関数がすべての画像を保存しているわけではありません

Python3：文字列のリスト。文字列は可変文字です（すべての位置にすべての文字があるわけではありません）

Python re.sub（）がすべての一致を置き換えるわけではありません

TypeError：MySQLとPythonを使用した文字列フォーマット中にすべての引数が変換されるわけではありません

PythonリクエストPOSTには、送信されたすべてのデータが含まれているわけではありません

Pythonを使用したMYSQLへのデータのインポートの問題（エラーコード：「SQLステートメントですべてのパラメーターが使用されたわけではありません）

Pythonから呼び出されて挿入するSQLServerストアドプロシージャは、常にデータを格納するわけではありませんが、IDcoutnerをインクリメントします

SQLステートメントですべてのパラメーターが使用されたわけではありません（Python、MySQL）

MySQLとPython：SQLステートメントですべてのパラメーターが使用されたわけではありません

Pythonでitertoolsを使用して、重複せず、網羅的なリストの「組み合わせのグループ」を取得する方法はありますか？

Pythonの応答-すべてのリクエストが実行されたわけではありません

Pythonパンダのピボットテーブルがすべての列を返すわけではありません

PythonイメージのすべてのPIXEL（すべてのrgbコンポーネントではありません！）に操作を適用するにはどうすればよいですか（numpy、opencv、またはPILのいずれかを使用）？

すべてのファイルにPythonの要素があるわけではありませんが、複数のXMLを解析します

BlenderのPythonスクリプトでアクションキーフレームをコピーして貼り付ける方法はありますか？

pandas / pythonでDataFrameを転置しますが、すべての列を転置するわけではありません

pyqt5を使用してPythonコードをGUIに変換する方法は？（qtデザイナーや他のアプリの使用は禁止されています。自分でコーディングする必要があります）

Python 3で列挙型を反復処理するときに、すべての要素が表示されるわけではありません