Pythonはスレッドごとに複数のプロセスをマルチプロセッシングします

debugcn 投稿 Dev

dter

私は現在、プールを備えたPythonのマルチプロセッシングモジュールを使用して、関数を何百万回も同時に実行しています。マルチプロセッシングはうまく機能しますが、この関数は非常に軽量であるため、各コアの30％しか使用されず、Locking（）中にのみスレッドが最大になります。私のスクリプトのプロファイルを見ると、確かにロックは最も費用がかかります。

各関数の実行が非常に短いことを考えると、関数にマッピングするたびにロックすることと関数を実行することの間のトレードオフは価値がありません（実際、シリアルで実行することでパフォーマンスが向上しています。15分並列化対4.5分シリアル）。

この関数は独立したファイルに書き込むため、呼び出しは完全に独立しています。同じ並列化されたPythonスクリプトを（異なる入力で）複数回実行/呼び出すことを「模倣」して、CPUをさらに活用することは可能ですか？

現在のコード：

pool = Pool(cpu_count(), initializer=tqdm.tqdm.set_lock, initargs=(Lock(),))

for _ in tqdm.tqdm(pool.imap_unordered(parallel_process, pubfiles, chunksize=70), total=nfiles, desc='Parsing files'):
  pass

編集：

tqdmのロックとは関係がないことを確認するには、コードを次のように変更すると同じ問題が発生します。

    pool = Pool(cpu_count())
    for i in pool.imap_unordered(parallel_process, files, chunksize=70):
        print(i)

私はしばらくの間コードのプロファイルを作成しましたが、最も高価なプロセスは一般にロック（？）/マルチプロセッシングに関連しているようです。実際の機能は、処理時間の最下部に非常に近いものです。

dter

この問題はマルチプロセッシングとは何の関係もありませんでした。各呼び出しがファイルの読み取りとディスクへの書き込みを行っていたため、関数はIOバウンドであり、これは並列実行時のボトルネックでした。チャンク化して書き込まれるファイルの数を減らすと、このボトルネックが減り、上記のマルチプロセッシングコード（並列処理）は完全に正常に機能しました。

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-08-10

コメントを追加

サインイン

分類Dev

Related 関連記事

記事

Pythonはスレッドごとに複数のプロセスをマルチプロセッシングします

Pythonはスレッドごとに複数のプロセスをマルチプロセッシングします

スレッドごとに異なる定数を使用したPythonマルチプロセッシング

Intellij IDEAは、デバッグセッションごとに複数のプロセスを作成しますか？

Intellij IDEAは、デバッグセッションごとに複数のプロセスを作成しますか？

Tkinterの複数のタブ:(マルチスレッドまたはマルチプロセッシング）

マルチプロセッシングは、プロセスごとに現在のフォルダを変更します

Pythonマルチプロセッシングでは、子プロセスはどのようにして別の子プロセスを終了できますか？

Pythonでのマルチスレッド/マルチプロセッシング中に重複した結果を避ける方法は?

ループを高速化するPythonマルチスレッドとマルチプロセッシング

複数のtqdmプログレスバーを使用したマルチプロセッシング

ファイルをダウンロードするためのPythonでのマルチプロセッシングまたはマルチスレッド

マルチプロセッシング：ファイルハンドルをプロセスに渡します

LinuxでのPythonスレッドとマルチプロセッシング

Python-IOのマルチプロセッシングとスレッド

zmq.error.ZMQError：製紙工場を使用して複数のノートブックでマルチプロセッシングを実行しているときに、アドレスはすでに使用されています

マルチスレッドシングルコアCPUで複数のプロセスを並行して実行できますか？

このスクリプトでマルチスレッド（またはマルチプロセッシング？）を実装しますか？

Pythonマルチプロセッシング-プール内のプロセスの数はエラー時に減少しますか？

Pythonマルチプロセッシングワーカープロセスが複数のコアを使用しないのはなぜですか？

Pythonマルチプロセッシングの子プロセスが親イベントまたはメソッドをトリガーします

Pythonでマルチプロセッシングを行う場合、グローバル変数は各プロセスで複製されますか？

Pythonでマルチスレッドをマルチプロセッシングに変換する

Pythonマルチプロセッシング。プロセスは非決定論的に動作します

Pythonマルチプロセッシング。プロセスは非決定論的に動作します

Pythonマルチプロセッシングは不明な引数でスクリプトを再起動します

キルプロセス後のPythonマルチプロセッシングはis_alive（）ステータスをTrueにします

Python（マルチプロセッシング）：ワーカープロセス初期化関数の引数として辞書を渡す方法は？

Pythonマルチプロセッシング-プロセスの終了（プロセスを2回開始することはできません）

Python：マルチプロセッシングスレッドを閉じると、プログラム全体が停止します

マルチプロセッシングはコアとスレッドにどのように関連していますか？