スパーク| 生成するパーツファイルが多すぎます

debugcn 投稿 Dev

スライダーV

Parquetとしてストレージを備えたHIVEターゲットがあります。Informatica BDMジョブは、データをHIVEターゲットにロードする実行エンジンとしてsparkを使用するように構成されています。

HDFSのパーティション内に生成されたパーツファイルが約2000個あることに気づきました。この動作は、HIVEのパフォーマンスに影響を与えます。

同じものに代わるものはありますか？

入力ファイルサイズはわずか12MBです

ブロックサイズは128MBです

よろしく、Sridar Venkatesan

スライダーV

根本的な原因はspark.sql.shuffle.partitionsによるものでした

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-08-12

コメントを追加

サインイン

分類Dev

Java 8パスストリームとFileSystemException（開いているファイルが多すぎます）

分類Dev

Javaの場合：ネットワークパスから読み取る際の「開いているファイルが多すぎます」エラー

分類Dev

インデックスの合計サイズが大きすぎるか、informixのインデックスのパーツが多すぎます

分類Dev

エラー：EMFILE：開いているファイルが多すぎます

分類Dev

Dockerエラー：開いているファイルが多すぎます

分類Dev

「開いているファイルが多すぎます」エラーxcode

分類Dev

Python：開いているファイルが多すぎますエラー

分類Dev

名前付きパイプを使用すると、「開いているファイルが多すぎます」エラーが発生します

分類Dev

Rails 4アプリのCSSファイルが多すぎるとパフォーマンスの問題が発生しますか？

分類Dev

PHPファイルのダウンロードパスが長すぎます

分類Dev

インクルードパスが多すぎるということはありますか？

分類Dev

FileOutputStreamがFileNotFoundExceptionをスローします（開いているファイルが多すぎます）

分類Dev

ファイルを読み取るPowerShellスクリプトのパフォーマンスが遅すぎる

分類Dev

ファイルを読み取るPowerShellスクリプトのパフォーマンスが遅すぎる

分類Dev

ファクトリーのコンストラクターのパラメーターが多すぎると、コードの匂いがしますか？

分類Dev

使用するスパイダーが多すぎると、Scrapyクロールが失敗します（クロールされた0ページ）

分類Dev

IOExceptionをスローする開いているファイルが多すぎます

分類Dev

Pythonでの複雑なPOSTリクエスト-マルチパートファイル-値が多すぎて解凍できません

分類Dev

開いているファイルが多すぎてパイプを開くことができません

分類Dev

シェルで「開いているファイルが多すぎます」エラーを再現する方法

分類Dev

PATH変数のフォルダーパスが多すぎますか？

分類Dev

IntelliJファイルオープンエラーが多すぎます

分類Dev

WindowsにはGradleファイルパスが長すぎます

分類Dev

1つのパーティクルが多すぎます：GL_INVALID_VALUEエラーが生成されました。<start>は、シェーダーストレージバッファーの最小配置要件を満たしていません

分類Dev

Spring BootAdmin-システムエラーで開いているファイルが多すぎます

分類Dev

Windows 7で開くファイルが多すぎます（EMFILEエラー）

分類Dev

HDFSノードのOOMファイルが多すぎますか？

分類Dev

awk：出力ファイルが多すぎます10レコード番号12

分類Dev

エラー：「開いているファイルが多すぎます」...しかし、なぜですか？

Related 関連記事

記事