Elasticsearchのインデックス作成パフォーマンス：スロットルマージ

debugcn 投稿 Dev

アントンボルモトフ

いくつかのインデックスで、それぞれ約10GBのデータをelasticsearchクラスターにインポートしています。
同時に、私たちは既存のインデックスの検索に関心を持っています。それらのいくつかは小さい-〜100mb、いくつかは大きい-〜10gbです。

インデックス作成を最適化するために、次のことを行い
ますbulk。-最適化されたバルクサイズでAPIを使用します。
-更新間隔を-1;に設定します。
-レプリケーション係数を0;に設定します。

現在、マージスロットリングがどのように役立つかを理解しようとしています。既存のインデックスに対してのみ検索する場合、検索とセグメントのマージはどのように関連していますか？

この記事によると、マージスロットリングを無効にすることができます。
-それは、マージがディスクI / Oを「食べる」ことを意味しますか？
-それは、マージがまったく行われず_forcemerge、インデックス作成が行われた後、手動で行う必要があることを意味しますか？このような場合、最大オープンファイル記述子について心配する必要がありますか？

これらの記事とプルリクエストによると、マージ設定にはまったく触れないでください。

ここで非常に混乱しています、どんな助けでも大歓迎です。

アントンボルモトフ

ここでの議論によると：

ES 2.x以降、IOスロットルはLuceneによって自動的に処理されます。つまり、マージされたセグメントへのバイトの書き込み時に20MB /秒のスロットルで開始されます。次に、マージが遅れるとそのレートが増加し、それ以外の場合は減少します。これは、時間の経過とともに、マージがインデックス作成の速度に追いつくために必要なだけのIO帯域幅を吸収することを意味します。

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-07-27

コメントを追加

サインイン

分類Dev

Related 関連記事

記事

Elasticsearchのインデックス作成パフォーマンス：スロットルマージ

Elasticsearchのインデックス作成パフォーマンス：スロットルマージ

ApacheIgniteインデックス作成のパフォーマンス

インデックス作成のJavascriptパフォーマンス

クイルスパンブロットフォーマット

Elasticsearchのインデックスタイプ、パフォーマンスの理由

マルチインデックス付きのロングフォーマットからワイドフォーマットのパンダ

SQLServerでのインデックス作成のパフォーマンス

oracledbのluceneインデックスの作成-パフォーマンス

インデックス作成がストアドプロシージャのパフォーマンスにどのように影響するか

Solrのインデックス作成方法とパフォーマンス

Elasticsearchインデックスポリシー作成のベストプラクティス/パフォーマンス

SQLiteインデックスのパフォーマンス

SurfaceBookのWindowsパフォーマンスインデックス

MySQLテーブル-パフォーマンス、インデックスの数

再起動後のデスクトップグラフィックスのパフォーマンスの低下（ジャンピーマウスポインター）

スフィンクスのインデックス作成パフォーマンスを考える

パフォーマンスに関する空のElasticSearchインデックスのオーバーヘッド

SQLテーブルのパフォーマンスを最適化する-インデックス作成

Reactフックスクロールイベントのパフォーマンスの問題

ベクトルサブセットのパフォーマンス：名前とインデックス

インデックス作成時のドキュメントの順序は、Elasticsearchの検索パフォーマンスを向上させますか？

5.25インチフロッピーディスクのフォーマット

インデックスページのExcelマクロの作成

WinFormsデザイナのカスタムコントロールのフォーマットプロパティ

フラッシュディスクを使用したエアロスパイクのパフォーマンス

CouchDBビューインデックスのパフォーマンス

バウンディングボックスのトランスフォーマーコントロールkonvajs

スマートロジックは、PostgreSQLの関数内のパフォーマンスを照会します

スマートロジックは、PostgreSQLの関数内のパフォーマンスを照会します

Mysql-DATETIMEフィールド（インデックス付き）のパフォーマンスのクエリ