クエリセットを使用してdjangoから100万レコードを取得するのは遅い

debugcn 投稿 Dev

ひまんしゅドゥア

以下のコードを使用しているテーブル（投稿）のすべてのオブジェクトを繰り返したい：

posts = Post.objects.all()
for post in posts:
   process_post(post)

process_post はバックグラウンドで実行され、投稿が更新されないセロリタスクですが、私が抱えている問題は、投稿テーブルに100万レコードがあることです。これは、1回限りのジョブではありません。毎日実行しています。

for post in posts

上記の行では、クエリが呼び出され、DBからすべてのデータを一度にフェッチします。

どうすればパフォーマンスを向上させることができますか？データをバッチでフェッチする方法はありますか？

itzMEonTV

あなた自身を作りなさいiterator。たとえば、1 millionレコードと言います。

count = Post.objects.all().count() #1 million
chunk_size = 1000   
for i in range(0, count, chunk_size):
    posts = Post.objects.all()[i:i+chunk_size]
    for post in posts:
        process_post(post)

クエリセットでのスライスはLIMIT、OFFSET使用法を再生します。クエリは増加するごとに減少する可能性がchunk_sizeありますが、メモリ使用量も増加します。ユースケースに合わせて最適化します。

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-05-30

コメントを追加

サインイン

分類Dev

Related 関連記事

記事

クエリセットを使用してdjangoから100万レコードを取得するのは遅い

クエリセットを使用してdjangoから100万レコードを取得するのは遅い

Django-クエリセットの最後から2番目のレコードを取得する方法は？

大きなクエリテーブルで行インデックス100万から200万のレコードを取得するにはどうすればよいですか？

クエリを使用してセルのGoogleスプレッドシートから日付を取得する

Djangoのクエリセットで最後から2番目のレコードを取得するにはどうすればよいですか？

PHPmongoDBが100万レコードからフィルターされたカウントを取得するのが非常に遅い

100万レコードでクエリを実行するMYSQLサーバーが非常に遅い

クエリを使用してazurecosmosdbから100を超えるレコードをフェッチする方法

Djangoクエリセットで重複したレコードを取得する

セットからコレクションとして100個のオブジェクトを取得するにはどうすればよいですか？

Googleスプレッドシートのクエリ関数のselectステートメントを使用してセルからテキストを取得するにはどうすればよいですか？

クエリを使用してDynamoDbのテーブルからすべてのレコードを取得する方法

最新の日付スタンプを使用してJOINからレコードセットを取得するにはどうすればよいですか？

Node.jsを使用してSQLServerからMongoDBに100万を超えるレコードをストリーミングする

djangoクエリセットで次のn個のレコードを取得するには?

LINQクエリは、セットに特定の値を持つ2つのレコードが含まれているかどうかを確認しますか？

Elastic searchで使用する特定のCIDR範囲に基づいて、IPアドレスのフィールドからレコードのセットを取得するクエリ

条件に基づいてlinqクエリから100レコードを取得する方法

Djangoクエリセットからテンプレートの反復可能なカウントを取得するにはどうすればよいですか？

条件を満たしている場合にレコードのサブセットから値を条件付きで返すPostgresクエリ

Django1.11のクエリセットTruncYearから生成されたオブジェクトリレーションを使用してリストをシリアル化するにはどうすればよいですか？

Djangoでprefetch_relatedを使用してクエリセットから属性を取得するにはどうすればよいですか？

合計で100万のフィールドがある場合に、特定のセットを使用可能なセットと比較して、最も交差する要素を持つセットを見つけるにはどうすればよいですか？

SQLiteデータベースファイルから100万件のレコードを取得し、それをWPFデータグリッドに表示する最速の方法は何ですか？

クエリを使用してazurecosmosdbからすべてのレコードをフェッチする方法

OneToOneリレーションを介して別のクエリセットからクエリセットを取得する

各セットから最大バージョンのレコードを取得する方法。適切なlinqクエリは何ですか

複数のレコードを使用して動的列のピボットクエリを作成するにはどうすればよいですか？

固定アドレス委任を使用してハリケーンエレクトリックからipv6ネットワークをセットアップするにはどうすればよいですか？

トップ10クエリを使用して、それらに関連付けられているすべてのレコードを検索します