大きなクエリテーブルで行インデックス100万から200万のレコードを取得するにはどうすればよいですか？

debugcn 投稿 Dev

yadongwen

最近、大きなクエリからm-labデータセットをダウンロードしようとしています。1回のクエリでクエリを実行して取得できる行数は約100万行に制限されているようです。m-labデータセットには、多くのテーブルに数十億のレコードが含まれています。のようなクエリを使用したいのですbq query --destination_table=mydataset.table1 "select * from (select ROW_NUMBER() OVER() row_number, * from (select * from [measurement-lab:m_lab.2013_03] limit 10000000)) where row_number between 2000001 and 3000000;"が、機能しませんでした。それを機能させるための回避策はありますか？どうもありがとう！

ジョーダンティガニ

大きなテーブル（m-labテーブルなど）をダウンロードしようとしている場合、最善のオプションは抽出ジョブを使用することです。たとえば、

bq extract 'mlab-project:datasset.table' 'gs://bucket/foo*'

これにより、テーブルがGoogleクラウドストレージオブジェクトgs：//bucket/foo000000000.csv、gs：//bucket/foo0000000001.csvなどに抽出されます。デフォルトではCSVとして抽出されますが、 `--destination_format = NEWLINE_DELIMITED_JSONをに渡すことができます。テーブルをjsonとして抽出します。

もう1つ言及すべきことは、tabledata list apiを使用してbigqueryの100万行目を読み取り、その特定のオフセットから読み取ることができることです（クエリは不要です！）。

bq head -n 1000 -s 1000000 'm-lab-project:dataset.table'

1000000行目から1000行を読み取ります。

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-06-28

コメントを追加

サインイン

分類Dev

Related 関連記事

記事

大きなクエリテーブルで行インデックス100万から200万のレコードを取得するにはどうすればよいですか？

大きなクエリテーブルで行インデックス100万から200万のレコードを取得するにはどうすればよいですか？

1億8000万レコードのテーブルのクエリを高速化するにはどうすればよいですか？

C＃WebアプリでSQL ServerテーブルからCSVに100万行を超える行をエクスポートするにはどうすればよいですか？

ReactアプリケーションでAPIに100万以上のリクエストを行うにはどうすればよいですか？

2,000万行のテーブルからデータを選択するサブクエリを高速化するにはどうすればよいですか？

100万ノードのリンクリストを実装するにはどうすればよいですか？

VBAで400万のアレイをループしながら時間コストを削減するにはどうすればよいですか？

1000万以上のレコードテーブルでの選択クエリのパフォーマンスをどのように改善しますか？

JSF-データテーブルから前に選択した行インデックスを取得するにはどうすればよいですか？

ディレクトリ内の1,000万を超えるファイルでsedを実行するにはどうすればよいですか？

クエリセットを使用してdjangoから100万レコードを取得するのは遅い

連続数を大きなクエリテーブルの1つの列に右パッドするにはどうすればよいですか？

クエリで別のテーブルからレコードをフェッチするにはどうすればよいですか？

ダウンストリームオブジェクトのサブセットから関与する複雑なアクティブレコードhas_manyからリストを取得するにはどうすればよいですか

特定のAWSPowershellコマンドレット/エイリアスからすべてのデータを取得するにはどうすればよいですか？

100万から100万の間の乱数を生成するにはどうすればよいですか？

高性能と低コストのために1500万行以上のテーブルキーを設定するにはどうすればよいですか？

テレリックアプリビルダープロジェクトからQRコードを取得して、スキャンしてデバイスからアプリケーションをプレビューできるようにするにはどうすればよいですか？

luaのネストされたテーブルからインデックスで値を取得するにはどうすればよいですか？

アンドロイドスタジオのタブ付きアクティビティテンプレートから円形のピンクのメールボックスアイコンを削除するにはどうすればよいですか？

DynamoDBテーブルのセカンダリグローバルインデックスを最適化して、すべてのレコードを並べ替え可能に保ちながら、レコードが均等に分散されるようにするにはどうすればよいですか？

カスタムクリックアンドドラッグを角度で行うときに、デフォルトのカーソルスタイル（テキストセレクター）を無効にするにはどうすればよいですか？

デリゲートのコレクションビューセルからindexPathアイテムを取得するにはどうすればよいですか？

Railsのアクティブレコード、HABTMリレーションでクエリを実行するにはどうすればよいですか？

SwiftでURLの大きなデータオブジェクトをエンコードするにはどうすればよいですか？

ダブルクリックで監視可能なコレクションデータグリッドをテキストボックスにバインドするにはどうすればよいですか？

削減されたデータセット（より大きなテーブルのサブセット）を使用してクエリのパフォーマンス時間を改善するにはどうすればよいですか？

NgxIndexedDBを使用してindexedDBインデックスから複数のレコードを取得するにはどうすればよいですか？

テンプレートのインデックスでフィールドを取得するにはどうすればよいですか？

R：データフレームから適切なラテックス回帰テーブルを取得するにはどうすればよいですか？