모든 요청에서 Bigquery 응답을 10000으로 분할하는 방법

debugcn 에 게시 Dev

아르 준 코리

'SELECT visitorId , totals.visits FROM [12123333.ga_sessions_20160602]'한 번의 요청으로 500k 행을 반환하는 bigquery 가 있습니다.

그러나 한 요청에서 1 행에서 10,000 행으로 데이터를 조각화하고 다음 요청에서 다음 10,001 ~ 20,000 개를 가져 오는 식입니다.

미리 감사드립니다.

미하일 베를 리언 트

하나의 옵션은 대상 테이블에 쿼리의 쓰기 결과에있을 다음 사용하는 것이 Tabledata을 : 목록 API 사용 중 하나 페이징 방식으로 해당 테이블에서 데이터를 검색 maxResults하고 pageToken페이지에서 페이지를 검색하거나 maxResults및 startIndex행의 지정된 세트를 검색 할 수 있습니다.

또 다른 옵션 은 쿼리에 row_number를 추가하는 것입니다 (아래와 같음).

SELECT visitorId , totals.visits,  
  ROW_NUMBER() OVER() as num
FROM [12123333.ga_sessions_20160602]

여전히 대상 임시 테이블에 결과를 쓴 다음 예를 들어 num그룹화를 num % 10000 = {group_number}위해 새 필드를 사용하여 해당 테이블에서 데이터를 검색합니다 . 또는 당신이 사용할 수 있습니다 INTEGER(num / 10000) = {group_number}-당신이 더 좋아하는 것은 무엇이든

SELECT visitorId , totals.visits 
FROM tempTable
WHERE num % 10000 = 0

다음은

WHERE num % 10000 = 1

등등 ...

참고 : 두 번째 옵션은 각 파티션 (이 경우 하나의 파티션-모든 행)에 대한 모든 데이터가 동일한 노드에 있어야 하는 비용이 많이 드는 ( 실행 현명-청구 현명 아님) ROW_NUMBER () 함수를 사용하므로 숫자에 따라 다릅니다. 작동하거나 작동하지 않을 수 있습니다. 500K 행만있는 특정 예의 경우 작동하지만 수백만 행이있는 테이블로 확장하면 그렇지 않을 수도 있습니다 (각 행에서 출력하는 데이터의 양과 행 수에 따라 다름).

참고 :
-첫 번째 옵션에서는 결과를 생성하고 임시 테이블에 저장할 때 한 번만 지불합니다. 그렇다면 Tabledata.list API는 BigQuery 쿼리 자체를 사용하지 않고 기본 데이터에서 직접 읽기만하므로 무료로 사용할 수 있다는 점에서 무료입니다.
- 두 번째 옵션에서 당신은 둘 다 지불 - 당신은 임시 테이블을 생성 할 때 와 때마다 당신은 / 쿼리 또 다른 그룹을 검색 - 모든 BigQuery에서 쿼리이기 때문이다. 또한 특정 그룹에 대한 데이터를 얻을 때마다 전체 임시 테이블을 스캔하는 데 요금이 부과되므로 귀하의 경우에는 추가로 50 번

이것은 (귀하의 경우) 첫 번째 옵션을 두 번째 옵션보다 약 51 배 저렴하게 만듭니다 : o)

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-06-13

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

모든 요청에서 Bigquery 응답을 10000으로 분할하는 방법

모든 요청에서 Bigquery 응답을 10000으로 분할하는 방법

Electron : 메인 프로세스에서 모든 요청 응답을 포착하는 방법은 무엇입니까?

iOS 앱에서 모든 요청 응답을 캐시하는 방법은 무엇입니까?

Tomcat 7에서 요청 / 응답의 모든 헤더를 기록하는 방법

응답으로받은 변수를 늘리고 다음 요청에서 새 값을 할당하는 방법 JMETER

Axios : axios 요청을 가로 채서 응답하는 방법

Java에서 모든 SIP 통화에 자동으로 응답하는 방법

SOAP 응답을 soapui에서 메모장으로 복사하는 방법

CodeIgniter 및 PHPExcel을 사용하여 ajax 응답에서 파일 다운로드를 처리하는 모든 방법

Microsoft.AspNetCore.ResponseCompression으로 모든 응답을 압축하는 방법

Karate-응답 배열에서받은 값으로 Soap 요청을 반복하는 방법

외부 API의 요청을 결합하고 Flask에서 응답으로 보내는 방법

병렬 요청을 수행하고 Javascript에서 모든 병렬 응답을 포함하는 객체를 반환하는 방법은 무엇입니까?

모든 Ajax 요청에 대한 응답을 위해 미들웨어를 만드는 방법

EmberJs에서 Ajax 요청의 응답을 모델에 바인딩하는 방법은 무엇입니까?

PHP에서 SOAP API 응답으로 얻은 XML 응답에서 값을 구문 분석하는 방법

PHP에서 SOAP API 응답으로 얻은 XML 응답에서 값을 구문 분석하는 방법

Django Rest Framework에서 500 오류가 발생하면 모든 요청과 응답을 기록하는 방법은 무엇입니까?

AngularJS에서 모달의 응답을 서비스로 처리하는 방법

POST 요청에 대해 PHP에서 응답을받는 방법

문자가 그룹으로 분할 된 특정 문자 앞에있는 모든 것을 삭제하는 방법

HTTP 요청에서 Jmeter JDBC 요청의 응답을 사용하는 방법

응답을 자바에서 JSON으로 구문 분석하는 방법

jmeter의 모든 응답 코드에 대한 샘플 응답을 저장하는 방법은 무엇입니까?

Ajax 응답을 모달 팝업으로 표시하는 방법

jquery ajax 요청에서 응답을받는 방법

Google 시트의 한 열 아래에 모든 응답을 수집하는 방법

Akka HTTP POST 요청에서 JSON 본문을 읽고 최종 응답을 JSON 배열로 보내는 방법

응답으로 속성에서 백본 모델을로드하는 방법은 무엇입니까?

jquery에서 ajax의 응답 HTML을 분할하는 방법