대형 테이블의 최근 행에 대한 쿼리 성능 최적화

debugcn 에 게시 Dev

user2024300

큰 테이블이 있습니다.

CREATE TABLE "orders" (
"id" serial NOT NULL,
"person_id" int4,
"created" int4,
CONSTRAINT "orders_pkey" PRIMARY KEY ("id")
);

모든 요청의 90 %는 다음과 같이 지난 2 ~ 3 일 간의 주문에 대한 person_id것입니다.

select * from orders
where person_id = 1
and created >= extract(epoch from current_timestamp)::int - 60 * 60 * 24 * 3;

성능을 어떻게 향상시킬 수 있습니까?

Partitioning 에 대해 알고 있지만 기존 행은 어떻습니까? 그리고 INHERITS2-3 일마다 수동으로 테이블 을 만들어야하는 것 같습니다 .

Erwin Brandstetter

부분, 멀티 컬럼 인덱스 에 (person_id, created)의사 -와 IMMUTABLE조건이 도움이 될 것이다 (많은). 성능을 유지하려면 수시로 재생성해야합니다.

테이블이 그다지 크지 않은 경우 일반 다중 열 인덱스를 크게 단순화하고 사용할 수 있습니다.
또는 Postgres 12 이상 (기능이 마침내 완성 된 경우)에서 테이블 파티셔닝 을 고려 하십시오 .

기본 함수 는 3 일 이상 전의 일정한 시점을 제공합니다 (귀하의 경우에는 유닉스 시대로 표시됨).

CREATE OR REPLACE FUNCTION f_orders_idx_start()
  RETURNS int LANGUAGE sql IMMUTABLE PARALLEL SAFE COST 1 AS
'SELECT 1387497600';

PARALLEL SAFEPostgres 10 이상에만 해당됩니다.
1387497600결과 :

SELECT extract(epoch from now())::integer - 259200;
-- 259200 being the result of 60 * 60 * 24 * 3

이 의사 조건을 기반으로 부분 색인 을 작성하십시오 IMMUTABLE.

CREATE INDEX orders_created_recent_idx ON orders (person_id, created)
WHERE created >= f_orders_idx_start();

동일한 조건을 기반으로 쿼리 를 작성하십시오.

SELECT *
FROM   orders
WHERE  person_id = 1
AND    created >= f_orders_idx_start()  -- match partial idx condition
AND    created >= extract(epoch from now())::integer - 259200;  -- actual condition

라인 AND created >= f_orders_idx_start()은 중복 된 것처럼 보이지만 Postgres가 부분 인덱스를 사용하도록 설득하는 데 도움이됩니다.

재 작성 기능과 색인 기능 을 언제든지. 매일 밤 cron-job을 사용하는 경우 :

CREATE OR REPLACE FUNCTION f_orders_reindex_partial()
  RETURNS void AS
$func$
DECLARE
   -- 3 days back, starting at 00:00
   _start int := extract(epoch from now()::date -3)::int;
BEGIN       
   IF _start = f_orders_idx_start() THEN
      -- do nothing, nothing changes.
   ELSE
      DROP INDEX IF EXISTS orders_created_recent_idx;
      -- Recreate IMMUTABLE function
      EXECUTE format('
         CREATE OR REPLACE FUNCTION f_orders_idx_start()
           RETURNS int LANGUAGE sql IMMUTABLE PARALLEL SAFE COST 1 AS
         $$SELECT %s $$'
       , _start
      );
      -- Recreate partial index
      CREATE INDEX orders_created_recent_idx ON orders (person_id, created)
      WHERE created >= f_orders_idx_start();
   END IF;    
END
$func$  LANGUAGE plpgsql;

그런 다음 인덱스를 리베이스하려면 다음을 호출하십시오 (이상적으로는 동시로드가 거의 또는 전혀 없음).

SELECT f_orders_reindex_partial();  -- that's all

동시로드로 인해 인덱스를 삭제하고 다시 만들 수없는 경우 REINDEX CONCURRENTLYPostgres 12 이상을 고려하십시오 . 아주 간단합니다.

REINDEX INDEX orders_created_recent_idx;

이 함수를 호출하지 않더라도 모든 쿼리는 계속 작동합니다. 부분 인덱스가 증가함에 따라 시간이 지남에 따라 성능이 서서히 저하됩니다.

저는이 체제를 몇 개의 큰 테이블과 유사한 요구 사항과 함께 성공적으로 사용하고 있습니다. 매우 빠릅니다.

Postgres 9.2 이상의 경우 테이블에 작은 열이 몇 개만 있고 테이블이 많이 작성되지 않은 경우 포함 인덱스 를 만드는 데 비용이들 수 있습니다 .

CREATE INDEX orders_created_recent_idx ON orders (person_id, created, id)
WHERE created >= f_orders_idx_start();

Postgres 11 이상에서는 다음을 INCLUDE대신 사용할 수 있습니다 .

CREATE INDEX orders_created_recent_idx ON orders (person_id, created) INCLUDE (id)
WHERE created >= f_orders_idx_start();

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-05-30

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

대형 테이블의 최근 행에 대한 쿼리 성능 최적화

대형 테이블의 최근 행에 대한 쿼리 성능 최적화

한 행에 두 테이블 연결에 대한 쿼리 최적화

데이터베이스의 큰 테이블에 대한 쿼리 최적화 (SQL)

Rails : 관련 테이블에서 쿼리 최대 값 최적화

SQL의 하위 쿼리에 대한 최적화 된 쿼리

동일한 테이블 쿼리에서 일대 다 관계 최적화

최근 주문에 대한 SQL 쿼리

~ 20M 레코드 테이블의`inet` 열에 대한 "Bitmap Index Scan"의 추가 최적화 가능성

Oracle의 많은 대형 테이블에서 거대한 Union 작업 최적화

sqlite의 내부 조인에 대한 쿼리 최적화

Minizinc : 테이블 기능에 대한 최적의 주문

MS SQL에서 다양한 다른 테이블과 조인하는 선택 쿼리 성능 최적화

쿼리 최적화-SQL에서 효율적으로 일대 다 관계 테이블의 결과 조합

간단한 SQL 쿼리이지만 거대한 테이블-최적화 방법?

거대한 DB에 대한 MS SQL 선택 쿼리 최적화

작은 테이블에서 반복 쿼리를 최적화하기위한 임시 테이블 또는 뷰의 대안

테이블에서 두 번 이상 발생하는 모든 행 항목에 대해 2 개의 최근 행 간의 차이를 가져 오는 SQL 쿼리

VBA는 3 개의 루프에 대한 성능을 최적화합니다.

Pandas로 대형 HDFStore 테이블에서 쿼리 성능 향상

iOS 시작 화면 애니메이션에 대한 최적의 접근 방식

SQLite3의 중복 행에 대한 삭제 쿼리를 최적화 하시겠습니까?

MySQL 및 PHP를 사용하여 여러 행에 대한 업데이트 쿼리를 최적화하는 방법

MySQL 쿼리 최적화-여러 열에 대한 검색 조건

Mongodb에 대한 쿼리를 최적화하는 방법

WHERE 절에 대한 MySQL 쿼리 최적화

MySQL 성능 최적화에 대한 문제

SQL SERVER는 두 개의 유사한 쿼리에 대해 서로 다른 최적화되지 않은 실행 계획을 생성합니다.

최대 값 쿼리 최적화

피벗 테이블의 각 루프에 대해 최적화

"SQL Where 절"에 대한 테이블 디자인 최적화