by-nc-sa     개발자, DBA가 함께 만들어가는 구루비 지식창고!

3. 병렬 조인




병렬 조인




성능 최적화 포인트: 각 병렬 프로세스들이 독립적으로 일 할 수 있도록 데이터 적절하게 분배



조인 방법

1. 양 쪽 모두 Join 컬럼에 대해 Partition 되어 있을 경우
2. 한 쪽 테이블만 Join 컬럼에 대해 Parition 되어 있을 경우
3. 둘 다 Join 컬럼에 대해 Partition 없어서 동적 파티셔닝
4. 둘 다 Join 컬럼에 대해 Partition 없어서 Broadcast

1번 경우(양쪽 모두 Join 컬럼 기준 파티션)




  • Full Partition Wise
  • 순서
    1 양쪽 테이블을 각각 같은 파티션으로 나눠 프로세스 분배
    2 각 프로세스 내부에서 조인
    3 최종 결과 QC 전송
  • 플랜에는
    PX PARTITION RANGE ALL
    PARTITION RANGE ITERATOR
  • 특징
    하나의 서버집합만 필요(Partition degree * 1 개 Process)
    파티션 기반 병렬처리이므로 파티션 갯수 이하로 병렬도 제한
    파티션 방식, 조인 방식에 무관하게 동작 가능
    양 테이블이 같은 컬럼, 같은 기준으로 파티션 되어 있어야 가능




2번 경우(한 쪽 테이블만 Join 컬럼에 대해 Parition)




  • Partial Partition Wise
  • 순서
    1 첫 서버 집합이 비 파티션 테이블을 파티션 테이블 기준으로 동적 파티셔닝
    2 각 프로세스 내부에서 조인
    3 최종 결과 QC 에 전송
  • 플랜에는
    PARTITION (KEY)
    PART (KEY)
  • 특징
    두 개의 서버집합 필요(Partition degree * 2 개 Process)
    각 서버집합 간 데이터 통신 발생


3번 경우(둘 다 Join 컬럼에 대해 Partition 없어서 동적 파티셔닝)




  • 순서
    1 첫 서버 집합이 outer 테이블 읽어 두 번째 서버 집합에 분배
    2 첫 서버 집합이 inner 테이블 읽어 두 번째 서버 집합에 분배
    3 두 번째 서버 집합이 각 프로세스 내부에서 조인
    4 최종 결과 QC 에 전송
  • 플랜에는
    PQ Distribute HASH
    PX SEND HASH
  • 특징
    조인 전에 메모리나 TEMP TBS 를 많이 사용
    전체범위 처리 필요
    조인컬럼 내부 데이터 분포 불균등할 경우 프로세스 간 처리 데이터 차이 발생 가능
    둘 다 대용량이고 조인컬럼 데이터 분포 균일할 때 효과적




4번 경우(둘 다 Join 컬럼에 대해 Partition 없어서 broadcast)




  • 순서
    1 첫 서버 집합이 작은 테이블 전체를 두 번째 집합의 모든 프로세스에 전송
    2 첫 서버 집합이 큰 테이블을 두 번째 집합의 각 프로세스에 동적 파티셔닝 해 전송
    3 두 번째 서버 집합이 각 프로세스 내부에서 조인
    4 최종 결과 QC 에 전송
  • 특징
    broadcasat 되는 테이블은 비교적 작아서 Serial 하게 읽는것이 일반적
    조인 방식에 무관하게 동작 가능
    작은 테이블은 전체범위 필요, 큰 테이블은 부분범위 가능




문서정보

Enter labels to add to this page:
Please wait 
Looking for a label? Just start typing.