View Source

h1. 기본적인 용어들

* Histogram을 이해하는데 알아야 할 용어

{code}

* 아래 샘플 테이블 t1 의 컬럼 c1 의 예를 들었을 때

SQL> select c1, count(*) from t1 group by c1;

C COUNT(*)
- ----------
A 500
B 300


{code}

|| 용어명 || 용어 정의 || 샘플 예제로 본 의미 ||
| Value | 값 | t1.c1 의 value 는 A, B
| Frequency | 빈도 : 특정 값에 속하는 원소의 개수 | A = 500, B = 300 |
| Bucket | 바구니 : 값들이 속하는 범위 | 아래에 별도 설명 |

\\
h5. Bucket
* Bucket 을 이해하기 위한 기본 전재
** Oracle이 Histogram에서 저장할 수 있는 값(value)의 최대 개수 : 254개
** 즉 254개 이상의 값을 가지는 컬럼은 각각의 값 별로 빈도를 저장 할 수 없다.

\\
* Histogram에서의 Bucket
** 254개 이상의 값을 가지고 있는 컬럼의 경우 적절한 범위(Bucket)로 나누어 빈도를 저장할 수 있음
** Bucket Size는 조정 가능. Bucket Size <= 254 (즉 반드시 값이 254개가 넘어야 bucket 에 저장된다.. 는 개념이 아니라는 것임)
ex) 상품매출 테이블에서 매출수량 컬럼의 빈도는 아래와 같이 저장
\{(0~100), 100건}, \{(101~1000), 150건}, \{(1001~1500), 5건}