View Source

h3. 오디오 부호화를 위한 배경 지식
- 에디슨의 축음기는 아날로그 방식으로 소리 저장 방법이다.
- 아날로그 방식의 저장방법은 진폭과 톤의 변화를 물리적인 자극을 통해 그대로 기록하는 것이다.

h3. 아날로그 신호의 샘플링과 양자화
- 디지털 신호로 변화하기 위해서는 먼저 아날로그 신호를 샘플링하는 작업이 필요하다. 샘플링이란 말 그대로 지속적인 신호의 압력 중에 일정 간격으로 샘플링된 신호만을 취하는 작업이다.
- 샘플링된 실수값을 정수값으로 표현하는 양자화 과정이 필요하다.

h3. 간단한 디지털 오디오 코더의 구성
- 간단한 오디오 코더로 잘 알려진 PCM(Pulse Code Modulation)코더이다. 이 코더가 적용된 분야 중에 가장 널리 알려진 것은 CD포맷이다.

h3. 주파수 영역으로 오디오 신호 변환
- 시간 영역 신호는 주파수 영역으로 표현할 때, 매우 간단하게 표현 할 수 있는 경우가 발생한다.
- 시간영역에서는 많은 샘플로 표현되는 것도 주파수 영역에서는 대표적인 주파수 값의 성분으로 표현이 가능하다.
- 시간 영역 디지털 오디오 코더를 사용한다면 상당히 많은 수의 샘플에 많은 양의 비트를 할당해야 한다.
- 그러나 주파수 영역에서는 적은 수의 샘플만 표현하면 되기 때문에 적은 양의 비트로도 동일한 신호를 표현할 수 있다.

h3. 오디오 부호화의 원리
- 오디오신호 : 20Hz~20kHz
- 음성신호 : 20Hz~4kHz
- 오디오 부호화 기술의 분류 : 손실 오디오 부호화 / 무손실 오디오 부호화

h3. 심리음향 모델
- 공통적 수신원인 귀의 청각 특성을 이용하여 중복성을 제거해야 하는데, 여기에 주로 적용된 특성은 마스킹 현상이다.
- 시간 차이를 두고 일어나는 두 신호 사이의 시간 영역 마스킹을 '순시 마스킹'이라고 한다. '동시 마스킹'이란 어떤 주파수 대역에 순음이나 잡음이 존재할 때, 주의 대역의 작은 음압레벨을 가지는 신호들이 들리지 않게 되는 현상을 말한다.
- 마스킹 현상은 주파수 영역의 동시 마스킹이 보다 효과적으로 적용될 수 있다. 때문에 고음질 오디오 부호화는 필터뱅크를 사용한 서브밴드 부호화나 DFT. DCT등을 사용한 변환 부호화 방식으로 주파수 영역으로 변환하 후, 심리음향 모델로부터 얻어낸 마스킹 임계치에 근거하여 각 서브밴드별로 재양자화함으로써 높은 압축률을 얻을 수 있게 된다.

h3. 돌비 AC-3 오디오 부호화
- 압축률을 높이기 위해서 채널 간이나 채널 내의 마스킹 특성을 이용하며, 고주파 대역의 채널 커플링을 이용하여 보다 낮은 비트율을 제공한다.
- 기본적인 부호화 방법은 시간축 에일리어싱제거 방법에 기초한 MDCT변환을 이용하는 지각 오디오부호화 방식을 사용하였다.
- 전처리 과정 : 변환 부호화 방식의 단점인 프리에코를 없애기 위한 것으로, 먼저 부호화하기에서 입력 PCM파형을 고역 필터에 통과시켜 DC성분을 모두 없앤 후 천이 구간을 검출한다.
- 시간영역 에일리어싱 제거 방법에 기초한 MDCT변환
- 지수부 부호화
- 가수부 부호화
- 채널간 부호화

h3. MPEG-1/2 오디오 부호화
- MPEG-1/2 오디오 표준안은 구현의 복잡성 및 비트율에 따라 계층 1, 계층2, 계층3으로 나누어지며, 흔히 MPEG-2 BC는 MPEG-2 계츨 2를 일컫는다.
- MPEG-1 오디오
-- 이 표준은 AC-3와 유사하게 지각 오디오 부호화 알고리즘을 이용하며, 두 가지 기술에 기반을 두고 표준화하였다.
-- 하나는 MUSICAM으로 MPEG-1계층 1과 계층2의 기초가 되었다.
-- 또한 ASPEC은 AT&T, 프라운호퍼, 텔레푼켄에 의해 개발되었으며, 계층3의 기반이 되었다.
- MPEG-2 오디오 BC
-- MPEG-2 오디오 BC는 MPEG-1 오디오와 호환성을 유지하면서 멀티채널과 다양한 샘플링 주파수를 지원한다.
-- MPEG-2 BC에서 채널 간 중복성을 제거하기 위한 부호화 방법으로 동적 전송채널 전환, 다이내믹 크로스토크, 적응 멀티채널 예측, 중앙 채널 가상 부호화등 다양한 방식이 있다.

h3. MPEG-2/4 AAC 부호화
- AAC표준은 전세계의 진보된 오디오 부호화 기술을 가진 기업들이 협력한 결과다.
- AAC는 매우 낮은 비트율에서 방송 음질 수준의 오디오을 제공하기 위해서 고해상도 필터뱅크, 예측기법, 허프만 부호화등을 결합해 사용한다.
- MPEG-2 AAC 부호화 및 복호화 개념 : 이득제어, 필터뱅크, 예측 양자화 및 부호화, 무손실 부호화, 비트열의 생성, 시간축 잡음 변형, M/S 스테레오 부호화와 음압 스테레오 부호화 같은 툴을 이용하여 부호화 효율을 극대화 하였다.

h3. MPEG-D 오디오 부호화
- 2003년 MPEG 서라운드 표준화를 시작하면서 새로운 오디오 표준 파트로 제정되었다.
- MPEG-D표준화 초창기에는 공간 오디오 부호화 기술에 기반한 멀티채널 및 다객체 오디오 부호화 기술에 대한 표준화가 주된 목적이었기 때문에 독립적으로 동작하는 오디오 부호화 기술이 아닌 멀티채널로 확장하거나, 다객체로 확장하기 위한 부가적인 툴로서 표준화되었다.
- 공간 오디오 부호화 기술의 원리 : 멀티채널 또는 다객체 오디오 신호를 최소한의 채널로 다운믹스된 오디오 신호와 공간단서들로 이루어지는 부가 정보로 분할하여 압축하는 오디오 부호화 방식이다.
- MPEG 서라운드 : 최소의 채널로 합쳐진 다운믹스와 멀티채널 오디오 신호에 대한 인간의 지각 특성을 나타내는 공간단서 파라미터들로 구성된 부가 정보를 이용하여 멀티채널 오디오 신호를 부호화 하는 기술이다.
- SAOC
- USAC