- 이 문서는 구루비에서 작성하였습니다.
- 이 문서를 다른 블로그나 홈페이지에 게재하실 경우에는 출처를 꼭 밝혀 주시면 고맙겠습니다.~^^
- 출처 : http://wiki.gurubee.net/pages/viewpage.action?pageId=31391871&
- 구루비 지식창고의 모든 문서는 크리에이티브 커먼즈의 저작자표시-비영리-동일조건변경허락(BY-NC-SA) 라이선스에 따라 자유롭게 사용할 수 있습니다.
신비롭고 과학적인 인간의 소리 생성과 인지
음성신호
- 음성신호는 시간에 따라 변하는 진폭값을 가지는 형태로 표현
- 주파수 분석을 위해 가로축은 시간의 변화량, 세로축은 주파수 성분으로 스펙트로그램 형태로 표현 할 수 있다.
- 스펙트로그램(spectrogram)
- 가로축 : 시간의 변화량
- 세로축 : 주파수 성분 (색이 진할 수록 해당 주파수 성분의 크기가 강함을 의미한다)
- 포먼트(formant)
- 성도에서 발생하는 공진 주파수를 의미한다.
- 그림에서 붉은색으로 나타나는 부분이다.
- 피치(pitch)
- 유성음의 파형에서와 같이 주기적인 파형의 반복주기를 의미한다.
- 무성음은 피치가 불규칙하기 때문에, 큰 의미가 없지만 유성음에서 중요한 정보로 사용된다.
가청 주파수/데시벨
- 인간이 들을 수 있는 가청주파수는 20Hz~20kHz의 주파수 대역이다
- 20Hz 미만을 초 저주파, 20kHz이상을 초고주파라고 한다.
- 인간이 들을 수 있는 가청데시벨은 0~130dB 이다.
등청감곡선
- 인간의 귀는 주파수에 따라 소리의 크기를 다르게 받아들이는데 이러한 귀의 특성을 나타낸 것을 등청감곡선 이라 한다.
- 가로축은 주파수, 세로축은 음압, 선(line)은 인간이 같은 크기로 인식하는 소리를 나타낸다.
dBA, dBB, dBC
- 우리 인간은 음의 세기에 따라 동일 주파수에서 느끼는 감도가 다르다
- 음의 크기를 측정할 때 음의 크기에 대한 주파수 가중 값을 고려한 측정값을 표현하기 위해 dBA, dBB, dBC를 사용한다.
- dBA
- ~55dB
- 음의세기가 낮은 일상적인 대화 수준의 음에 대한 주파수별 감도를 고려하여 가중값을 준 것
- 가장 많이 사용
- dBB
- 55~85dB
- 음의 세기가 높아져 중간정도 크기의 음
- dBC : 음의 세기가 아주 높은 음, 85dB~
도플러(Doppler) 효과
- 물체의 움직임에 따라 주파수가 달라지는 현상
- 다가오는 속도 때문에 음파가 밀집되어 고음 성분이 커지고, 관찰자를 지나면 멀어질수록 반대로 저음 성분이 커지는 현상
음압의 세기차이(Interaural Level Difference, ILD)
- 두 귀의 음압 세기 차이를 ILD라 한다.
- 음원의 위치에 따른 두 귀까지의 경로 차이와 이 경로차이에 의한 감쇠량의 차이로 발생한다.
- 주기가 머리 지름보다 작은 고주파 영역에 한해 입체음향 지각이 가능하다.
음파간의 시간차이(Interaural Time Difference, ITD)
- 두 귀 사이의 음의 시간차를 ITD라 한다.
- ILD처럼 원의 위치에 따른 두 귀까지의 경로 차이로 나타난다.
- ITD는 ILD와 반대로 주기가 머리 지름보다 큰 저주파 영역에 한해 입체음향을 지각할 수 있다.
그림 ITD(좌)와 ILD(우) |
---|
![]() |
HRTF (Head Related Transfer Function)
- 머리와 귀의 모양에 따라 귀에서 받는 음향 신호의 특성을 머리전달함수(HRTF)라 한다.
- 인간의 청각기관을 모델링한 더미헤드 마이크를 이용해 360도 방위각과 180도 고도각 사이를 일정하게 간격을 두고 각각의 위치에 대한 좌우 양쪽 임펄스 응답을 구한 값
- 각 방향의 머리 전달함수가 유일한 특성을 가졌을 때 이를 이용하면 입체 음향을 만들어 낼 수 있다.
입체음향
- 입체음향의 원리는 두 귀의 외이도 입구에서 음을 녹음하고, 재생할 때 다시 두 귀의 외이도 입구에서 재생하면 된다.
- 더미헤드(Dummy Head) 라는 마이크폰을 이용
- 더미헤드 : 귀 부분에 마이크를 설치한 사람 머리 모양의 녹음장치
마스킹
- 마스킹이란 조용할 때 들리던 소리가 주위의 소음이 증가하면서 들리지 않게 되는 현상이다.
- 마스커(Masker) : 마스킹 현상을 발생시키는 음
- 마스키(Maskee) : 마스킹되는 음
- 임계대역(critical band) : 마스킹 효과가 미치는 주파수 대역
- 음원파일 압축시 음악신호를 분석하여 마스킹 효과에 의해 잘 들리지 않는 신호를 제거하여 저장공간을 줄일 수 있다.
칵테일파티 효과
- 여러 음원이 존재 할 때 우리 인간은 자신이 듣고 싶은 음만 선별해서 들을 수 있는 능력을 지녔는데 이를 칵테일파티 효과라 한다.
- 주변이 매우 시끄러운 장소에서도 상대방과 대화를 진행 할 수 있는 이유도 바로 이 때문이다.
- 인간의 청각기관이 음색을 선택 할 수 있는 일종의 필터를 가지고 있다
문서정보
- 이 문서는 구루비에서 작성하였습니다.
- 이 문서를 다른 블로그나 홈페이지에 게재하실 경우에는 출처를 꼭 밝혀 주시면 고맙겠습니다.~^^
- 출처 : http://wiki.gurubee.net/pages/viewpage.action?pageId=31391871&
- 구루비 지식창고의 모든 문서는 크리에이티브 커먼즈의 저작자표시-비영리-동일조건변경허락(BY-NC-SA) 라이선스에 따라 자유롭게 사용할 수 있습니다.