by-nc-sa     개발자, DBA가 함께 만들어가는 구루비 지식창고!

02.신비롭고 과학적인 인간의 소리 생성과 인지




신비롭고 과학적인 인간의 소리 생성과 인지

음성신호

  • 음성신호는 시간에 따라 변하는 진폭값을 가지는 형태로 표현
  • 주파수 분석을 위해 가로축은 시간의 변화량, 세로축은 주파수 성분으로 스펙트로그램 형태로 표현 할 수 있다.
  • 스펙트로그램(spectrogram)
    • 가로축 : 시간의 변화량
    • 세로축 : 주파수 성분 (색이 진할 수록 해당 주파수 성분의 크기가 강함을 의미한다)
  • 포먼트(formant)
    • 성도에서 발생하는 공진 주파수를 의미한다.
    • 그림에서 붉은색으로 나타나는 부분이다.
  • 피치(pitch)
    • 유성음의 파형에서와 같이 주기적인 파형의 반복주기를 의미한다.
    • 무성음은 피치가 불규칙하기 때문에, 큰 의미가 없지만 유성음에서 중요한 정보로 사용된다.

가청 주파수/데시벨

  • 인간이 들을 수 있는 가청주파수는 20Hz~20kHz의 주파수 대역이다
  • 20Hz 미만을 초 저주파, 20kHz이상을 초고주파라고 한다.
  • 인간이 들을 수 있는 가청데시벨은 0~130dB 이다.

등청감곡선

  • 인간의 귀는 주파수에 따라 소리의 크기를 다르게 받아들이는데 이러한 귀의 특성을 나타낸 것을 등청감곡선 이라 한다.
  • 가로축은 주파수, 세로축은 음압, 선(line)은 인간이 같은 크기로 인식하는 소리를 나타낸다.

dBA, dBB, dBC

  • 우리 인간은 음의 세기에 따라 동일 주파수에서 느끼는 감도가 다르다
  • 음의 크기를 측정할 때 음의 크기에 대한 주파수 가중 값을 고려한 측정값을 표현하기 위해 dBA, dBB, dBC를 사용한다.
  • dBA
    • ~55dB
    • 음의세기가 낮은 일상적인 대화 수준의 음에 대한 주파수별 감도를 고려하여 가중값을 준 것
    • 가장 많이 사용
  • dBB
    • 55~85dB
    • 음의 세기가 높아져 중간정도 크기의 음
  • dBC : 음의 세기가 아주 높은 음, 85dB~

도플러(Doppler) 효과

  • 물체의 움직임에 따라 주파수가 달라지는 현상
  • 다가오는 속도 때문에 음파가 밀집되어 고음 성분이 커지고, 관찰자를 지나면 멀어질수록 반대로 저음 성분이 커지는 현상

음압의 세기차이(Interaural Level Difference, ILD)

  • 두 귀의 음압 세기 차이를 ILD라 한다.
  • 음원의 위치에 따른 두 귀까지의 경로 차이와 이 경로차이에 의한 감쇠량의 차이로 발생한다.
  • 주기가 머리 지름보다 작은 고주파 영역에 한해 입체음향 지각이 가능하다.

음파간의 시간차이(Interaural Time Difference, ITD)

  • 두 귀 사이의 음의 시간차를 ITD라 한다.
  • ILD처럼 원의 위치에 따른 두 귀까지의 경로 차이로 나타난다.
  • ITD는 ILD와 반대로 주기가 머리 지름보다 큰 저주파 영역에 한해 입체음향을 지각할 수 있다.
그림 ITD(좌)와 ILD(우)

HRTF (Head Related Transfer Function)

  • 머리와 귀의 모양에 따라 귀에서 받는 음향 신호의 특성을 머리전달함수(HRTF)라 한다.
  • 인간의 청각기관을 모델링한 더미헤드 마이크를 이용해 360도 방위각과 180도 고도각 사이를 일정하게 간격을 두고 각각의 위치에 대한 좌우 양쪽 임펄스 응답을 구한 값
  • 각 방향의 머리 전달함수가 유일한 특성을 가졌을 때 이를 이용하면 입체 음향을 만들어 낼 수 있다.

입체음향

  • 입체음향의 원리는 두 귀의 외이도 입구에서 음을 녹음하고, 재생할 때 다시 두 귀의 외이도 입구에서 재생하면 된다.
  • 더미헤드(Dummy Head) 라는 마이크폰을 이용
  • 더미헤드 : 귀 부분에 마이크를 설치한 사람 머리 모양의 녹음장치

마스킹

  • 마스킹이란 조용할 때 들리던 소리가 주위의 소음이 증가하면서 들리지 않게 되는 현상이다.
  • 마스커(Masker) : 마스킹 현상을 발생시키는 음
  • 마스키(Maskee) : 마스킹되는 음
  • 임계대역(critical band) : 마스킹 효과가 미치는 주파수 대역
  • 음원파일 압축시 음악신호를 분석하여 마스킹 효과에 의해 잘 들리지 않는 신호를 제거하여 저장공간을 줄일 수 있다.

칵테일파티 효과

  • 여러 음원이 존재 할 때 우리 인간은 자신이 듣고 싶은 음만 선별해서 들을 수 있는 능력을 지녔는데 이를 칵테일파티 효과라 한다.
  • 주변이 매우 시끄러운 장소에서도 상대방과 대화를 진행 할 수 있는 이유도 바로 이 때문이다.
  • 인간의 청각기관이 음색을 선택 할 수 있는 일종의 필터를 가지고 있다

문서정보

Enter labels to add to this page:
Please wait 
Looking for a label? Just start typing.