by-nc-sa     개발자, DBA가 함께 만들어가는 구루비 지식창고!

2장 흥미롭고 재미있는 오디오 기술의 미래




2장 흥미롭고 재미있는 오디오 기술의 미래

대화형오디오

  • MUSIC 2.0 : 대화형 오디오 기술을 음악 분야에 활용한 서비스
  • 음악을 구성하고 있는 보컬 및 악기들이 독립된 트랙으로 구성

음원 분리 기술

  • 이론적으로 믹싱된 음악에서 가수의 목소리를 완벽하게 분리해 내는 것은 불가능
  • 그러나 음악에서 가수의 목소리를 분리해내는 것은 어느정도 가능
  • 음악에서 사용되는 가수의 목소리와 악기 소리는 어느 정도 서로 다른 특징을 가지고 있음
    • 사람이 낼 수 있는 목소리와 악기가 내는 소리의 주파수가 서로 다름
  • 음원 분리 기술의 활용
    • 소음제거 : 군사용 기기, 자동차, 음성인식, 휴대전화등

음악정보 추출

MIR(Music Information Retrieval)의 정의

  • MIR이란 음악 파일만 가지고 장르, 멜로디, 리듬, 템포, 코드 등 그 음악이 가지고 있는 다양한 정보를 추출해내는 기술이다.

MIR의 분류

장르, 분위기 인식 및 음악 추천
  • 장르 구분은 처음부터 정답이 없는 게 문제인 경우가 많음
  • 장르의 태생적 한계로 무드(mood) 라는 주제가 많이 사용됨
  • 뮤직서비스가 스트리밍서비스로 재편되면서 장르와 무드가 중요해지고 있음
  • 자동으로 좋아할 만한 곡을 추천해주는 수요와 맞물려 분위기 인식 및 음악 추천 연구가 활발히 이루어 지고 있음
음악적 지문인식 (Audio Fingerprint)
  • 음악적 지문인식 이란 음악을 식별하기 위한 방법을 연구하는 기술이다.
  • 음악 식별을 위해, 음악의 여러가지 특징을 파악하고, 이를 고유 값으로 변환하여 크기를 줄인 데이터를 사용한다.
  • 대체로 스펙트로 그램 기반으로 FFT 등의 기법을 통해 시간, 주파수상의 특징을 추출한다.
  • 중복파일 체크, 파일 인식, 저작권 보호 등에 사용된다.
선율추출
  • 선율 추출 (Melody Extraction)은 곡에 있는 선율을 추출하는 것이 그 목적이다.
  • 목소리 인
    식, 악기분리, 음정인식(Pitch Recognition) 등의 기술이 필요하다.
  • 선율을 구성하는 악기가 가지는 특성을 이용하여 해당 악기의 소리를 분리해내거나 강화하는 기술이다.
화성 인식
  • 화성(코드, Chord)은 C장조, 도미넌트 세븐과 같이 곡의 특정 순간에 음이 이루는 구조를 표현하는 방법이다.
  • 화성은 특정 순간에 음악의 단면을 보여준다.
템포 및 리듬 인식
  • 템포는 음악의 빠르기를 나타내는 값으로 1분 동안 4분음표가 몇개 나오는지의 단위인 BPM (Beats Per Minute)을 사용한다.
  • 리듬은 이런 음표와 강세의 규칙적인 반복으로 인해 느껴지는 느낌이다.
  • 리듬의 분류는 음악 장르 분류로 이용할 수 있다. 또 선율, 화성과 같이 음악적 지문중 하나로 사용하는 것이 가능하다.
온셋인식
  • 온셋(Onset, The beginning of something) : 무언가의 시작, 각종 악기의 음의 시작을 의미한다.
  • 우리가 듣는 음악은 여러 악기가 섞여 있어 온셋을 구분하기가 쉽지 않다.
  • MIR에서는 꼭 필요한 기술이다. 자동사보, 후보정, 어절별로 잘라주는 기능 등.
음원분리 (Musical Source Seperation)
  • 음원분리란 여러 악기로 이루어진 음악(Mixture)을 개별 악기로 분리해내는 기술
  • 화자 분리(speech separation)등에 사용되는 기술이다.
  • 음원분리가 완벽하다면 MIR 분야 연구가 쉽게 해결될 것이다.

문서정보

Enter labels to add to this page:
Please wait 
Looking for a label? Just start typing.