컨벌루션 신경망을 이용한 공간큐 기반 다채널 오디오 확장 기술

  • Beack, Seungkwon (Electronics and Telecommunications Research Institute (ETRI)) ;
  • Lim, Wootaek (Electronics and Telecommunications Research Institute (ETRI)) ;
  • Lee, Tajin (Electronics and Telecommunications Research Institute (ETRI))
  • 발행 : 2019.06.19

초록

본 논문에서는 컨볼루션 신경망을 이용하여 예측 된 공간 오디오 큐를 이용한 오디오 채널 확장 기술을 소개한다. 오디오 채널 확장 기술은 일반적인 스테레오 신호에 적용되어 5.1 레이아웃과 같은 고차원 오디오 신호를 생성하는 기술이다. 스테레오 신호에서 채널을 확장하기 위해 스테레오 신호에서 공간 큐를 예측하고 예측 공간 큐의 방향에 따라 5.1 채널 신호의 스펙트럼 구성 요소를 할당하여 다중 채널 신호를 합성한다. 제안된 방식으로 생성된 5.1 채널 신호는 원 5.1 채널과 유사한 공간 정보 합성 능력과 스테레오 대비 주관적 선호도가 개선된 음질을 제공한다.

키워드