Real-Time Vision Based Speaker Location Detection for Realistic Audio Reproduction

실감 음향 재생을 위한 영상기반의 실시간 화자 위치 검출

  • Lim Jaehyun (Dept. of Electrical and Electronic Engineering, Yonsei University) ;
  • Lee Chulhee (Dept. of Electrical and Electronic Engineering, Yonsei University)
  • 임재현 (연세대학교 전기전자공학과) ;
  • 이철희 (연세대학교 전기전자공학과)
  • Published : 2004.11.01

Abstract

일반적으로, 화상회의에서 화자의 위치를 검출하는 것은 음향 신호를 기반으로 이루어져 왔다. 그러나 물리적인 환경의 제약이나 화자 검출 시스템의 한계를 벗어나는 노이즈가 발생하는 경우에는 검출 시스템의 성능저하를 초래하게 된다. 본 논문에서는 음향 기반의 검출 시스템과 독립적으로, 혹은 상호 보완적으로 사용될 수 있는 영상 기반의 화자 검출 알고리즘에 대하여 제안하고자 한다. 화자의 위치에 관한 정보는 화상회의에 한층 사실감을 부여하는 3 차원 오디오 재생에 사용될 수 있다.

Keywords