DOI QR코드

DOI QR Code

Stereo Sound Demixing Method in Time-Frequency Domain

시간-주파수 영역에서의 스테레오 사운드 분리기법

  • 이재은 (중앙대학교 첨단영상대학원 영상공학과) ;
  • 김영문 (중앙대학교 첨단영상대학원 영상공학과) ;
  • 임찬 (중앙대학교 첨단영상대학원 영상공학과) ;
  • 강현수 (충북대학교 전기전자컴퓨터공학부)
  • Published : 2007.08.28

Abstract

This paper presents a new demixing method that separates each source from a stereo sound mixture. Under the W-Disjoint Orthogonal assumption in DUET(Degenerate Unmixing Estimation Technique) algorithm. The proposed method is mainly processed in time-frequency domain by using windowed-fourier transform. In this paper there are two main contributions: a weighted mask by panning index distances and a binary mask by comparing each channel value. The former has tender demixing characteristic, and the latter has stronger demixing characteristic. In experimental results, we will show that both masks produce more robust demixing than the existing demixing methods do.

본 논문은 스테레오 사운드에서 합쳐지기 이전의 개별적인 사운드를 분리해내는 기법을 제안한다. 기존의 Degenerate Unmixing Estimation Technique (DUET) 알고리즘의 W-Disjoint Orthogonal 가정에 기반을 두고 있으며, Windowed-Fourier 변환을 사용하여 시간-주파수 영역에서 주요 프로세스를 수행한다. 제안된 방식은 패닝 인덱스의 거리차이에 따라 가중치를 준 마스크를 사용하는 기법과 양쪽 채널의 성분을 비교하여 바이너리 기반의 마스크를 사용하는 방식이다. 전자는 부드러운 분리 특성을 보여주며, 후자는 높은 분리 특성을 보여주었다. 마지막에 실험을 통해 기존의 방식과 제안된 방식을 비교함으로써, 제안된 방식이 기존 방식 보다 좋은 성능을 가지고 있음을 알아볼 것이다.

Keywords

References

  1. J. Martinez, ''Overview of the MPEG-7 Standard, ISO/IEC JTCl/SC29/WG1" N4980 (Klagenfurt Meeting), July 2002.
  2. J. Martinez, ''Overview of the MPEG-7 Standard, ISO/IEC JTCl/SC29/WG1" N4980 (Klagenfurt Meeting), July 2002.