Abstract
The Bark Coherence Function (BCF) defies a coherence function within perceptual domain as a new cognition module, robust to linear distortions due to the analog interface of digital mobile system. Our previous experiments have shown the superiority of BCF over current measures. In this paper, a new BCF suitable for VoIP is developed. The unproved BCF is based on the wavelet series expansion that provides good frequency resolution while keeping good time locality. The proposed Wavelet based Bark Coherence function (WBCF) is robust to variable delay often observed in packet-based telephony such as Voice over Internet Protocol (VoIP). We also show that the refinement of time synchronization after signal decomposition can improve the performance of the WBCF. The regression analysis was performed with VoIP speech data. The correlation coefficients and the standard error of estimates computed using the WBCF showed noticeable improvement over the Perceptual Speech Quality Measure (PSQM) that is recommended by ITU-T.
본 논문은 객관적 음질 평가법으로 웨이블렛 변환을 이용한 향상된 바크 코히어런스 함수 (Wavelet based Bark Coherence Function : WBCF)를 제안한다. 바크 코히어런스 함수 (Bark Coherence Function : BCF)는 심리 음향 영역에서 코히어런스 함수를 정의함으로서 음성 통신 시스템의 아날로그 부분에 의하여 발생할 수 있는 선형 왜곡에 강한 객관적 음질 평가법이다. VoIP (Voice over Internet Protocol)와 같은 패킷 기반의 음성 전달 시스템은 가변 지연등이 발생 될 수 있는데, 이것은 원음과 왜곡음의 정확한 시간축 정렬을 불가능하게 하여 기존의 객관적 음질 평가법의 성능을 저하시킨다. 제안된 WBCF는 고주파 영역에서 시간 분해능이 높으며, 저주파 영역에서 주파수 분해능이 높은 웨이블렛 변환을 사용한 후 BCF를 계산하여 VoIP 시스템에서의 객관적 음질을 평가한다. 주/객관적 음질 평가 실험을 통하여 WBCF가 ITU-T 권고안인 Perceptual Speech Quality Measure (PSQM)에 비하여 높은 성능을 가짐을 확인하였다.