Salience of Envelope Interaural Time Difference of High Frequency as Spatial Feature

공간감 인자로서의 고주파 대역 포락선 양이 시간차의 유효성

  • 서정훈 (서울대학교 전기컴퓨터공학부 & 서울대학교 뉴미디어 통신 공동 연구소) ;
  • 전상배 (서울대학교 전기컴퓨터공학부 & 서울대학교 뉴미디어 통신 공동 연구소) ;
  • 성굉모 (서울대학교 전기컴퓨터공학부 & 서울대학교 뉴미디어 통신 공동 연구소)
  • Received : 2010.04.22
  • Accepted : 2010.07.05
  • Published : 2010.08.31

Abstract

Both timbral features and spatial features are important in the assessment of multichannel audio coding systems. The prediction model, extending the ITU-R Rec. BS. 1387-1 to multichannel audio coding systems, with the use of spatial features such as ITDDist (Interaural Time Difference Distortion), ILDDist (Interaural Level Difference Distortion), and IACCDist (InterAural Cross-correlation Coefficient Distortion) was proposed by Choi et al. In that model, ITDDistswere only computed for low frequency bands (below 1500Hz), and ILDDists were computed only for high frequency bands (over 2500Hz) according to classical duplex theory. However, in the high frequency range, information in temporal envelope is also important in spatial perception, especially in sound localization. A new model to compute the ITD distortions of temporal envelopes in high frequency components is introduced in this paper to investigate the role of such ITD on spatial perception quantitatively. The computed ITD distortions of temporal envelopes in high frequency components were highly correlated with perceived sound quality of multichannel audio sounds.

다채널 오디오 코딩 시스템을 평가함에 있어서 음색 요소뿐만 아니라 공간감 요소 역시 큰 중요성을 갖는다. 이러한 이유로 양이 시간차 왜곡 (Interaural Time Difference Distortion, ITDDist), 양이 크기차 왜곡 (Interaural Level Difference Distortion, ILDDist), 양이 상관관계 왜곡 (Interaural Cross Correlation Distortion, IACCDist)과 같은 공간감 요소를 추가하여 기존의 음질 객관 평가 권고안인 ITU-R Rec. BS. 1387-1을 다채널 오디오 시스템에 적용하기 위한 시도가 있었다. 이 다채널 오디오 시스템을 위한 확장 모델에서는 Duplex 이론에 따라, 양이 시간차 왜곡은 1.5kHz 이하의 저주파 영역에 대해서만 계산되었으며, 양이 크기차 왜곡은 2.5kHz 이상의 고주파 영역에 대해서만 계산되었다. 하지만 고주파 영역에 있어서 포락선의 양이 시간차는 공간감 인지에 있어서, 특히 음상 정위에 있어서 중요한 역할을 한다. 이러한 고주파 영역 포락선의 양이 시간차 공간감 인지에 미치는 영향을 정량적으로 분석하기 위해 해당 인자를 계산하는 방법이 본 논문에서 소개된다. 또한, 이렇게 계산된 고주파 영역 포락선의 양이 시간차는 다채널 오디오의 주관평가 결과와 높은 상관관계를 가짐을 확인한다.

Keywords

References

  1. I. Choi, B. G. Shinn-Cunningham, S. B. Chon, K. -M, Sung, "Objective measurement of perceived auditory quality in multichannel audio compression coding systems," J. Audio Eng. Soc, vol. 56, pp. 3-17, 2008.
  2. ITU-R Recommendation BS. 1387-1, Method for objective measurement of perceived audio quality, International telecommunication union, Geneva, Switzerland, 1999.
  3. B. C. J. Moore, "An introduction to the psychoolgy of hearing," Academic press, London, 1997.
  4. P. X. Joris and T. C. Yin, " Envelope coding in the lateral superior olive: I. sensitivity to interaural time differences," J. Neurophysiol., vol. 73, pp. 1043-1062, 1995.
  5. L. R. Bernstein and C. Trahiotis, "Enhancing sensitivity to interaural delays at high frequencies by using "Transposed stimuli"," J. Acoust. Soc. Am. 112: 1026-1036, 2002. https://doi.org/10.1121/1.1497620
  6. S. J. Griffin, L. R. Bernstein, N. J. Ingham, and D. McAlpine, " Neural sensitivity to interaural envelop delays in the inferior colliculus of the guinea pig," J. Neurophysiol., vol. 93, pp. 3463-3478, 2005.
  7. ITU-R Recommendation BS. 1116-1, Methods for the subjective assessment of srnall impairments in audio systems including multichannel sound systems, International telecommunication union, Geneva, Switzerland, 1997.
  8. ISO/IEC JTC1/SC29/WG11 (MPEG) Document N6813, Report on spatial audio coding RMO selection tests, Palma de mallorca, Spain, 2004.
  9. ISO/IEC JTC1/SC29/WGll (MPEG) Document N7138, Report on MPEG spatial audio coding RMO listening tests, Busan, Korea. 2005.
  10. ITU-R Recommendation BS. 1534-1, Method for the subjective assessment of intermediate quality levels of coding systems, International telecommunication union, Geneva, Switzerland, 2003