DOI QR코드

DOI QR Code

Enhancement of the 3D Sound's Performance using Perceptual Characteristics and Loudness

지각 특성 및 라우드니스를 이용한 입체음향의 성능 개선

  • Koo, Kyo-Sik (The School of Electronic Engineering, Soongsil university) ;
  • Cha, Hyung-Tai (The School of Electronic Engineering, Soongsil university)
  • 구교식 (숭실대학교 전자공학과) ;
  • 차형태 (숭실대학교 전자공학과)
  • Received : 2011.06.03
  • Accepted : 2011.08.23
  • Published : 2011.09.30

Abstract

The binaural auditory system of human has ability to differentiate the direction and the distance of the sound sources by using the information which are inter-aural intensity difference(IID), inter-aural time difference(ITD) and/or the spectral shape difference(SSD). These information is generated from the acoustical transfer of a sound source to pinna, the outer ears. We can create a virtual sound system using the information which is called Head related transfer function(HRTF). However the performance of 3D sound is not always satisfactory because of non-individual characteristics of the HRTF. In this paper, we propose the algorithm that uses human's auditory characteristics for accurate perception. To achieve this, excitation energy of HRTF, global masking threshold and loudness are applied to the proposed algorithm. Informal listening test shows that the proposed method improves the sound localization characteristics much better than conventional methods.

인간의 청각기관은 소리의 방향과 거리인지에 있어서 양 귀에 들어오는 소리세기의 차이, 위상의 차이, 그리고 주파수 스펙트럼의 차이 등의 정보들을 복합적으로 이용한다. 이런 정보를 종합적으로 포함하고 있는 것을 머리전달함수라 하며, 이를 이용하여 실질적으로 존재하지 않는 음원을 근사적으로 생성할 수 있는 입체음향 시스템을 구현할 수 있다. 그러나 비개인화 된 머리전달함수는 음상정위 성능을 떨어뜨리는 주된 원인이 된다. 이에 본 논문에서는 이 머리전달함수를 이용한 3차원 음상정위를 위해 사람의 청각 특성을 이용한 알고리즘을 제안한다. 청자가 정확한 방향을 인지하기 위해 1차로 측정된 머리전달함수의 청각 자극 에너지를, 2차로 전역 마스킹 임계치와 라우드니스를 이용하여 방향감을 강조하였다. 제안된 알고리즘의 성능 평가를 위해 청감 테스트를 수행하였으며 실험결과 기존의 알고리즘에 비해 입체음향의 전체적인 인지도가 50% 이상 증가하였음을 확인할 수 있었다.

Keywords

References

  1. 김기홍, 김용완, 명현, 정혁, 김기호, "3D Sound 기술", 정보과학회지, 19 권, 5호, 30-37쪽, 2001년5월
  2. 구교식, 차형태, "머리전달함수의 심리음향적 특성을 이용한 전/후 음상정위 특성 개선," 방송공학회논문지, 11권, 4호, 448-457쪽, 2006년 12월
  3. 강성훈, 강경옥, 입체음향, 기전연구사
  4. 구교식, 차형태, "개선된 머리전달함수를 이용한 3차원 입체음향 성능 개선 연구," 한국음향학회지, 28권, 6호, 557-565쪽, 2009년8월
  5. Chong-Jin Tan, Woon-Seng Gan, "User-defined spectral manipulation of HRTF for improved localisation in 3D sound systems, Electronics letters, Vol.34 No.25, pp. 2387-2389, Dec. 1998
  6. 김경훈, 김시호, 배건성, 최송인, 박만호, "헤드폰 기반의 입체음향 생성에서 앞/뒤 음상정위 특성 개선," 한국통신학회논문지, 29권, 8c호, 1142-1148쪽, 2004년 8월
  7. 이채봉, "고역 주파수 영역에서 HRTF의 간략화에 관한 연구," 한국신호처리시스템학회논문지, 12권1호, 1-6쪽, 2011년 1월
  8. 김용국, 전찬준, 김홍국, 이용주, 장대영, 강경옥, "헤드폰 청취환경에서의 실감오디오 재현을 위한 음상 외재화 기법," 대한전자공학회논문지, 47권, 5호, 1-8쪽, 2010년 9월
  9. 황성목, 박영진, 박윤식, "보편적인 기저함수를 이용한 중앙면상의 머리전달함수 모델링," 한국소음진동공학회논문집, 18권, 4호, 448-457쪽, 2008년4월 https://doi.org/10.5050/KSNVN.2008.18.4.448
  10. 이영한, 김홍국, "가상현실 환경에서의 3차원 사운드 생성을 위한 거리 변화에 따른 구조적 머리전달함수 모델," 말소리, 59권, 89-99쪽, 2006년 9월
  11. 안태수, 이두호, "머리전달함수 측정법의 실험적 비교," 한국소음진동공학회논문집, 19권, 12호, 1260-1268쪽, 2009년12월 https://doi.org/10.5050/KSNVN.2009.19.12.1260
  12. 이윤재, 박영진, 박윤식, "머리전달함수측정시스템의 개발과 분석," 제어로봇시스템학회논문지, 16권, 2호, 202-205쪽, 2010년 2월 https://doi.org/10.5302/J.ICROS.2010.16.2.202
  13. ISO/IEC, JTC1/SC29/WG11 MPEG, Information technology-coding of moving pictures and associated audio for digital storage media at up to about 1.5 Mbits/s-Part 3: Audio, IS11172-3 (MPEG-1), 1992
  14. E. Zwicker and H. Fastil,, Psychoacoustics, Facts and Models, Springer 2nd Edition, 1999
  15. C. J. Moore, Hearing, Academic Press, 1995
  16. C. I. Cheng and G. H. Wakefield, "Introduction to Head-Related Transfer Functions(HRTFs)," J. Audio Eng. Soc. pp. 231-249, April. 2001.
  17. ISO 532: acoustics method for calculating loudness level. Geneva: International Organization for Standardization, 1975
  18. J. B. Allen and D. A. Berkley, "Image method for efficiently simulating small-room acoustics," Journal of the Acoustical Society of America, Vol. 65, No. 4, pp.943-950, Apr. 1979 https://doi.org/10.1121/1.382599
  19. http://interface.cipic.ucdavis.edu/sound/hrtf.html
  20. ITU-T P.800, Methods for subjective determination of transmission quality