DOI QR코드

DOI QR Code

크로스토크 제거를 위한 얼굴 방위각 검출 기법

Detection Method of Face Rotation Angle for Crosstalk Cancellation

  • 한상일 (숭실대학교 정보통신전자공학부) ;
  • 차형태 (숭실대학교 정보통신전자공학부)
  • 발행 : 2007.02.25

초록

2채널 방식을 이용하는 입체 음향 구현 방법은 멀티채널 방식에 비해 비용의 감소 효과 및 설치가 쉽다는 장점이 있으나 크로스토크(crosstalk)를 제거하는 것이 어려운 문제이다. 크로스토크를 제거하기 위해서는 머리의 위치를 정확하게 추정하는 것이 필수적이다. 따라서 본 논문에서는 2채널 방식에서 3차원 입체 음향을 구현하기 위해 얼굴의 방향을 추정하기 위한 알고리즘을 제시한다. 제안하는 알고리즘은 Haar-like 특징을 이용하여 얼굴을 검출하고 전처리 작업과 수학적 형태학을 이용한 두 눈의 위치를 검출하는 알고리즘을 이용, 얼굴이 향하고 있는 방위각을 검출한다. 본 논문에서 제안하는 알고리즘은 기존의 제안되어진 방법들에 비해 적용 범위가 더 넓으며, 얼굴 방위각이 매우 안정적으로 검출됨을 실험을 통해 알 수 있었다.

The method of 3D sound realization using 2 speakers provides two advantages: cheap and easy to build. In the case, crosstalk between 2 speakers has to be eliminated. To calculate and remove the effect of the crosstalk it is essential to find a rotation angle of human head correctly. In the paper, we suggest an algorithm to find the head angle of 2 channel system. We first detect a face area of the given image using Haar-like feature. After that, the eve detection using pre-processor and morphology method. Finally, we calculate the face rotation angle with the face andi the eye location. As a result of the experiment on various face images, the proposed method improves the efficiency much better than the conventional methods.

키워드

참고문헌

  1. Durand R. Begault, '3- D Sound for Virtual Reality and Multimedia', NASA, 2000
  2. H. S. Kim, P. M. Kim and H. B. Kim, 'Cross-talk Cancellation Algorithm for 3D Sound Reproduction,' ETRI Journal, pp. 11-19, Vol. 22, No.2, June 2000 https://doi.org/10.4218/etrij.00.0100.0202
  3. J. S. Park, J. Y. Dong, 'Detection of Facial Direction using Facial Features', Korean Society for Internet Information, Vol. 4. No.6, December 2003
  4. H. T. Kim, K. E. Lee, J. S. Park, 'A Tracking of Head Movement for Stereophonic 3-D Sound', Korea Multimedia Society, pp. 1421-1431, VOL. 8, No. 11, November 2005
  5. Yasuto Yasuda, Wai C. Chu, 'All-Pole Modeling of Head-Related Transfer Functions: Objective and Subjective Evaluation Result', ICA2004, pp. 3745-3748, Vol. 5, 2004
  6. J. B. Melick, V. R. Algazi, R. O. Duda, Thompson, D. M., 'Customization for personalized rendering of motion -tracked binaural sound', 117th Convention of the Audio Engineering Society, pp. 6225, October 2004
  7. M. Yang, D. J. Kriegman, N. Ahuha, 'Detecting faces in Images: A Survey', IEEE Trans. on Pattern Analysis and Machine Intelligence, pp. 34-58, VOL. 24, No.1, January 2002 https://doi.org/10.1109/34.982883
  8. H. S. Park, C. S. Bar, 'Real Time 3D Face Pose Discrimination Based on Active IR Illumination', KIMICS, Vol. 8, No.3, 2004
  9. T. H. Kim, J. H. jang, 'A Study on Head Roation Angle Estimation Using Disparity Information of Stereo Images', Korea Information Processing Society, Vol. 12, No.1, May 2005
  10. S. J. Lee, J. S. Park, K. S. Son, 'Head Tracking for Implementing 3-Dimensional Stereo Sound', Korea Multimedia Society, 2003
  11. H. Y. Kim, 'Qualitative Reasoning of Facial Angles', Soongsil Univ. M. S. Journal, 1998
  12. J. S. Park, J. Y. Dong, 'Detection of facial Direction using Facial Features', Korea Internet Information Society, Vol. 4, No.6, December 2003
  13. R. Lienhart, J. Maydt, 'An Extended Set of Haar-like Features for Rapid Object Detection', IEEE ICIP, pp. 900-903, 2002