Gaze Detection by Computing Facial Rotation and Translation

얼굴의 회전 및 이동 분석에 의한 응시 위치 파악

  • 이정준 (延世大學敎 電氣 ${\cdot}$ 電子工學科) ;
  • 박강령 (LG電子技術院) ;
  • 김재훈 (延世大學敎 電氣 ${\cdot}$ 電子工學科)
  • Published : 2002.09.01

Abstract

In this paper, we propose a new gaze detection method using 2-D facial images captured by a camera on top of the monitor. We consider only the facial rotation and translation and not the eyes' movements. The proposed method computes the gaze point caused by the facial rotation and the amount of the facial translation respectively, and by combining these two the final gaze point on a monitor screen can be obtained. We detected the gaze point caused by the facial rotation by using a neural network(a multi-layered perceptron) whose inputs are the 2-D geometric changes of the facial features' points and estimated the amount of the facial translation by image processing algorithms in real time. Experimental results show that the gaze point detection accuracy between the computed positions and the real ones is about 2.11 inches in RMS error when the distance between the user and a 19-inch monitor is about 50~70cm. The processing time is about 0.7 second with a Pentium PC(233MHz) and 320${\times}$240 pixel-size images.

본 논문에서는 모니터 위에 설치된 카메라를 통해 입력된 사용자의 2차원 얼굴 영상을 이용하여, 사용자가 모니터 상에 쳐다보고 있는 응시 위치를 파악하는 방법을 제안한다. 본 논문에서는 사용자의 눈동자 움직임은 고려하지 않고 얼굴의 회전 및 이동만을 고려하였다. 제안하는 방법은 얼굴의 회전에 의한 응시위치와 얼굴의 좌우상하 이동량을 각각 계산하여 이 둘을 결합함으로써 모니터상의 응시위치를 추정하는 것이다. 얼굴 특징점의 기하학적 형태변화를 입력으로 하는 신경망(다층 퍼셉트론)을 이용하여 얼굴의 회전에 의한 응시위치를 구하였으며 영상처리 알고리즘을 이용하여 입력영상으로부터 실시간으로 얼굴의 이동량을 추정하였다. 실험결과 19인치 모니터를 사용하고 사용자가 모니터와의 거리를 50~70cm 정도 유지하며 얼굴의 이동 및 회전을 통하여 모니터를 바라볼 때 약 2.11인치의 응시 위치 추정 오차를 보이는 것으로 나타났다. 처리시간은 Pentium PC(233MHz)환경에서 320${\times}$240 화소 크기의 영상을 사용할 때 약 0.7초가 소요되었다.

Keywords

References

  1. S. Baluja and D. Pornerleau, 'Non-Intrusive Gaze Tracking Using Artificial Neural networks', Technical report (CMU-CS-94-102) of School of Computer Science, Camegie Mellon University, USA, January 1994
  2. K. N. Kim and R. S. Ramakrishna 'Vision-Based Eye-Gaze Tracking for Hunam Computer Interface', In Proc. of Internationl Conf. on System, Man and Cybernetics, Vol 2, pp. 324-329, Tokyo, Japan, October 1999 https://doi.org/10.1109/ICSMC.1999.825279
  3. A. Gee and R. Cipolla, 'Fast visual tracking by temporal consensus', Image and Vision Computing, Vol. 14, pp.105-114, 1996 https://doi.org/10.1016/0262-8856(95)01044-0
  4. P. Ballard and G. C. Stockman, 'Controlling a Computer via Facial Aspect', IEEE Transactions on Systems, Man, and Cybernetics, Vol. 25. pp. 669-677. April 1995 https://doi.org/10.1109/21.370199
  5. T. Horprasert, Y. Yacoob and L. S. Davis, 'Computing 3-D Head Orientation from a Monocular Image Sequence', In Proc. of International Conf. on Automatic Face and Gesture Recognition, pp. 242-247, Killington, Vermont, USA, Oct. 1996 https://doi.org/10.1109/AFGR.1996.557271
  6. T. D. Rikert and M. J. Jones, 'Gaze Estimation using Morphable Models,' In Proc. of International Conf. on Automatic Face and Gesture Recognition, pp. 436-441, Nara, Japan, April 1998 https://doi.org/10.1109/AFGR.1998.670987
  7. R. Brunelli and T. Poggio, 'Face Recognition: Features versus Templates,' IEEE Trans. Pattern Analysis and Machine Intelligence, vol. 15, no. 10, pp. 1042-1052, October, 1993 https://doi.org/10.1109/34.254061
  8. R. Jain, R. Kasturi and B. G. Schunck. MACHINE VISION, McGraw-Hill, pp. 7-9, 1995
  9. 박강령, '얼굴의 2차원 및 3차원 움직임을 이용한 시선 위치 추적에 관한 연구', 연세대학교 전기${\cdot}$컴퓨터 공학과 대학원 박사 졸업 논문, 2000, 2