Automatic Tagging Scheme for Plural Faces

다중 얼굴 태깅 자동화

  • 이충연 (성결대학교 멀티미디어공학부) ;
  • 이재동 (고려대학교 컴퓨터공학과) ;
  • 진성아 (성결대학교 멀티미디어공학부)
  • Received : 2010.04.05
  • Accepted : 2010.04.30
  • Published : 2010.05.25

Abstract

To aim at improving performance and reflecting user's needs of retrieval, the number of researches has been actively conducted in recent year as the quantity of information and generation of the web pages exceedingly increase. One of alternative approaches can be a tagging system. It makes users be able to provide a representation of metadata including writings, pictures, and movies etc. called tag and be convenient in use of retrieval of internet resources. Tags similar to keywords play a critical role in maintaining target pages. However, they still needs time consuming labors to annotate tags, which sometimes are found to be a hinderance caused by overuse of tagging. In this paper, we present an automatic tagging scheme for a solution of current tagging system conveying drawbacks and inconveniences. To realize the approach, face recognition-based tagging system on SNS is proposed by building a face area detection procedure, linear-based classification and boosting algorithm. The proposed novel approach of tagging service can increase possibilities that utilized SNS more efficiently. Experimental results and performance analysis are shown as well.

최근 웹페이지의 생성 및 웹이 가진 정보량이 기하급수적으로 늘면서 사용자의 검색 목적을 파악하여 효율을 높이기 위한 다양한 방법이 연구되고 있으며, 태깅 시스템이 하나의 대안으로 떠오르고 있다. 태깅 시스템은 인터넷 사용자로 하여금 태그라고 불리는 메타데이터를 글, 사진, 동영상 등에 부여하도록 함으로써 콘텐츠의 검색 및 브라우징을 편리하게 하는 시스템이다. 이처럼 태그는 해당 페이지의 대표 키워드를 의미하므로 콘텐츠 분류의 기준을 마련할 수 있으나, 사용자에 의해 직접 입력되어야 하는 수고가 필요하고, 또한 무분별한 태깅으로 인해 오히려 분류에 방해가 되는 등의 문제점들이 있다. 본 논문에서는 이러한 태깅의 문제를 해결하기 위한 방법으로 얼굴인식 알고리즘을 활용한 영상콘텐츠 내에서의 다중 얼굴 태깅 자동화 방법을 제시한다. 이를 위해 먼저 여러 얼굴검출 방법 중 Haar-like features와 AdaBoost 알고리즘을 이용하여 빠른 속도와 높은 정확도로 영상콘텐츠 내에서 얼굴 영역을 검출한다. 이후 PCA와 고유얼굴을 이용하여, 검출해 낸 얼굴을 데이터베이스에 미리 저장해 놓은 프로필 사진과 비교, 인식해냄으로써 해당 인물에 대한 정보를 불러와서 자동으로 태깅하는 시스템을 구현하였다. 이러한 새로운 방식의 태깅 기술은 현존하는 사진공유, 쇼핑, 검색 등의 수많은 웹서비스에 적용이 가능하며, 특히 소셜네트워크서비스에서의 사진 관리나 인물검색 등에서 활용할 때 큰 효과를 보일 것으로 기대된다.

Keywords

References

  1. 박종진, "인터넷 영상 소비 패턴과 업계 주도권 전망: SBSi의 온라인 디지털 콘텐츠 사업전략," 삼성경제연구소 디지털사례세미나, 2006년 5월
  2. 한국소프트웨어진흥원, "포털사이트를 중심으로 한 국내 웹2.0 서비스 현황과 전망," SW산업동향, 2006년
  3. 이혜규, 박성한, "개인화된 방송 콘텐츠의 효율적 검색을 위한 메타데이터 검색 구조 설계," 전자공학회논문지, 제46권 CI편, 제2호, 100-105쪽, 2009년 3월
  4. 조현종, 강민구, 문승빈, "조명 변화 환경에서 PCA 기반 얼굴인식 알고리즘의 신뢰도에 대한 연구," 전자공학회논문지, 제46권 CI편, 제2호, 19-26쪽, 2009년 3월
  5. S. Bateman, C. Brooks and G. McCalla, "Collaborative Tagging Approaches for Ontological Metadata in Adaptive E-Learning Systems," in Proc. of 4th Int'l Workshop on Applications of Semantic Web Technologies for e-Learning, pp.3-12, June 2006.
  6. T. Rattenbury, N. Good and M. Naaman, "Towards Extracting Flickr Tag Semantics," in Proc. of 16th Int'l Conf. of World Wide Web, pp.1287-1288, 2007.
  7. M. J. Halvey and M. T. Keane, "An Assessment of Tag Presentation Techniques," in Proc. of 16th Int'l Conf. on World Wide Web, pp.1313-1314, 2007.
  8. A. Pyalling, M. Maslov and P. Branslavski, "Automatic Geotagging of Russian Web Sites," in Proc. of 15th Int'l Conf. on World Wide Web, pp.965-966, 2006.
  9. S. A. Golder and B. A. Huberman, "Usage Patterns of Collaborative Tagging Systems," Journal of Information Science, Vol. 32, No. 2, pp. 198-208, 2006. https://doi.org/10.1177/0165551506062337
  10. P. A. Chirita, S. Costache, W. Nejdl and S. Handschuh, "P-TAG: large scale automatic generation of personalized annotation tags for the web," in Proc. of 16th Int'l Conf. on World Wide Web, 845-854, 2007.
  11. R. Chellappa, C. L. Wilson, and S. Sirohey, "Human and Machine Recognition of Faces: A Survey," Proceedings of IEEE, Vol. 83, No. 5, pp. 705-741, May 1995. https://doi.org/10.1109/5.381842
  12. S. Jahanbin, H. Choi, A. C. Bovik and K. R. Castleman, "Three Dimensional Face Recognition using Wavelet Decomposition of Range Images," in Proc. of IEEE Conf. on Image Processing, Vol. 1, pp. 145-148, September 2007.
  13. P. Viola and M. Jones, "Robust Real-Time Face Detection," International Journal of Computer Vision, Vol. 57, No. 2, pp. 137-154, May 2004.
  14. A. Haar, "Zur Theorie der Orthogonalen Funktionen-Systeme," Mathematische Annalen, Vol. 69, pp. 331-371, 1910. https://doi.org/10.1007/BF01456326
  15. C. P. Papageorgiou, M. Oren and T. Poggio, "A General Framework for Object Detection," in Proc. of IEEE Conf. on Computer Vision, pp. 555-562, 1998.
  16. R. Lienhart, A. Kuranov and V. Pisarevsky, "Empirical Analysis of Detection Cascades of Boosted Classifiers for Rapid Object Detection," MRL Technical Report, May 2002.
  17. F. C. Crow, "Summed-area Tables for Texture Mapping," in Proc. of 11th Annual Conference on Computer Graphics and Interactive Techniques, Vol. 18, No. 3, pp. 207-212, 1984.
  18. Y. Freund and R. E. Schapire, "A Decision-Theoretic Generalization of On-line Learning and An Application to Boosting," Journal of Computer and System Sciences, Vol. 55, No. 1, pp. 119-139, August 1997. https://doi.org/10.1006/jcss.1997.1504
  19. M. Turk and A. Pentland, "Eigenfaces for Recognition," Journal of Cognitive Neuroscience, Vol. 3, No. 1, pp. 71-86, 1991. https://doi.org/10.1162/jocn.1991.3.1.71
  20. L. Sirovich and M. Kirby, "Low-dimensional procedure for the characterization of human faces", Journal of the Optical Society of America A: Optics, Image Science, and Vision, Vol. 4, No. 3, pp. 519-524, March 1987. https://doi.org/10.1364/JOSAA.4.000519
  21. P. N. Belhumeur, J. P. Hespanha and D. J. Kriegman, "Eigenfaces vs. Fisherfaces: Recognition using Class Specific Linear Projection," IEEE Trans. Pattern Analysis and Machine Intelligence, Vol. 19, No. 17, pp. 711-720, July 1997. https://doi.org/10.1109/34.598228