Automatic Tagging and Tag Recommendation Techniques Using Tag Ontology

태그 온톨로지를 이용한 자동 태깅 및 태그 추천 기법

  • 김재승 ((주)토탈소프트뱅크 신제품개발부) ;
  • 문현정 (하이브레인넷 부설연구소) ;
  • 우용태 (창원대학교 컴퓨터공학과)
  • Published : 2009.11.30

Abstract

This paper introduces techniques to recommend standardized tags using tag ontology. Tag recommendation consists of TWCIDF and TWCITC; the former technique automatically tags a large quantity of already existing document groups, and the latter recommends tagging for new documents. Tag groups are created through several processes, including preprocessing, standardization using tag ontology, automatic tagging and defining ranks for recommendation. In the preprocessing process, in order to search semantic compound nouns, words are combined to establish basic word groups. In the standardization process, typographical errors and similar words are processed. As a result of experiments conducted on the basis of techniques presented in this paper, it is proved that real-time automatic tagging and tag recommendation is possible while guaranteeing the accuracy of tag recommendation.

본 논문에서는 태그 온톨로지를 이용하여 표준화된 태그를 추천할 수 있는 기법을 제안하였다. 태그 추천 기법은 기존에 생성된 대량의 문서 집합을 대상으로 자동 태깅하기 위한 기법(TWCIDF)과 신규 문서를 대상으로 태그를 추천하기 위한 기법(TWCITC)으로 구성된다. 태그집합은 전처리 과정, 태그 온톨로지를 이용한 표준화 작업, 자동 태깅 및 추천을 위한 랭킹 부여과정을 거쳐 구성된다. 전처리 과정에서는 의미있는 복합명사를 찾기 위한 용어결합과정을 사용하였고, 표준화 작업 과정에서는 용어의 오탈자 및 유사용어를 처리하였다. 본 논문에서 제안한 기법의 실험 결과, 추천 태그의 정확성을 유지하면서도 실시간으로 자동태깅 및 태그 추천이 가능함을 보여주었다.

Keywords

References

  1. 강승식, "한국어 형태소 분석기와 한국어 분석 모듈(HAM:Hangul Analysis Module)", 국민대학교, http://nlp.kookmin.ac.krang, 2008.
  2. 문현정, 우용태, "지식 문서에서 도메인 온톨로지를 이용한 개념 추출 기법", 정보처리학외논문지, 제13-D권, 제3호, 2006, pp. 309-316.
  3. 문형우, "지식거래 서비스를 위한 온톨로지 설계", 창원대학교 석사학위논문, 2008.
  4. A. Benjamin, S. Leo and R. Thomas, "ConTag:A Semantic Tag Recommendation System," I-SEMANTICS '07 Papers, 2007, pp. 297-304.
  5. B. Sigurbjörnsson and R. Zwol, "Flickr tag recommendation based on collective knowledge," Proc. of the 17th Int'l Conf. on WWW, 2008, pp. 327-336.
  6. C. Preisach, H. Burkhardt, L. Schmidt-Thieme and R. Decker, "Collaborative Tag Recommendations," Data Analysis, Machine Learning and pplications, 2008, pp. 533-540.
  7. D. Eck, P. Lamere, Thierry Bertin-Mahieux and Stephen Green, "Automatic Generation of Social Tags for Music Recommendation," MIT Press, 2008.
  8. M. Lipczak, "Tag Recommendation for Folksonomies Oriented towards Individual Users," Proc. of the ECML PKDD, 2008, pp.84-95.
  9. P. A. Chirita, S. Costache, S. Handschuh and W. Nejdl, "P-TAG:Large scale automatic generation of personalized annotation TAGs for the Web," Proc. of the 16th Int'l Conf. on World Wide Web, 2007, pp. 845-854.
  10. P. Basile, D. Gendarmi, F. Lanubile and G. SemerD aro, "Recommending Smart Tags in a Social Bookmarking System," Proc. of the European Semantic Web Conf. 07, 2007, pp. 22-29
  11. P. Schmitz, "Inducing ontology from Flickr tags," Proc. of the Workshop on Collaborative Tagging at WWW, 2006.
  12. S. Sood, K. J. Hammond, S. H. Owsley and L. Birnbaum, "TagAssist:Automatic Tag Suggestion for Blog Posts," Int'l Conf. on Weblogs and Social Media, 2007.
  13. Y. Song, Z. Zhuang, H. Li, Q. Zhao, J. Li, W. Lee and CL. Giles, "Real-time automatic tag recommendation," Proc. of the 31st annual Int'l ACM SIGIR Conf. on Research and development in information retrieval, 2008, pp. 515-522.
  14. Z. Xu, Y. Fu, J. Mao and D. Su, "Towards the Semantic Web:Collaborative Tag suggestions," Collaborative Web Tagging Workshop at WWW, 2006.