Design and Implementation of Topic Map Generation System based Tag

태그 기반 토픽맵 생성 시스템의 설계 및 구현

  • Received : 2009.11.30
  • Accepted : 2010.02.02
  • Published : 2010.05.31

Abstract

One of core technology in Web 2.0 is tagging, which is applied to multimedia data such as web document of blog, image and video etc widely. But unlike expectation that the tags will be reused in information retrieval and then maximize the retrieval efficiency, unacceptable retrieval results appear owing to toot limitation of tag. In this paper, in the base of preceding research about image retrieval through tag clustering, we design and implement a topic map generation system which is a semantic knowledge system. Finally, tag information in cluster were generated automatically with topics of topic map. The generated topics of topic map are endowed with mean relationship by use of WordNet. Also the topics are endowed with occurrence information suitable for topic pair, and then a topic map with semantic knowledge system can be generated. As the result, the topic map preposed in this paper can be used in not only user's information retrieval demand with semantic navigation but alse convenient and abundant information service.

웹2.0환경에서의 핵심적인 기술은 태깅이며, 현재 블로그와 같은 웹 문서에서부터 이미지, 동영상 등과 같은 멀티미디어 데이터에 이르기까지 폭넓게 적용되고 있다. 그러나 태깅에 사용된 태그가 정보 검색에 재사용되어 검색의 효율성을 극대화 시킬 것이라는 기대와는 달리 실제로는 태그가 가지는 근본적인 한계들로 인해 만족스럽지 못한 검색결과가 나타나고 있다. 이에 본 연구에서는 태그 클러스터링을 통한 이미지 검색에 대한 선행연구를 기반으로 의미론적 지식체계인 토픽맵 생성 시스템을 설계 및 구현하였다. 구현 결과 클러스터 내의 태그 정보들은 토픽맵에서의 토픽으로 자동 생성되었으며, 생성된 토픽맵의 토픽들 간에는 WordNet을 적용하여 의미연관관계를 부여하였다. 또한 토픽 쌍에 적합한 어커런스 정보들을 추출하여 토픽들에 부여함으로서 의미론적 지식체계인 토픽맵을 생성하였다. 이와 같이 생성된 토픽맵은 사용자의 정보검색 요구에 대한 시맨틱 내비게이션의 제공을 가능하게 할 뿐만 아니라 풍부한 정보제공이 가능하다.

Keywords

Acknowledgement

Supported by : 경원대학교

References

  1. 정부연, "2006년 인터넷 화두 웹2.0(Web2.0)," 정보통신정책, 제18호, 제387호, 2006.
  2. 홍성태, 임일, "웹2.0 환경에서 정보 분류와 필터링, 그리고 협업을 위한 기술의 동향 및 발전 방향" Telecommunications Review, 제17권, 제4호, 2007.
  3. Time O'Reilly, "What is Web2.0," http://www.oreilly.net.com/pub/a/oreilly/time/news/20-05/09/30/what-is-web-20.html, 2005.
  4. 이시화, 무효려, 이만형, 황대훈, "web2.0 환경에서의 Tag Clustering 시스템 설계 및 구현," 한국멀티미디어학회 춘계 학술대회, 제10권, 제1호, 2007.
  5. 이강표, 김두남, 김형주, "웹2.0 환경에서의 태깅 기술 동향," 한국정보과학회지, 제25권, 10호, 2007.
  6. 박영진, 송길영, 김경서, 송성환, "웹2.0과 정보 검색," ITFIND 주간기술동향, 제12권, 제5호, 2006.
  7. C. H. Brooks and Nancy Montanez, "Improved Annotation of the Blogosphere Via Autotagging and Hierarchical Clustering," International Conference on World Wide Web, 2006.
  8. 강필구, 채진석, "웹2.0을 위한 효율적인 태그 관리 시스템의 설계 및 구축," 한국정보과학회, 제33권, 제2호, 2006.
  9. C. H. Wiener, J. Golbeck, A. Schain, and J. A. Hendler, "Annotation and Provenance Tracking in Semantic Web Photo Libraries," International Provenance and Annotation Workshop, 2006
  10. Ontopia.net, "The TAO of Topic Maps," http://www.ontopia.net/topicmaps/materials/tao.htrnl/
  11. G. R. Ramalho, J. C. Ramalho, and P. R. Henriques, "TM Bulder : An Ontology Builder based on XML Topic Maps," Clei Electronic Journal, Vol. 7, No. 2, 2004.
  12. 함화진, "토픽맵 반자동 구축도구의 설계 및 구현," 이화여자대학교 석사학위 논문, 2005.
  13. C. Kohler, A. Korthaus, and M. Schader, "Automatic Topic map Generation from a Conventional Document Index," IASTED International Conference, 2004.
  14. 이시화, 이만형, 김용수, 황대훈, "web2.0에서 효율적인 Tag Clustering을 위한 Threshold 선정에 관한 연구," 한국멀티미디어학회 춘계 학술대회, 제10권, 제2호, 2007.
  15. 이시화, 이만형, 황대훈, "Web2.0 환경에서의 효율적인 이미지 검색을 위한 태그 클러스터링 시스템의 설계 및 구현," 한국멀티미디어학회 논문지, 제11권, 제8호, 2008
  16. JWNL, http://www-nlp.stanford.edu/nlp/javadoc/jwnl-docs/net/didion/jwnl/JWNL.ht_ml, Princeton University.
  17. TM4L, http://compsci.wssu.edu/iis/nsdl/index.htrnl, Winston Salem State University.
  18. S. M. Shafi and R. A. Rather "Precision and Recall of Five Search Engines for Retrieval of Scholarly Information in the Field of Biotechnology," Webology, Vol.2, No.2, 2005