Similarity Measurement for XML Documents Using Tag Synonyms

태그 간 동의어 집합을 통한 XML 문서 유사도 측정

  • Lee, Gang-Seok (Dept. of Computer Engineering, Sungkyunkwan University) ;
  • Song, In-Sang (Dept. of Computer Engineering, Sungkyunkwan University) ;
  • Kim, Ung-Mo (Dept. of Computer Engineering, Sungkyunkwan University)
  • 이강석 (성균관대학교 정보통신공학부 컴퓨터공학과) ;
  • 송인상 (성균관대학교 정보통신공학부 컴퓨터공학과) ;
  • 김응모 (성균관대학교 정보통신공학부 컴퓨터공학과)
  • Published : 2007.10.26

Abstract

월드와이드웹에서의 정보를 재사용, 공유할 수 있도록 기준을 제시한 XML은 많은 곳에서 사용 중에 있으며, 널리 확산되고 있다. 사용자 정의태그를 이용한 XML의 특징은, 같은 도메인의 문서라도 사랑의 인식이 아닌 컴퓨터와 같은 기계적으로는 다르게 인식될 수 있다는 문제점을 드러내기도 한다. 본 논문에서는 이러한 문제점을 해결하고자 시소러스와 온톨로지 등을 이용해 XML 문서간 유사도를 측정하는 방법을 제시하며 이를 바탕으로 제작한 프로그램인 #XML Similarity Calculation# 를 이용하여 제시한 방법이 타당하다는 것을 증명하게 된다. 또한 주어진 예시자료를 가지고 이 프로그램의 성능평가를 통해 정확성과 효율성을 평가하고 앞으로의 연구방향을 제시한다.

Keywords