Abstract
The interest of version management is increasing in electronic commerce requiring data mining and documents processing system related to digital governmentapplications. In this paper, we define a change set that is to manage historicalinformation and to maintain XML documents during a long period of time and propose several storage policies of XML documents using a change set. A change set includes a change oper-ation set and temporal dimensions and a change operation set is composed with schema change operations and data change operations. We pro-pose three storage policies using a change set. Three storage policies are (1) storing all the change sets, (2) storing the change sets and the versions periodically. (3) storing the aggregation of change sets and the versions at a point of proper time. Also, we compare the performance between the existing storage policy and the proposed storage policies. Though the performance evaluation, we show that the method to store the aggregation of change sets and the versions at a point of proper time outperforms others.
데이터 마이닝을 요구하는 전자상거래, 전자정부와 관련된 문서 처리 시스템 등에서 XML 문서의 버전 관리에 대한 관심이 높아지고 있다. 본 논문에서는 대량의 XML 문서를 장기적으로 유지하면서 XML 문서의 이력 정보를 효율적으로 관리하기 위하여, XML 버전을 생성하는 변경 집합을 정의하고 변경 집합을 이용한 XML 문서의 저장 방법을 제안한다. 변경 집합은 변경 연산집합과 시간지원 차원을 포함하고 있으며, 변경 연산 집합은 스키마 변경 연산과 데이터 변경 연산으로 구성된다. 변경 집합을 이용한 세가지 XML 문서의 저장 방법을 제안한다. 세가지 저장 방법은, (1) 변경 집합을 모두 저장하는 방법, (2)변경 집합과 버전을 주기적으로 저장 방법, 그리고 (3) 저장 적합 시점에 변경 집합 모음과 버전을 저장하는 방법이 있다. 또한, 기존의 저장 방법과 제안한 저장 방법들 사이에 성능을 비교한다. 성능 평가를 통하여 저장 적합 시점에 변경 집합모음과 버전을 저장하는 방법의 성능이 다른 저장 방법보다 우수함을 보인다.