Abstract
On-line reorganization in a shared nothing database cluster is crucial to the performance of the database system in a dynamic environment like WWW where the number of users grows rapidly and changing access patterns may exhibit high skew. In the existing method of on-line reorganization have a drawback that needs excessive data migrations in case more than two nodes within a cluster have overload at the same time. In this paper, we propose an advanced B$^{+}$ tree based on-line reorganization method that solves data skew on multi-nodes. Our method facilitates fast and efficient data migration by including spare nodes that are added to cluster through on-line scaling. Also we apply CSB$^{+}$ tree (Cache Sensitive B$^{+}$ tree) to our method instead of B$^{+}$ tree for fast select and update queries. We conducted performance study and implemented the method on Ultra Fault-Tolerant Database Cluster developed for high scalability and availability. Empirical results demonstrate that our proposed method is indeed effective and fast than the existing method. method.
온-라인 재조직 기법은 인터넷 환경과 같은 동적 환경에서 높은 가용성과 고성능을 제공하기 위한 비공유 데이터베이스 클러스터의 필수적인 기능이다. 기존의 온-라인 재조직 기법은 클러스터 안의 프로세싱 노드에 과부하가 생긴 경우, 과부하 노드의 데이터를 인접 노드로 빠르게 이동시킴으로써 부하 분배를 수행한다. 그러나 동시에 두개 이상의 다중 노드에 과부하가 발생된 경우, 부하 분배를 위해 인접 노드로 여러 번의 반복된 데이터 이동이 발생되고, 재조직 수행동안 시스템의 응답 속도가 늦어지는 문제점이 있다. 본 논문에서는 다중 노드에 발생한 과부하 문제를 빠르고 효율적으로 해결하는 향상된 $B^{+}$트리 색인의 온-라인 재조직 기법을 제안한다. 제안된 기법은 확장 가능한 데이터베이스 클러스터 환경 하에 온-라인 확장을 통해 새롭게 추가된 노드들에 데이터를 이동시킴으로써 데이터 이동의 회수를 줄이면서 빠른 시간 안에 온-라인 재조직을 수행하도록 한다. 또한 제안된 기법에서는 $B^{+}$-트리 색인 대신 캐시를 고려한 CS$B^{+}$-트리 색인을 이용하여 검색과 갱신 연산을 보다 빠르게 처리하도록 한다. 제안된 온-라인 재조직 기법은 확장 가능한 고가용 데이터베이스 클러스터 시스템으로 개발된 최대 결함허용 보장 데이터베이스 클러스터(Ultra Fault-Tolerant Database Cluster) 환경에서 성능 평가를 통해 기존 기법에 비해 빠르고 효율적임을 보인다.