A Bitmap Index for Multi-Dimensional Data Analysis

다차원 데이터 분석을 위한 비트맵 인덱스

  • Im, Yoon-Sun (Dept. of Computer Science & Engineering, Ewha Womans University) ;
  • Park, Young-Sun (Dept. of Computer Science & Engineering, Ewha Womans University) ;
  • Kim, Myung (Dept. of Computer Science & Engineering, Ewha Womans University)
  • 임윤선 (이화여자대학교컴퓨터학과 고성능인터넷지식공학연구실) ;
  • 박영선 (이화여자대학교컴퓨터학과 고성능인터넷지식공학연구실) ;
  • 김명 (이화여자대학교컴퓨터학과 고성능인터넷지식공학연구실)
  • Published : 2002.10.01

Abstract

다차원 데이터를 배열에 저장하는 Multidimensional OLAP (MOLAP) 시스템은 배열내의 위치 정보를 통해 데이터를 신속하게 엑세스할 수 있는 장점을 갖는다. 그러나 실생활의 다차원 데이터는 대체로 희박하여 저장될 때 압축되고, 데이터가 검색될 때는 원래의 위치 정보를 찾기 위해 인덱스를 필요로 하게 된다. 다양한 종류의 다차원 인덱스가 테이블 형태의 데이터를 대상으로 개발되어 있으나, 이들은 데이터의 삽입과 삭제에 유연하게 대처할 수 있도록 하기 위해서 인덱스 공간과 데이터 검색 시간에 약간의 낭비를 초래한다. 본 연구에서는 OLAP 데이터가 주기적으로 갱신되며, 분석에 필요한 집계 데이터도 점진적으로 갱신되기보다 실제로는 새로 생성되고 있다는 점을 고려하여, 읽기 전용 MOLAP 데이터를 위한 인덱스 구조를 제안한다. 데이터는 청크들로 나뉜 후 압축 저장되며, 각 청크는 위치 정보를 유지하면서 비트로 표현되어 인덱스에 저장되도록 하였다. 제안한 비트맵 인덱스는 높은 압축률을 보이며, 범위 질의(range query)를 포함한 OLAP 주요 연산들 처리에 특히 효율적이다.

Keywords