Analysis of High Dimensional Data using Low Dimensional Summary Tables

저차원 집계 테이블들을 사용한 고차원 데이터의 온라인 분석

  • Choi, Hae-Jung (Dept. of Computer Science & Engineering, Ewha Womans University) ;
  • Kim, Myung (Dept. of Computer Science & Engineering, Ewha Womans University)
  • 최혜정 (이화여자대학교 컴퓨터학과 고성능인터넷지식공학연구실) ;
  • 김명 (이화여자대학교 컴퓨터학과 고성능인터넷지식공학연구실)
  • Published : 2002.10.01

Abstract

다차원 데이터를 온라인으로 분석하기 위해서는 사전에 집계 테이블들을 계산해 둔다. 대용량 고차원 데이터의 경우는 집계 테이블의 분량이 천문학적으로 방대하기 때문에 사전 집계 계산이 현실적으로 불가능한 경우가 많다. 고차원 데이터 처리에 관한 연구로는 데이터의 차원 수를 감소시키거나 인덱스를 압축하여 질의처리 시간을 단축하려는 연구를 들 수 있는데, 이러한 방법들은 고차원 데이터의 온라인 분석시에 발생하는 데이터 폭발 현상을 근본적으로 해결하지는 못한다. 본 연구에서는 고차원 데이터가 분석될 때 실제로 저차원 집계 테이블들이 주로 사용된다는 점에 착안하여 데이터 폭발 현상을 감소시키면서 데이터를 분석하는 방안을 제시한다 이 방법은 사전 집계 연산을 할 때 크기가 방대한 고차원 집계 테이블들의 생성을 생략하고, 3-6차원 또는 그 이하 차원의 집계 테이블들만을 고속으로 동시에 생성하는 방법이다.

Keywords