Iceberg Cube Parallel Computation using MapReduce

맵리듀스를 이용한 빙산 큐브 병렬 계산

  • Lee, Su-An (Department of Computer Science, Kangwon National University) ;
  • Kim, Jin-Ho (Department of Computer Science, Kangwon National University) ;
  • Moon, Yang-Sae (Department of Computer Science, Kangwon National University) ;
  • Loh, Woong-Kee (Department of Multimedia, Sungkyul University)
  • 이수안 (강원대학교 컴퓨터학부) ;
  • 김진호 (강원대학교 컴퓨터학부) ;
  • 문양세 (강원대학교 컴퓨터학부) ;
  • 노웅기 (성결대학교 멀티미디어 학부)
  • Published : 2010.06.30

Abstract

대용량 데이터의 효율적 분석을 위해 데이터 뷰브가 연구되었으며, 데이터 큐브 계산의 고비용 문제점을 해결하기 위하여 큐브의 일부 영역만을 계산하는 빙산 큐브가 등장하였다. 빙산 큐브는 저장 공간의 감소, 집중적인 분석 등의 장점이 있으나, 여전히 많은 계산과 저장 공간을 필요로 하는 단점이 있다. 본 논문에서는 이러한 문제점을 해결하는 실용적인 방법으로 대용량 문제를 분산하여 처리하는 분산 병렬 컴퓨팅 기술인 맵리듀스(MapReduce) 프레임워크를 사용하여 분산 병렬 빙산 큐브인 MR-Naive와 MR-BUC 알고리즘을 제안한다. 실험을 통해 맵리듀스 프레임워크를 통한 빙사 큐브 계산이 효율적으로 분산 병렬 처리 됨을 확인하였다.

Keywords