Proceedings of the Korea Information Processing Society Conference (한국정보처리학회:학술대회논문집)
- 2006.11a
- /
- Pages.417-420
- /
- 2006
- /
- 2005-0011(pISSN)
- /
- 2671-7298(eISSN)
Fast Aggregation of Stream Data Using AVL Trees
AVL 트리를 활용한 스트림 데이터의 고속 집계 연산
- Kim, Ji-Hyun (Dept. of Computer Science and Engineering, Ewha Womans University) ;
- Kim, Myung (Dept. of Computer Science and Engineering, Ewha Womans University)
- Published : 2006.11.10
Abstract
스트림 데이터는 고속으로 생성되고 용량이 방대하여 저장하기 힘들며 데이터가 흘러가는 가운데 분석해야 하므로 기존 데이터 분석 방식을 그대로 사용하기는 어렵다. 본 연구에서는 스트림 데이터 분석 연산중의 하나인 다차원 집계 연산을 고속으로 처리하는 방법을 제안한다. 기존 연구들과 마찬가지로 스트림 데이터를 시간 차원 기준으로 윈도우 단위로 나누고, 각 윈도우마다 독립적인 집계 연산을 하도록 하였으며, 생성하고자 하는 집계 테이블들은 스트림 데이터가 입력되기 전에 미리 결정된다고 가정하였다. 정렬되지 않은 스트림 데이터를 고속으로 집계하기 위해 본 연구에서는 배열과 AVL 트리 구조를 혼합하여 사용하였다. 이 방법은 생성할 집계 테이블들 선택이 자유롭고, 집계 테이블들 전체가 메모리에 상주할 수 없을 정도로 큰 경우도 집계 연산을 실행할 수 있다는 장점을 갖는다. 제안한 방법의 효율성은 실험을 통해 입증하였다.
Keywords