저장뷰를 통한 빙산 질의 처리

Iceberg Query Processing by Materialized View

  • 홍석진 (서울대학교 전기 · 컴퓨터공학부) ;
  • 이석호 (서울대학교 전기 · 컴퓨터공학부)
  • 발행 : 2000.12.01

초록

빙산 질의란 대용량의 데이터에 대해 집단 함수를 수행하여 특정 임계값 이상인 데이터를 결과로 반환하는 연산을 의미한다. 빙산 질의는 도메인의 크기가 대단히 큰 다차원, 대용량의 데이터에 대해 적용되므로 집단 함수의 수행을 위한 카운터를 전부 메모리에 적재할 수 없는 상황이 발생한다. 이 논문에서는 빙산 질의에 대한 저장뷰를 통해 효율적으로 빙산질의를 수행하는 방법을 제시하였다. 빙산 질의의 임계값이 저장뷰 내에 포함되는 경우에는 즉각적으로 결과를 돌려줄 수 있으며, 그렇지 않음 경우에도 표본추출 대신 저장뷰를 사용함으로써 빙산 질의 중간 단계의 후보 수를 크게 감소시키고, 질의 수행 시간 또한 단축시킬 수 있다. 또한 순위 빙산 질의를 수행하는 방법을 제시하여 사용자로 하여금 보다 직관적인 질의를 작성할 수 있도록 하였다.

키워드

참고문헌

  1. M. Fang, N. Shivakumar, H. G. Molina, R. Motwani, J. D. Ullman, 'Computing iceberg queries efficiently,' VLDB 1998
  2. S. Chaudhuri and U. Dayal, 'An overview of data warehousing and OLAP technology,' ACM SIGMOD Record 26(1), 1997 https://doi.org/10.1145/248603.248616
  3. M.C. Wu, A.P. Buchmann, 'Research Issues in Data Warehousing,' BTW'97, Ulm, March, 1997
  4. A. Savasere, E. Omiecinski, and S. Navathe, 'An efficient algorithm for mining association rules in large databases,' VLDB, 1995
  5. N. Roussopoulos, 'Materialized Views and Data Warehouses,' SIGMOD Record, 27(1), p21-26, March 1998
  6. F. Olken, 'Random sampling from databases,' PhD thesis, University of California, Berkeley, 1993
  7. J.S. Park, M.S. Chen, and P.S. Yu, 'An effective hash based algorithm for mining association rules,' In Proceedings of ACM SIGMOD Conference, 1995 https://doi.org/10.1145/223784.223813
  8. Kevin S. Beyer, Raghu Ramakrishnan, 'Bottom-Up Computation of Sparse and Iceberg CUBEs,' SIGMOD Conference 1999 https://doi.org/10.1145/304182.304214
  9. 배진욱, 이석호, '빙산 질의 처리를 위한 동적 분할', '99 봄 학술발표논문집(B), 제26권 1호, pp.164-166, 1999.4
  10. S. Chaudhuri, L. Gravano, 'Evaluating Top-k Selection Queries,' VLDB 1999
  11. D.Quass, J.Widom, 'On-Line Warehouse View Maintenance,' SIGMOD 1997 https://doi.org/10.1145/253260.253352
  12. W.H.Inmon, R.D.Hackathorn, 'Using the Data Warehouse,' John Wiley & Sons, 1994