DOI QR코드

DOI QR Code

그리드 인덱스 기반 뷰 선택 기법을 이용한 효율적인 Top-k 질의처리 알고리즘

Efficient Top-k Query Processing Algorithm Using Grid Index-based View Selection Method

  • 홍승태 (전북대학교 전자정보공학부) ;
  • 윤들녁 (전북대학교 전자정보공학부) ;
  • 장재우 (전북대학교 전자정보공학부)
  • 투고 : 2014.09.04
  • 심사 : 2014.10.28
  • 발행 : 2015.01.15

초록

최근 대용량 데이터의 분석을 위한 top-k 질의처리 알고리즘에 대한 관심이 고조되고 있다. 그러나 기존 top-k 질의처리 알고리즘은 효율적인 인덱스 구조를 제공하지 않기 때문에, 높은 탐색 비용을 야기하며, 아울러 다양한 질의 유형을 지원하지 못하는 문제점이 존재한다. 이러한 문제점을 해결하기 위해, 본 논문에서는 그리드 인덱스 기반 뷰 선택 기법을 이용한 top-k 질의처리 알고리즘을 제안한다. 제안하는 기법은 그리드 인덱스 기반의 뷰 선택 기법을 통해 주어진 질의 영역에 대하여 최소한의 그리드 셀만을 탐색함으로써 질의처리 시간을 감소시킨다. 마지막으로, 성능 평가를 통해 제안하는 top-k 질의처리 알고리즘이 기존 알고리즘에 비해 질의처리 시간 및 질의 결과 정확도 측면에서 우수함을 나타낸다.

Research on top-k query processing algorithms for analyzing big data have been spotlighted recently. However, because existing top-k query processing algorithms do not provide an efficient index structure, they incur high query processing costs and cannot support various types of queries. To solve these problems, we propose a top-k query processing algorithm using a view selection method based on a grid index. The proposed algorithm reduces the query processing time by retrieving the minimum number of grid cells for the query range, by using a grid index-based view selection method. Finally, we show from our performance analysis that the proposed scheme outperforms an existing scheme, in terms of both query processing time and query result accuracy.

키워드

과제정보

연구 과제 주관 기관 : 한국연구재단

참고문헌

  1. S. Hong, S. Lee, S. Lee, "Efficient Execution of Range Top - k Queries in a Hierarchical Max R - Tree," Proc. of the KIISE Korea Spring Conference, Vol. 30, No. 1, pp. 746-748, 2003. (in Korean)
  2. I. F. Ioannidis, W. G. Aref, and A. K. Elmagarmid. "Supporting top-k join queries in relational databases system," Journal on Very Large Databases, Vol. 13 No. 3, pp. 207-221, 2004.
  3. M. H. Yeo, D. O. Seong, J. S. Yoo, "A Cluster- Based Top-k Query Processing Algorithm in Wireless Sensor Networks," Journal of KIISE : Database, Vol. 36, No. 4, pp. 306-313, 2009. (in Korean)
  4. J. S. Park, "A Sampling-based Algorithm for Top-k Similarity Joins," Journal of KIISE : Database, Vol. 41, No. 4, pp. 256-261, 2014. (in Korean)
  5. L. Zou and L. Chen, "Pareto-based dominant graph: An efficient indexing structure to answer top-k queries," Journal of the Knowledge and Data Engineering, IEEE Transaction, Vol. 23, No. 5, pp. 727- 741, 2011. https://doi.org/10.1109/TKDE.2010.240
  6. S. Hwang and K. C. Chang, "Optimizing top-k queries for middleware access: A unified cost-based approach," Journal of the ACM Transactions on Database Systems, Vol. 32, No. 1, 2007.
  7. G. Das, D. Gunopulos, N. Koudas, and D. Tsirogiannis, "Answering top-k queries using views," Proc. of the 32nd international conference on Very large data bases, pp. 451-462, 2006.
  8. Min Xie, Laks V.S. Lakshmanan, Peter T. Wood, "Efficient Top-k Query Answering using Cached Views," Proc. of the 16th International Conference on Extending Database Technology, pp. 498-500, 2013.
  9. R. Fagin, A. Lotem, and M. Naor, "Optimal aggregation algorithms for middleware," Journal of Computer and System Sciences, Vol. 66, No. 4, pp. 614- 656, Jun. 2003. https://doi.org/10.1016/S0022-0000(03)00026-6
  10. Census- Original data (1987) [Online]. Available: http://archive.ics.uci.edu/ml/