Multiple Continuous Skyline Query Processing Over Data Streams

다중 연속 스카이라인 질의의 효율적인 처리 기법

  • Received : 2010.09.27
  • Accepted : 2010.11.05
  • Published : 2010.11.30

Abstract

Recently, the processing of data streams such as stock quotes, buy-sell orders, and billing records becomes more important in e-Business environments. Especially, the use of skyline queries over data streams is rapidly increasing to support multiple criteria decision making. Given a set of multi-dimensional tuples, a skyline query retrieves a set of tuples which are not dominated by other tuples. Although there has been much work on processing skyline queries over static datasets, there has been relatively less work on processing multiple skyline queries over data streams. In this paper, we propose an efficient method for processing multiple continuous skyline queries over data streams. The proposed method efficiently identifies which tuple is a skyline tuple of which query, resulting in a lower cost of processing multiple skyline queries. Through performance evaluation, we show the performance advantage of the proposed method.

최근 들어 e-비즈니스 환경에서도 증권 거래, 시세, 주문 및 과금 데이터와 같이 지속적으로 유입되는 데이터 스트림에 대한 처리가 중요해지고 있다. 이 중에서도 데이터 스트림에 대한 다기준 의사 결정에 사용되는 스카이라인(skyline) 질의의 사용이 증가하고 있다. 다차원 튜플의 집합이 주어졌을 때, 스카이라인 집합은 다른 튜플에 의해 지배(dominate)되지 않는 튜플들의 집합을 반환한다. 고정된 데이터에 대한 단일 스카이라인 질의 처리에 대해서는 최근까지 많은 연구가 이루어져 왔으나, 데이터 스트림 환경에서 다중 연속 스카이라인 질의 처리에 대해서는 아직까지 많은 연구가 수행되지 않았다. 본 논문에서는 데이터 스트림 환경에서 하나 이상의 연속 스카이라인 질의들이 주어졌을 때, 이들을 효율적으로 처리할 수 있는 방법을 제안한다. 제안하는 방법은 각 튜플이 어떤 질의의 결과에 포함될지를 효율적으로 파악함으로써, 여러 개의 연속 스카이라인 질의들도 적은 비용으로 동시에 처리할 수 있다. 다양한 실험을 통해 제안하는 방법의 우수성을 보인다.

Keywords

References

  1. Arasu, A., Babu, S., and Widom, J., "The CQL continuous query language : Semantic foundations and query execution," The VLDB Journal, Vol. 15, No. 2, 2006, pp. 121-142. https://doi.org/10.1007/s00778-004-0147-z
  2. Bentley, J. L., Kung, H. T., Schkolnick M., and Thompson, C. D., "On the average number of maxima in a set of vectors and applications," Journal of the ACM, Vol. 25, No. 4, 1978, pp. 536-543. https://doi.org/10.1145/322092.322095
  3. Borzonyi, S., Stocker, K., and Kossmann, D., "The skyline operator," Proceedings of the 17th International Conference on Data Engineering, 2001.
  4. Chomicki, J., Godfrey, P., Gryz, J., and Liang, D., "Skyline with presorting," Proceedings of the 19th International Conference on Data Engineering, 2003.
  5. Godfrey, P., Shipley, R., and Gryz, J., "Maximal vector computation in large data sets," Proceedings of the 31st international conference on Very Large Data Bases, 2005.
  6. Huang, Z., Sun, S., and Wang, W., "Efficient mining of skyline objects in subspaces over data streams," Knowledge and Information Systems, Vol. 22, No. 2, 2010, pp. 159-183. https://doi.org/10.1007/s10115-008-0185-8
  7. Kossmann, D., Ramsak, F., and Rost, S., "Shooting stars in the sky : An online algorithm for skyline queries," Proceedings of the 28th international conference on Very Large Data Bases, 2002.
  8. Kung, H. T., Luccio, F., and Preparata, F. P., "On finding maxima of a set of vectors," Journal of the ACM, Vol. 22, No. 4, 1975, pp. 469-476. https://doi.org/10.1145/321906.321910
  9. Lee, K. C., Lee, W., Zheng, B., Li, H., and Tian, Y., "Z-SKY : an efficient skyline query processing framework based on Z-order," The VLDB Journal, Vol. 19, No. 3, 2010, pp. 333-362. https://doi.org/10.1007/s00778-009-0166-x
  10. Lin, X., Yuan, Y., Wang, W., Lu, H., "Stabbing the sky : Efficient skyline computation over sliding windows," Proceedings of the 21st International Conference on Data Engineering, 2005.
  11. Papadias, D., Tao, Y., Fu, G., Seeger, B., "An optimal and progressive algorithm for skyline queries," Proceedings of the 2003 ACMSIGMOD international conference on Management of data, 2003.
  12. Sun, S., Huang, Z., Zhong, H., Dai, D., Liu, H., and Li, J., "Efficient monitoring of skyline queries over distributed data streams," Knowledge and Information Systems, DO I : 10.1007/s10115-009-0269-0, 2009.
  13. Tan, K. L., Eng, P. K., and Ooi, B. C., "Efficient progressive skyline computation," Proceedings of the 27th International Conference on Very Large Data Bases, 2001.
  14. Tao, Y. and Papadias, D., "Maintaining sliding window skylines on data streams," IEEE Transactions on Knowledge and Data Engineering, Vol. 18, No. 3, 2006, pp. 377-391.