DOI QR코드

DOI QR Code

Reverse k-Nearest Neighbor Query Processing Method for Continuous Query Processing in Bigdata Environments

빅데이터 환경에서 연속 질의 처리를 위한 리버스 k-최근접 질의 처리 기법

  • 임종태 (충북대학교 정보통신공학과) ;
  • 박선용 (충북대학교 정보통신공학과) ;
  • 서기원 (충북대학교 정보통신공학과) ;
  • 이민호 (한국과학기술정보연구원) ;
  • 복경수 (충북대학교 정보통신공학과) ;
  • 유재수 (충북대학교 정보통신공학과)
  • Received : 2014.09.01
  • Accepted : 2014.09.19
  • Published : 2014.10.28

Abstract

With the development of location aware technologies and mobile devices, location-based services have been studied. To provide location-based services, many researchers proposed methods for processing various query types with Mapreduce(MR). One of the proposed methods, is a Reverse k-nearest neighbor(RkNN) query processing method with MR. However, the existing methods spend too much cost to process the continuous RkNN query. In this paper, we propose an efficient continuous RkNN query processing method with MR to resolve the problems of the existing methods. The proposed method uses the 60-degree-pruning method. The proposed method does not need to reprocess the query for continuous query processing because the proposed method draws and monitors the monitoring area including the candidate objects of a RkNN query. In order to show the superiority of the proposed method, we compare it with the query processing performance of the existing method.

최근 위치 측정 기술과 모바일 기기들의 발달과 함께 위치 기반 서비스가 중요하게 연구되고 있다. 위치기반서비스를 제공하기 위해 많은 연구자들이 맵리듀스를 활용한 다양한 질의 처리 기법을 제안하였다. 그 중에 하나가 맵리듀스를 활용한 리버스 k-최근접 질의 처리 기법이다. 하지만 기존 기법들은 연속 리버스 k-최근접 질의 처리를 수행하기 위해 많은 처리 비용이 요구된다. 본 논문에서는 맵리듀스를 활용한 효율적인 연속 리버스 k-최근접 질의 처리 기법을 제안한다. 제안하는 기법은 60도 가지치기 기법을 이용한다. 제안하는 기법은 60도 가지치기 기법을 활용하여 모니터링 영역을 생성하고 모니터링을 수행하여 결과 업데이트을 수행하기 때문에 효율적으로 결과 업데이트를 수행한다. 또한, 본 논문에서는 제안하는 기법의 우수성을 보이기 위해 기존 기법과의 성능평가를 수행한다.

Keywords

References

  1. J. Schiller and A. Voisard, "Location-based Services," Mor-gan Kaufmann, San Francisco, California, 2004.
  2. S. Brakatsoulas, D. Pfoser, and N. Tryfona, "Modeling, storing, and mining moving object databases," International Database Engineering and Applications Symposium, 2004.
  3. D. Papadias, J. Zhang, N. Mamoulis, and Y. Tao, "Query Processing in Spatial Network Databases," Proc. International conference on Very Large Data Bases, 2003.
  4. K. L. Wu, S. K. Chen, and P. S. Yu, "On Incremental Processing of Continual Range Queries for Location-Aware Services and Applications," Proc. International Conference on Mobile and Ubiquitous Systems, pp.261-269, 2005.
  5. N. Roussopoulos and S. F. Kelley, "Nearest neighbor queries," Proc. ACM SIGMOD international conference on Management of data, 1995.
  6. K. Mouratidis, M. Hadjieleftheriou, and D. Papadias, "Conceptual Partitioning: An Efficient Method for Continuous Nearest Neighbor Monitoring," Proc. ACM Conference on Management of Data, pp.634-645, 2005.
  7. S. Borzsonyi, D. Kossmann, and K. Stocker, "The Skyline Operator," Proc. IEEE International Conference on Data Engineering, pp.421-430, 2001.
  8. C. Li, B. B. Ooi, A. K. H. Tung, and S. Wang, "DADA: a Data Cube for Dominant Relationship Analysis," Proc. ACM SIGMOD International Conference on Management of Data, pp.659-670, 2006.
  9. I. Ilyas, G. Beskales, and M. Soliman, "A Survey of Top-k Query Processing Techniques in Relational Database Systems," ACM Computing Surveys, Vol.40, 2008.
  10. I. F. Ilyas, W. G. Aref, and A. K. Elmagarmid, "Supporting top-k join queries in relational databases," Proc. International conference on Very Large Data Bases, 2003.
  11. W. Wu, F. Yang, C. Y. Chan, and K. Tan, "Continuous Reverse k-Nearest-Neighbor Monitoring," Proc. International Conference on Mobile Data Management, pp.132-139, 2008.
  12. B. Yao, F. Li, and P. Kumar, "Visible Reverse k-Nearest Neighbor Queries," Proc. IEEE International conference on Data Eng. (ICDE), 2009.
  13. K. Shvachko, H. Kuang, S. Radia, and R. Chansler, "The Hadoop Distributed File System," Proc. IEEE Symposium on Mass Storage Systems and Technologies (MSST), pp.1-10, 2010.
  14. J. Dean and S. Ghemawat, "MapReduce: simplified data processing on large clusters," Proc. conference on Symposium on Operating Systems Design & Implementation, p.10, 2004.
  15. 류은경, 손인국, 박준호, 복경수, 유재수, "비-전용 분산 컴퓨팅 환경에서 맵-리듀스 처리 성능 최적화를 위한 효율적인 데이터 재배치 알고리즘", 한국콘텐츠학회논문지, 제13권, 제9호, pp.28-35, 2013.
  16. 손인국, 류은경, 박준호, 복경수, 유재수, "맵-리듀스 처리 속도 향상을 위한 데이터 접근 패턴에 따른 핫-데이터 복제 기법", 한국콘텐츠학회논문지, 제13권, 제11호, pp.21-27, 2013. https://doi.org/10.5392/JKCA.2013.13.11.021
  17. A. Akdogan, U. Demiryurek, F. Banaei- Kashani, and C. Shahabi, "Voronoi-based Geospatial Query Processing with MapReduce," Proc. of the IEEE Cloud Computing, 2010.
  18. C. Ji, H. Hu, Y. Xu, and Y. Li, "Efficient Multi-dimensional Spatial RkNN Query Processing with MapReduce," Proc. ChinaGrid Annual Conference, 2013.
  19. W. Lu, Y. Shen, S. Chen, and B. C. Ooi, "Efficient processing of k nearest neighbor joins using MapReduce," Proc. VLDB Endow (PVLDB), Vol.5, No.10, pp.1016-1027, 2012. https://doi.org/10.14778/2336664.2336674
  20. C. Ji, T. Dong, Y. Li, Y. Shen, K. Li, and W. Qiu, "Inverted grid-based knn query processing with mapreduce," Proc. ChinaGrid annual conference, pp.25-32, 2012.
  21. I. Stanoi, D. Agrawal, and A. E. Abbadi, "Reverse Nearest Neighbor Queries for Dynamic Databases," Proc. of the ACM SIGMOD Workshop on Research Issues in Data Mining and Knowledge Discovery, 2000.