DOI QR코드

DOI QR Code

Design of a MapReduce-Based Mobility Pattern Mining System for Next Place Prediction

다음 장소 예측을 위한 맵리듀스 기반의 이동 패턴 마이닝 시스템 설계

  • 김종환 (경기대학교 컴퓨터과학과) ;
  • 이석준 (경기대학교 컴퓨터과학과) ;
  • 김인철 (경기대학교 컴퓨터과학과)
  • Received : 2014.06.09
  • Accepted : 2014.07.10
  • Published : 2014.08.31

Abstract

In this paper, we present a MapReduce-based mobility pattern mining system which can predict efficiently the next place of mobile users. It learns the mobility pattern model of each user, represented by Hidden Markov Models(HMM), from a large-scale trajectory dataset, and then predicts the next place for the user to visit by applying the learned models to the current trajectory. Our system consists of two parts: the back-end part, in which the mobility pattern models are learned for individual users, and the front-end part, where the next place for a certain user to visit is predicted based on the mobility pattern models. While the back-end part comprises of three distinct MapReduce modules for POI extraction, trajectory transformation, and mobility pattern model learning, the front-end part has two different modules for candidate route generation and next place prediction. Map and reduce functions of each module in our system were designed to utilize the underlying Hadoop infrastructure enough to maximize the parallel processing. We performed experiments to evaluate the performance of the proposed system by using a large-scale open benchmark dataset, GeoLife, and then could make sure of high performance of our system as results of the experiments.

본 논문에서는 모바일 기기 사용자들의 다음 방문 장소를 효율적으로 예측할 수 있는 맵리듀스 기반의 이동 패턴 마이닝 시스템을 소개한다. 이 시스템은 대용량의 사용자 이동 궤적 데이터 집합으로부터 은닉 마코프 모델로 표현되는 각 사용자의 이동 패턴을 학습해내고, 이 모델을 현재 이동 궤적에 적용함으로써 다음 방문 장소를 예측한다. 본 시스템은 사용자별 이동 패턴 모델을 학습하는 후단부와 실시간으로 다음 방문 장소를 예측하는 전단부 등 크게 두 부분으로 구성된다. 이 중에서 후단부는 주요 장소 추출, 이동 궤적 변환, 이동 패턴 모델 학습 등 총 3개의 맵리듀스 작업 모듈들로 구성된다. 이에 반해, 본 시스템의 전단부는 이동 경로 후보군 생성, 다음 장소 예측 등 총 2개의 작업 모듈들로 구성된다. 그리고 본 시스템을 구성하는 각 작업 모듈의 맵과 리듀스 함수들은 하둡 인프라를 효과적으로 활용하여 병렬 처리를 극대화할 수 있도록 설계하였다. 대용량의 공개 벤치마크 데이터 집합인 GeoLife를 이용하여 본 논문에서 소개한 시스템의 성능을 분석하기 위한 실험들을 수행하였고, 실험 결과를 통해 본 시스템의 높은 성능을 확인할 수 있었다.

Keywords

References

  1. A. Akinori, K. Maruyama, and A Sato et al., "Pedestrian-Movement Prediction Based on Mixed Markov-Chain Model," Proc. of the 19th ACM SIGSPATIAL International Conference on Advances in Geographic Information Systems. ACM, 2011.
  2. O. Ossama, H. M. Mokhtar, "Similarity Search in Moving Object Trajectories," Proc. of the 15th International Conference on Management of Data. Computer Society of India, pp.1-6, 2009.
  3. S. Scellato, M. Musolesi, and C Mascolo et al., "NextPlace: a Spatio-Temporal Prediction Framework for Pervasive Systems," Proc. of the 9th International Conference on Pervasive computing, Springer-Verlag, 2011.
  4. A. Monreale, F. Pinelli and R. Trasarti et al., "Wherenext: a Location Predictor on Trajectory Pattern Mining," Proc. of the 15th ACM SIGKDD international conference on Knowledge discovery and data mining, ACM, 2009.
  5. W. Mathew, R. Rapos, and B. Martins, "Predicting Future Locations with Hidden Markov Models," Proc. of the ACM Conference on Ubiquitous Computing, ACM, pp.911-918, 2012.
  6. G. Sebastien, M. O. Killijian, and M. N. del Prado Cortez, "Next Place Prediction Using Mobility Markov Chains," Proc. of the First Workshop on Measurement, Privacy, and Mobility, ACM, 2012.
  7. M. MikoIaj, "Mining Frequent Trajectories of Moving Objects for Location Prediction," Machine Learning and Data Mining in Pattern Recognition, Springer Berlin Heidelberg, pp.667-680, 2007.
  8. GeoLife GPS Trajectories, Microsoft Research, http://research.microsoft.com/en-us/downloads/
  9. S. Perera and T. Gunarathne, Hadoop MapReduce Cookbook, Packt Publishing, 2013.
  10. D. Miner and A. Shook, MapReduce Design Patterns, O'Reilly Media, 2012.