DOI QR코드

DOI QR Code

An Efficient Clustering Algorithm for Massive GPS Trajectory Data

대용량 GPS 궤적 데이터를 위한 효율적인 클러스터링

  • 김태용 (부산대학교 전기전자컴퓨터공학과) ;
  • 박보국 (부산대학교 전기전자컴퓨터공학과) ;
  • 박진관 (부산대학교 전기전자컴퓨터공학과) ;
  • 조환규 (부산대학교 전기컴퓨터공학부)
  • Received : 2015.08.05
  • Accepted : 2015.10.08
  • Published : 2016.01.15

Abstract

Digital road map generation is primarily based on artificial satellite photographing or in-site manual survey work. Therefore, these map generation procedures require a lot of time and a large budget to create and update road maps. Consequently, people have tried to develop automated map generation systems using GPS trajectory data sets obtained by public vehicles. A fundamental problem in this road generation procedure involves the extraction of representative trajectory such as main roads. Extracting a representative trajectory requires the base data set of piecewise line segments(GPS-trajectories), which have close starting and ending points. So, geometrically similar trajectories are selected for clustering before extracting one representative trajectory from among them. This paper proposes a new divide- and-conquer approach by partitioning the whole map region into regular grid sub-spaces. We then try to find similar trajectories by sweeping. Also, we applied the $Fr{\acute{e}}chet$ distance measure to compute the similarity between a pair of trajectories. We conducted experiments using a set of real GPS data with more than 500 vehicle trajectories obtained from Gangnam-gu, Seoul. The experiment shows that our grid partitioning approach is fast and stable and can be used in real applications for vehicle trajectory clustering.

도로지도 생성은 인공위성 촬영이나 현장실사를 기반으로 한다. 그리하여 도로지도를 생성하고 수정하는데 많은 시간과 비용이 든다. 이러한 이유로 차량 GPS 데이터를 이용해 도로지도를 생성하는 연구가 활발히 진행되고 있다. 도로지도 생성 연구에서 가장 중요한 문제는 주도로와 같은 대표궤적을 추출하는 것이다. 대표궤적 추출을 수행할 때에는 시작과 끝이 비슷한 궤적데이터들의 집합을 전제로 하여 궤적을 추출한다. 따라서 대표궤적을 추출하기에 앞서 전처리 과정으로 궤적 클러스터링 작업이 필요하다. 본 논문에서는 이러한 문제를 해결하기 위해 하나의 영역을 일정한 격자로 분할하고, Sweep Line 알고리즘을 응용해 유사궤적들을 탐색한다. 마지막으로 프레쉐거리를 이용하여 궤적 간 유사도를 계산하였다. 실제로 서울의 강남구 지역에 있는 500대의 차량 GPS 궤적을 가지고 클러스터링 작업을 수행하였다. 또한, 실험을 통하여 격자분할 접근방식의 빠른 수행시간과 안정성을 보였다.

Keywords

Acknowledgement

Grant : BK21플러스

Supported by : 부산대학교

References

  1. J.-G. Lee, J. Han and K.-Y. Whang, "Trajectory clustering: a partition-and-group framework," Proc. of ACM SIGMOD, pp. 593-604, 2007.
  2. J. Biagioni and J. Eriksson, "Inferring road maps from global positioning system traces," Journal of the Transportation Research Board : Transportation Research Record, Vol. 2291, No. 8, pp. 61-71, 2012. https://doi.org/10.3141/2291-08
  3. L. Cao and J. Krumm, "From GPS traces to a routable road map," Proc. of ACM SIGSPATIAL, pp. 3-12, 2009.
  4. S. Jang, T. Kim and S. Lee, "Map generation system with lightweight GPS trace data," ICACT, pp. 1489-1493, 2010.
  5. K. Buchin, M. Buchin, M. van Kreveld, M. Loffler, Rodrigo I. Silveira, C. Wenk and L. Wiratma, "Median trajectories," Algorithmica, Vol. 66, No. 3, pp. 595-614, Jul. 2013. https://doi.org/10.1007/s00453-012-9654-2
  6. M van. Kreveld and L. Wiratma, "Median trajectories using well-visited regions and shortest paths," Proc. of ACM GIS, pp. 241-250, 2011.
  7. K. R. Zalik and B. Zalik, "A sweep-line algorithm for spatial clustering," Advances in Engineering Software, Vol. 40, No. 6, pp. 445-451, Jun. 2009. https://doi.org/10.1016/j.advengsoft.2008.06.003
  8. H. Alt and M. Godau, "Computing the Frechet distance between two polygonal curves," International Journal of Computational Geometry & Applications, Vol. 5, No. 1&2, pp. 75-91, 1995. https://doi.org/10.1142/S0218195995000064
  9. P. K. Agarwal, R. B. Avraham, H. Kaplan and M. Sharir, "Computing the Discrete Fréchet Distance in Subquadratic Time," SIAM J. Computing, Vol. 43, No. 2, pp. 429-444, Mar. 2014. https://doi.org/10.1137/130920526