DOI QR코드

DOI QR Code

An Approach for the Estimation of Mixture Distribution Parameters Using EM Algorithm

복합확률분포의 파라메타 추정을 위한 EM 알고리즘의 적용 연구

  • Daeyoung Shim (Dept. of Architecture, Catholic Kwandong University) ;
  • SangGu Kim (Dept. of Logistics and Transportation, Chonnam National University)
  • 심대영 (가톨릭관동대학교 건축학과 ) ;
  • 김상구 (전남대학교 물류교통학과 )
  • Received : 2023.05.16
  • Accepted : 2023.07.05
  • Published : 2023.08.31

Abstract

Various single probability distributions have been used to represent time headway distributions. However, it has often been difficult to explain the time headway distribution as a single probability distribution on site. This study used the EM algorithm, which is one of the maximum likelihood estimations, for the parameters of combined mixture distributions with a certain relationship between two normal distributions for the time headway of vehicles. The time headway distribution of vehicle arrival is difficult to represent well with previously known single probability distributions. But as a result of this analysis, it can be represented by estimating the parameters of the mixture probability distribution using the EM algorithm. The result of a goodness-of-fit test was statistically significant at a significance level of 1%, which proves the reliability of parameter estimation of the mixture probability distribution using the EM algorithm.

그동안 차두시간분포를 나타내는 확률분포로 음지수분포, Erlang 분포, 정규분포 등 다양한 단일확률분포들이 사용되어져 왔다. 그러나, 실제 도로에서 차두시간분포의 조사결과는 단일확률분포로서 설명하기 어려운 경우가 있었다. 본 연구는 차량의 차두시간에 대해 두 개의 정규분포가 일정한 관련성을 가지고 결합된 복합확률분포의 파라메타에 대해 최우추정법 중 하나인 EM 알고리즘을 이용하여 추정하는 접근방법을 시도하였다. 이에 대한 분석결과 기존에 알려진 단일확률분포로서 잘 설명되기 어려웠던 차량도착 차두시간 분포를 EM 알고리즘을 이용하여 복합확률분포의 파라메타를 추정하여 설명하였다. χ2 test 적합도 검정결과, 유의수준 1%에서 통계학적으로 유의성이 확보되어 EM 알고리즘을 이용한 복합확률분포의 파라메타 추정의 신뢰성이 입증되는 것으로 분석되었다.

Keywords

Acknowledgement

본 논문은 대한교통학회의 제44회 추계학술발표회에 게재되었던 논문을 수정·보완하여 작성하였습니다.

References

  1. Dempster, A. P., Laird, N. M. and Rubin, D. B.(1977), "Maximum Likelihood from Incomplete Data via EM Algorithm", Journal of the Royal Statistical Society, Series B, vol. 39, no. 1. pp.1-22. https://doi.org/10.1111/j.2517-6161.1977.tb01600.x
  2. Everitt, B. S. and Hand, D. J.(1981), Finite Mixture Distributions, Chapman and Hall, pp.4, 9, 25.
  3. Jeong, S. I., Kim, B. S., Park, S. G. and Yoo, Y. G.(1999), Probability and Statistics for Engineers and Scientists, Cheongmoon-Gak Publications, p.306. (in Korean)
  4. Kim, C. G.(2001), MATLAB How to Use and It's Applications, Kyowoo-Sa Publications. (in Korean)
  5. Kim, W. C., Kim, J. J., Park, B. W., Park, S. H., Song, M. S., Lee, S. Y., Lee, Y. J., Jeon, J. W. and Cho, S. S.(1998), Modern Statistics (4th ed.), Youngji Cultural Publication, p.279. (in Korean)
  6. May, A. D.(1990), Traffic Flow Fundamentals, Prentice Hall, pp.14-35.
  7. McLachlan, G. J. and Krishnan, T.(1997), The EM Algorithm and Extensions, John Wiley & Sons.