Modelling Missing Traffic Volume Data using Circular Probability Distribution

순환확률분포를 이용한 교통량 결측자료 보정 모형

  • Published : 2007.08.30

Abstract

In this study, an imputation model using circular probability distribution was developed in order to overcome problems of missing data from a traffic survey. The existing ad-hoc or heuristic, model-based and algorithm-based imputation techniques were reviewed through previous studies, and then their limitations for imputing missing traffic volume data were revealed. The statistical computing language 'R' was employed for model construction, and a mixture of von Mises probability distribution, which is classified as symmetric, and unimodal circular probability were finally fitted on the basis of traffic volume data at survey stations in urban and rural areas, respectively. The circular probability distribution model largely proved to outperform a dummy variable regression model in regards to various evaluation conditions. It turned out that circular probability distribution models depict circularity of hourly volumes well and are very cost-effective and robust to changes in missing mechanisms.

자료결측의 심각성은 현실적으로 거의 대부분의 조사에서 발생한다. 비단 교통분야뿐만 아니라 인문사회 분야나 기상학, 생물학, 지구과학 등 모든 분야에서 인력식이든 기계식이든 조사 방식에 관계없이 발생한다. 교통자료 수집장비에서의 자료결측의 발생은 현실적으로 불가피한 현상으로 볼 수 있으며, 이와 같은 자료 수집과정에서 발생하는 결측을 신뢰성있게 추정하여 보정하였던 선행연구의 대부분은 교통량 자료의 결측값 보정시 통계적 검증없이 시간적인 임의의 종속성만 고려함으로서, 보정 성능이 떨어지는 단점을 노출하고 있다. 이들 연구에서 적용했던 기법들 또한, 교통량 자료가 가지고 있는 가장 큰 특징인 주기적 순환성(periodic circularity)이 제대로 반영되지 못함으로서 적용상 한계를 노출하고 있다. 본 연구는 현실적으로 거의 대부분의 조사과정에서 발생하는 자료결측의 심각성에 대한 인식을 토대로 대안으로 순환분포모형을 제안하였다. 이러한 자료결측 현상에 대응하고자 하였던 기존의 ad-hoc 또는 heuristic 보정 기법과 모형 기반 및 알고리즘 기반의 보정 기법에 관한 선행 연구의 고찰을 통하여 이들 기법들의 한계점을 확인하였다.

Keywords

References

  1. Chandra, C. and Al-Deek, H.(2004), New Algorithms for Filtering and Imputation of Real Time and Archived Dual-Loop Detector Data in the I-4 Data Warehouse, Proc., 83rd TRB Annual Meeting, TRB National Research Council, Washington, D.C
  2. Conklin, J.H., Scherer, W.T.(2003), Data Imputation Strategies for Transportation Management Systems, Research Project Report, Center for Transportation Studies, Univ. of Virginia
  3. FHWA(2001), Traffic Monitoring Guide, FHWA
  4. Gold, D.L., Turner, S.M., Gajewski, B.J., Spiegelman, C.(2001), Imputing Missing Values in ITS Data Archives for Intervals under 5 Minutes, Proc., 80th Transportation Research Board(TRB) Annual Meeting, TRB National Research Council, Washington, D.C
  5. Little, R.A., Rubin, D.B.(1987), Statistical Analysis with Missing Data, John Wiley & Sons, New York
  6. Ni, D., Leonard, J.D., Guin, A., Feng, C.(2005), Multiple Imputation Scheme for Overcoming the Missing Values and Variability Issues in ITS Data, Journal of Transportation Engineering, vol.131, pp.931-938 https://doi.org/10.1061/(ASCE)0733-947X(2005)131:12(931)
  7. Pigott, T.D.(2001), A Review of Methods for Missing Data, Educational Research and Evaluation vol.4 pp.353-383
  8. Ravindran, P.(2002), Bayesian Analysis of Circular Data using Wrapped Distributions, Ph.D Dissertation of North Carolina State Univ. Raleigh USA
  9. Sharma, S.C., Lingras, P., Zhong, M.(2003), Effect of Missing Value Imputations on Traffic Parameters Estimations from Permanent Traffic Counts, Proc., 82nd Transportation Research Board(TRB) Annual Meeting, TRB National Research Council, Washington, D.C
  10. Zhong, M., Lingras, P., Sharma, S.C.(2002), Applying Short-term Traffic Prediction Models for Updating Missing Values of Traffic Counts, submitted to the Journal of Transportation Engineering, ASCE
  11. 박경수(1992), 신뢰도공학 및 정비이론, 희중당
  12. 오영남(2006), 방향자료에 대한 분석과 모형화, 석사학위논문, 충북대학교
  13. 장진환, 백남철(2005), 교통량 결측 자료 대체기법 연구, 2005년도 학술발표회 논문집, 대한토목학회