Predicting ozone warning days based on an optimal time series model

최적 시계열 모형에 기초한 오존주의보 날짜 예측

  • Published : 2009.03.31

Abstract

In this article, we consider linear models such as regression, ARIMA (autoregressive integrated moving average), and regression+ARIMA (regression with ARIMA errors) for predicting hourly ozone concentration level in two areas of Daegu. Based on RASE(root average squared error), it is shown that the ARIMA is the best model in one area and that the regression+ARIMA model is the best in the other area. We further analyze the residuals from the optimal models, so that we might predict the ozone warning days where at least one of the hourly ozone concentration levels is over 120 ppb. Based on the training data in the years from 2000 to 2003, it is found that 35 ppb is a good cutoff value of residulas for predicting the ozone warning days. In on area of Daegu, our method predicts correctly one of two ozone warning days of 2004 as well as all of the remaining 364 non-warning days. In the other area, our methods predicts correctly all of one ozone warning days and 365 non-warning days of 2004.

이 논문에서는 대구 두 개 동의 시간별 오존농도를 예측하는 모형으로 회귀, 자기회귀누적이동평균, 자기회귀누적이동평균 오차를 가지는 회귀 같은 선형모형들을 고려하였다. 평균제곱오차제곱근에 근거하여 보았을 때 한 개 동에서는 자기회귀누적이동평균 모형이 최적의 모형으로 선택되었고, 다른 동에서는 자기회귀누적이동평균 오차를 가지는 회귀 모형이 최적 모형으로 선택되었다. 이 최적의 모형으로부터 나온 잔차들의 변동석 분석을 수행하였는데 이를 통해 120 ppb를 넘는 오존 주의보 날짜를 예측하였다. 2000년에서 2003년까지의 훈련용 자료에 근거하여 보았을 때 잔차값의 경계값으로 35 ppb를 잡았을 때 오존주의보 날짜를 예측하는데 좋은 결과를 보였다. 하나의 동에서는 2004년의 오존주의보가 발령된 이틀 중 하루와 나머지 주의보가 발령되지 않은 364일을 모두 정확히 예측하였다. 다른 동에서는 2004년의 오존주의보가 발령된 하루와 주의보가 발령되지 않은 365일을 모두 정확히 예측하였다.

Keywords

References

  1. 김용국, 이종범 (1996). 하계의 일최고 오존농도 예측을 위한 신경망 모델의 개발. <한국대기보전학회지>, 10, 224-232.
  2. 김용준 (1997). 현업 운영 가능한 서울지역의 일 최고 대기오염도 예보모델 개발 연구. <한국대기보전학회지>, 13, 79-89.
  3. 김유근, 손건태, 문윤섭, 오인보 (1999). 서울지역의 지표오존농도 예보를 위한 전이함수모델 개발. <한국대기환경학회지>, 15, 779-789.
  4. 박옥현 (1984). 간단한 대기확산 모델과 통계학적 방법을 병용한 도시 대기오염의 예측. <대한환경공학회지>, 6, 2001-2012.
  5. 이기원, 권숙표, 정용 (1993). 서울시 대기 중 오존오염도의 연도별 변화와 그 영향인자 분석. <한국대기보전학회지>, 9, 107-115.
  6. 최성우 (2002). 다중회귀분석을 통한 대구지역 오존농도 예측. <한국환경과학회지>, 11, 687-696.
  7. 허정숙, 김동술 (1993). 다변량 통계분석을 이용한 서울시 고농도 오존의 예측에 관한 연구. <한국대기보전학회지>, 9, 207-215.
  8. Acuna, G., Jorquera, H. and Perez, R. (1996). Neural network model for maximum ozone concentration prediction. Lecture Notes in Computer Science, 1112, 263-268, Springer, New York.
  9. Hubbard, M. C. and Cobourn, W. G. (1998). Deveolopment of a regression model to forecast ground-level ozone concentration in Louiville, KY, U.S.A. Atmospheric Environment, 32, 2637-2647. https://doi.org/10.1016/S1352-2310(97)00444-5
  10. Hyndman, R. J. and Koehler, A. B. (2006). Another look at measures of forecast accuracy. International Journal of Forecasting, 22, 679-688. https://doi.org/10.1016/j.ijforecast.2006.03.001
  11. Jorquera, H., Perez, R., Cipriano, A., Espejo, A., Letelier, M. V. and Acuna, G. (1998). Forecasting ozone daily maximum levels at Santiago, Chile. Atmospheric Environment, 32, 3415-3424. https://doi.org/10.1016/S1352-2310(98)00035-1
  12. Kim, H. and Park, C. (2008). An optimal hybrid model for predicting hourly ozone concentration level. Journal of the Korean Data & Information Science Society, 19, 209-217.
  13. Lee, H. (2008) Analysis of time series models for ozone concentrations at the Uijeongbu city in Korea. Journal of the Korean Data & Information Science, 19, 1153-1164.
  14. Niu, X.-F. (1996). Nonlinear additive models for environment time series, with application to ground-level ozone data analysis. Journal of the American Statistical Association, 91, 1310-1321. https://doi.org/10.2307/2291749
  15. Robeson, S. M. and Steyn, D. G. (1990). Evaluation and comparison of statistical forecast models for daily maximum ozone concentrations. Atmospheric Environment, 24B, 303-312.
  16. Yi, J. and Prybutok, V. R. (1996). A neural network model forecasting for prediction of daily maximum ozone concentration in an industrialised urban area. Environmental Pollution, 92, 349-357. https://doi.org/10.1016/0269-7491(95)00078-X