Abstract
In this article, we consider linear models such as regression, ARIMA (autoregressive integrated moving average), and regression+ARIMA (regression with ARIMA errors) for predicting hourly ozone concentration level in two areas of Daegu. Based on RASE(root average squared error), it is shown that the ARIMA is the best model in one area and that the regression+ARIMA model is the best in the other area. We further analyze the residuals from the optimal models, so that we might predict the ozone warning days where at least one of the hourly ozone concentration levels is over 120 ppb. Based on the training data in the years from 2000 to 2003, it is found that 35 ppb is a good cutoff value of residulas for predicting the ozone warning days. In on area of Daegu, our method predicts correctly one of two ozone warning days of 2004 as well as all of the remaining 364 non-warning days. In the other area, our methods predicts correctly all of one ozone warning days and 365 non-warning days of 2004.
이 논문에서는 대구 두 개 동의 시간별 오존농도를 예측하는 모형으로 회귀, 자기회귀누적이동평균, 자기회귀누적이동평균 오차를 가지는 회귀 같은 선형모형들을 고려하였다. 평균제곱오차제곱근에 근거하여 보았을 때 한 개 동에서는 자기회귀누적이동평균 모형이 최적의 모형으로 선택되었고, 다른 동에서는 자기회귀누적이동평균 오차를 가지는 회귀 모형이 최적 모형으로 선택되었다. 이 최적의 모형으로부터 나온 잔차들의 변동석 분석을 수행하였는데 이를 통해 120 ppb를 넘는 오존 주의보 날짜를 예측하였다. 2000년에서 2003년까지의 훈련용 자료에 근거하여 보았을 때 잔차값의 경계값으로 35 ppb를 잡았을 때 오존주의보 날짜를 예측하는데 좋은 결과를 보였다. 하나의 동에서는 2004년의 오존주의보가 발령된 이틀 중 하루와 나머지 주의보가 발령되지 않은 364일을 모두 정확히 예측하였다. 다른 동에서는 2004년의 오존주의보가 발령된 하루와 주의보가 발령되지 않은 365일을 모두 정확히 예측하였다.