Improvement of PM<sub>10</sub> Forecasting Performance using Membership Function and DNN

Yu, Suk Hyun;Jeon, Young Tae;Kwon, Hee Yong;

doi:10.9717/kmms.2019.22.9.1069

Journal of Korea Multimedia Society (한국멀티미디어학회논문지)

Volume 22 Issue 9
/
Pages.1069-1079
/
2019
/
1229-7771(pISSN)
/
2384-0102(eISSN)

Korea Multimedia Society (한국멀티미디어학회)

DOI QR Code

Improvement of PM₁₀ Forecasting Performance using Membership Function and DNN

멤버십 함수와 DNN을 이용한 PM₁₀ 예보 성능의 향상

Yu, Suk Hyun (Dept. of Information & Communication Eng., Anyang University) ;
Jeon, Young Tae (Dept. of Computer Eng., Anyang University) ;
Kwon, Hee Yong (Dept. of Computer Eng., Anyang University)

Received : 2019.07.31
Accepted : 2019.09.05
Published : 2019.09.30

https://doi.org/10.9717/kmms.2019.22.9.1069 Citation PDF KSCI HTML

Download PDF

⟨ Previous Next ⟩

Abstract

In this study, we developed a $PM_{10}$ forecasting model using DNN and Membership Function, and improved the forecasting performance. The model predicts the $PM_{10}$ concentrations of the next 3 days in the Seoul area by using the weather and air quality observation data and forecast data. The best model(RM14)'s accuracy (82%, 76%, 69%) and false alarm rate(FAR:14%,33%,44%) are good. Probability of detection (POD: 79%, 50%, 53%), however, are not good performance. These are due to the lack of training data for high concentration $PM_{10}$ compared to low concentration. In addition, the model dose not reflect seasonal factors closely related to the generation of high concentration $PM_{10}$. To improve this, we propose Julian date membership function as inputs of the $PM_{10}$ forecasting model. The function express a given date in 12 factors to reflect seasonal characteristics closely related to high concentration $PM_{10}$. As a result, the accuracy (79%, 70%, 66%) and FAR (24%, 48%, 46%) are slightly reduced in performance, but the POD (79%, 75%, 71%) are up to 25% improved compared with those of the RM14 model. Hence, this shows that the proposed Julian forecast model is effective for high concentration $PM_{10}$ forecasts.

Keywords

1. 서론

중국주요 공업도시지역에서 발생한 고농도 미세먼지가 편서풍을 타고 국내로 유입되는 상황에서 국내 대기 정체로 인해 배출된 다양한 오염원이 더해지면서 고농도 미세먼지 현상이 발생하고 있다[1]. 이러한 미세먼지는 국민 건강을 직·간접적으로 위협하고 있어서 이를 예방하기 위해서는 정확한 미세먼지 예보가 필요하다.

현재 환경부에서 운영 중인 미세먼지 예보의 지수적중률은 70%이나, 나쁨 이상의 고농도 감지확률은 이보다 낮아서 실제 시민이 느끼는 체감 오염도와많은 차이를 보이고 있다. 미세먼지 예보가 국민 건강 보호를 위한 예방적 기능을 수행하기 위해서는 예보의 정확도 개선이 시급하다. 시행중인 미세먼지 예보는 수치모델의 결과인 수치 예보 값을 중심으로 하고 있으나, 수치 모델의 입력 자료인 배출량 및 기상자료 등이 내포한 불확실성과 복잡한 대기현상을 완전하게 반영하지 못하는 수치모델의 특성으로 인하여 예보 정확도에 한계가 있다[2].

본 연구에서는 이러한 한계를 극복하기 위해서 과거의 측정 자료와 수치 예보 자료를 심층신경망 (DNN: Deep Neural Network)에 학습시켜 불완전한 수치모델 결과를 보정하고, 예보 정확도를 향상시킬 수 있는 예보 모델을 제안, 개발하였다. 심층신경망은 기존의 인공신경망(ANN: Artificial Neural Network)에서 심층학습이 가능하도록 입력층과 출력층 사이에 다수의 은닉층을 포함하도록 확장한 모델이다[3]. 심층신경망은 인공신경망과 마찬가지로 복잡한 비선형 관계의 모델링이 가능하며, 계층이 깊기 때문에 기존의 인공신경망보다 더 적은 노드들만으로도 복잡한 데이터를 모델링 할 수 있게 해준다[4]. 이러한 심층신경망의 특징은 미세먼지 농도 예측과 같이 복잡하고, 비선형적이며 방대한 자료를 대상으로 하는 문제에서 효율적이다.

이미 대기질 예보에 인공신경망의 효과는 입증되어 다양한 관련 연구가 이루어지고 있다. 관련 연구로는 인공신경망에서 가장 범용적으로 사용되는 MLP(MultiLayer Perceptron)를 이용하여 PM10과 PM2.5등으로 대표되는 대기오염 물질의 농도를 예측한 연구[5-10]와 RBF(RedialBasedFunction)를 이용하여 PM10의 농도를 예측한 연구[11], 시계열 대기질자료의 결측치를 처리하기 위해서 DRNN(Deep Re-current Neural Network)를 기반으로 시공간 예측 프레임워크를 제안한 연구[12], 대기질 예보의 성능 향상을 위해 커널 삼중대각 희소행렬을 이용해 고속으로 자료동화 수행한 연구[13] 등이 있다.

본 연구에서는 기존의 대기질 예보에 사용한 인공신경망보다 일반적으로 더 좋은 성능을 가진다고 평가되는 심층신경망을 기반으로 서울권역의 PM10 예측 농도를 생성하는 예보모델을 개발했다. 입력인자는 대기질 및 기상 측정자료와 예보자료의 6시간 평균값을 사용하였고, D+0(당일), D+1(내일), D+2(모레)까지의 PM10 농도를 6시간 단위로 생성했다. 제안한 예보모델의 성능 평가는 Table1에 제시된 통합대기환경지수(CAI: Comprehensive air-quality index)를 기준으로 한 지표(Fig.1)에 따랐다. Fig. 1에서 기술한 지수적중률(Accuracy)은 예보모델의 모든 지수 구간의 적중률을 평가하고, 감지확률(POD: Probability of Detection)은 고농도의 감지정도를 평

가하고, 오경보율(FAR:FalseAlarmRate)은 고농도 예보의 정확성을 나타내는 지표로 측정 값이 저농도 구간에 속하는데 고농도 예보를 한 경우에 해당된다.

이어지는 2장에는 제안한 예보모델의 네트워크 구조와 입력인자에 대해 설명하고, 이를 기반으로 개발된 ORIM,RM14 모델들을 소개한다. 3장에서는 고농도 예보 성능을 향상시키기 위해 날짜인자를 학습에 추가한 Cos 예보모델과 이를 개선한 S_Cos 예보모델, 제안한 멤버십 함수를 이용하여 날짜 인자를 추가한 Julian 예보 모델에 대해 설명한다. 4장에서는 개발된 예보모델들의 성능을 평가한 실험결과를 제시하고 5장에서는 결론 및 향후계획을 기술한다.

Table. 1 PM10 index section

MTMDCW_2019_v22n9_1069_f0001.png 이미지

Fig. 1. Items and methods for evaluating the performance of the forecast model.

MTMDCW_2019_v22n9_1069_f0002.png 이미지

Fig. 2. Time unit concept of forecast model.

2. 심층신경망을 이용한 PM10 예보모델

2.1 입력인자와 DNN 예보모델

제안한 DNN 예보 모델은 주어진 자료들의 6시간 평균값을 입력으로 하여 서울 권역의 당일(D+0), 내일(D+1), 모레(D+2) 구간의 PM10 농도를 6시간 단위로 예측한다. 예보 모델에 사용한 자료들은 대기질 및 기상 측정자료와 예보자료이며 상세한 내용은 Table 2에 기술했다.

Table 2. Input Data

MTMDCW_2019_v22n9_1069_t0002.png 이미지

Table2에 제시된 인자들을 보면 각각 서로 다른 범위의 값을 가짐을 알 수 있다. 이러한 값을 그대로 입력 자료로 사용하면 값의 극심한 차이로 인해 모델의 성능이 저하되므로 이를 방지하기 위해서 데이터를 정규화 하는 전처리 작업이 필요하다. 식 (1) & sim;식(4)에 정규화 방법을 기술했다. 기술한 정규화 수식에서 는 i번째 인자이고, 는 i번째 인자의 최대값, 는 i번째 인자의 최소값이다. 정규화는 우선 입력인자가 최대값을 초과하거나 최소값 미만이면 각각 최대값 혹은 최소값으로 대체하고, 그 외의 경우는 주어진 수식에 의해 모두 일정한 범위의 값이되도록 한다.

$x_{i}>\operatorname{Max}_{i}, \text { normal }\left(x_{i}\right)=\operatorname{Max}_{i}$ (1)

$x_{i}<\operatorname{Mn}_{i}, \text { normal }\left(x_{i}\right)=\operatorname{Min}_{i}$ (2)

$\operatorname{Min}_{i}>0, \text { normal }\left(x_{i}\right)=\frac{x_{i}-M n_{i}}{M a x_{i}-M n_{i}}$ (3)

$\operatorname{Mn}_{i}<0, \text { normal }\left(x_{i}\right)=\frac{x_{i}}{\operatorname{Max}_{i}-\left|\operatorname{Min}_{i}\right|}$ (4)

이렇게 정규화를 수행한 자료들을 입력으로 하여 심층 신경망을 학습시키고,6시간 단위의 PM10 예보값을 생성한다. 예보 시간 프레임을 아래의 Fig. 2와 Table 3에 나타냈다. 여기서 각 T는 6시간 단위로 구성되어 있고,15시에 예보를 시행하는 모델이므로 T1∼ T5는 과거에 해당하는 구간이고, T6∼ T15는 미래에 해당하는 구간으로 PM10 예보 농도를 생성해야 하는 구간이다. 이 중 T6∼T7은 D+0에 해당하고, T8∼ T11은 D+1,T12∼T15는 D+2에 해당한다.

DNN 예보 모델은 위에서 기술한 6시간 단위의 예보 값을 생성하기 위해 예보 구간(T6∼ T15)별로 총 10개의 개별 네트워크 구성했다.Fig.3에 나타낸네트워크는 1개의 입력층과 다수의 은닉층,1개의 출력층을 가진다. 네트워크 구성은 예보 모델별로 상이하나, 입력층은 기본적으로 대기질 및 기상 측정자료와 예보자료를 입력한다. 은닉층의 노드수는 입력층에 따라 결정되고, 출력층의 노드는 1개이며 해당 시간 구간의 PM10 측정값을 목표로 학습한다. 모델별입력 인자 및 네트워크 구성의 차이는 다음절에서 자세히 기술한다.

Table 3. Time frame of 15 hour forecast model

MTMDCW_2019_v22n9_1069_t0003.png 이미지

제안한 DNN 모델의 학습은 비용함수를 정의하고, 경사 하강법을 사용하여 가중치 및 파라메타들을 조정하여 비용을 최적화하는 과정을 거친다. 비용함수란 예측 값과 목표 값과의 차이를 계산하는 역할을 하며, 이를 통해 신경망의 파라메타들을 얼마나 조정할 것인지 결정하게 된다. 아래의 수식에 학습에 사용한 MSE(MeanSquareError) 비용함수를 기술했다.

$\mathrm{MSE}=\frac{1}{n} \sum_{i=1}^{n}\left(Y_{i}-\hat{Y}_{i}\right)^{2}$ (5)

본 연구에서는 지금까지 기술한 DNN 모델을 기반으로 먼저 2개의 예보 모델을 개발했다. 첫째는 과거 30시간의 측정 자료와 예보 자료를 입력으로 하는 ORIM, 두 번째는 과거 6시간의 측정 자료와 예보자료를 입력으로 하는 RM14이다. 이어지는 절에서 각 모델별 특징을 설명한다.

MTMDCW_2019_v22n9_1069_f0003.png 이미지

Fig. 3. Proposed DNN architecture.

2.2 ORIM 예보 모델

ORIM 예보 모델은 Fig.3에서 제안한 DNN 모델을 기본으로 하되, 예보 시점에서 과거구간인 T1∼ T5에 해당하는 대기질 및 기상 측정 자료와 예보 구간에 해당하는 T6∼T15의 예보 자료를 입력으로 하여 학습하고 PM10 예보 농도를 생성하는 모델이다. 현재 혹은 예보 시점의 PM10 농도는 과거의 기상 및 대기질의 영향을 받아서 생성된 결과라는 점에 의거하여 과거 30시간의 측정 자료를 사용한 것이 이 모델의 특징이다.ORIM의 인자는 T1∼T5 구간에 해당하는 과거의 측정 자료가 각각 14개씩 총 70개이고, 예보구간인 T6∼T15의 예보자료가 16개로 총 86개의 인자가 입력층에 입력되고,3개의 은닉층과 1개의 출력층을 가진 5층의 네트워크로 구성된다. 각각 Table 4와 Table5에 ORIM의 입력인자와 네트워크 파라메타를 상세히 기술했다.

Table 4. Input Data of ORIM

MTMDCW_2019_v22n9_1069_t0004.png 이미지

Table 5. Network parameter of ORIM

MTMDCW_2019_v22n9_1069_t0005.png 이미지

2.3 RM14 예보 모델

RM14 예보 모델은 ORIM과 마찬가지로 과거의 대기질 및 기상측정 자료와 예보자료를 사용하되, ORIM과 다른 점은 과거 30시간의 측정 자료가 아니라 과거 6시간에 해당하는 T5의 측정 자료만 학습에 사용한다는 점이다.RM14 모델의 인자는 T5의 측정자료 14개와 예보구간의 예보 자료 16개로 총 30개의 인자가 입력층에 입력되고,4개의 은닉층과 1개의 출력층을 갖는 6층의 네트워크로 구성된다. 각각 Table 6와 Table7에 RM14의 입력인자와 네트워크 파라메타를 상세히 기술했다.

Table 6. Input Data of RM14

MTMDCW_2019_v22n9_1069_t0006.png 이미지

Table 7. Network parameter of RM14

MTMDCW_2019_v22n9_1069_t0007.png 이미지

3. 제안한 멤버십 함수를 이용한 예보모델

3.1 관련연구

예보 모델의 성능을 평가하는데 4개의 농도 구간의 지수를 맞추는 지수적중률과 더불어 고농도를 감지하는 성능은 중요한 요소이다. 고농도의 발생 요인에는 여러 가지가 있지만, 계절적 특성은 가장 상관도가 높은 요인 중 하나이고, 계절을 반영하기에 가장 명확한 요소는 날짜이다. 따라서, 날짜를 입력인자로 추가하면 고농도 예보 성능 향상에 기여할 수 있다. 하지만, 날짜 자료를 전처리 없이 그대로 사용하면 계절 특성이 왜곡되어 반영될 수 있다. 예를 들어, 12월과 1월을 거의 유사한 특성을 가짐에도 수의 정량적 차이로 인해 완전히 다른 자료로 입력된다.

이를 위해 계절적 특성이 정확히 반영될 수 있도록적절히 날짜를 가공하여야 한다. 이와 관련된 연구는 날짜에 코사인 함수를 적용하여 날짜를 하나의 값으로 표현한 방법[14]이 있는데, 이 방법을 이용하면겨울에는 최대 값을 갖고, 여름에는 최소 값을 갖게 된다. 이는 일반적으로 여름으로 갈수록 고농도의 출현이 희소하고, 겨울로 갈수록 고농도의 출현이 빈번한 계절적 특성이 표현된다. 수식 (6)과 Fig.4에 Cos함수를 나타냈다. 수식 (6)에서 dth는 서수(ordinal number)를 나타내고,T는 년 중 일수를 의미한다.

수식 (6)에 의하면 날짜는 -1에서 1 사이의 값으로 표현되고, 대략의 고농도의 계절적 특성을 반영하게 된다. 하지만, 보통 겨울부터 봄철까지 점점 고농도의 정도가 심해지고, 여름부터 가을까지 저농도를 유지하는 현상을 Cos 함수만으로는 반영할 수 없다.

본 연구에서는 이런 계절적 특성을 반영하기 위해서Cos 함수를 75일 시프트 시킨 S_Cos 함수를 제안했고, 이를 수식 (7)과 Fig.5에 나타냈다.

$D O Y=\cos \left(2 \pi d_{t h} / T\right)$ (6)

$S D O Y=\cos \left(2 \pi\left(d_{t h}+75\right) / T\right)$ (7)

MTMDCW_2019_v22n9_1069_f0004.png 이미지

Fig. 4. Cos function.

MTMDCW_2019_v22n9_1069_f0005.png 이미지

Fig. 5. S_Cos function.

3.2 Julian 멤버십 함수

본 연구에서는 3.1절에서 소개한 관련연구와 마찬가지로 감지확률을 높이기 위해 계절 특성이 반영되는 날짜 데이터를 학습 인자로 입력했다.Cos와 그를개선한 S_Cos은 날짜 데이터를 하나의 수치 값으로 표현하나, 제안한 방법은 날짜 및 계절이 연속성을 갖는 특성에 의거하여 날짜 데이터를 1월에서 12월을 대표하는 12개의 연속적인 인자로 표현하는데, 이를 위해서 줄리안 멤버십 함수를 제안했다.

멤버십 함수는 퍼지이론에서 나오는 개념으로 퍼지집합에 속하는 정도를 정의한 함수이다. 제안한 줄리안 멤버십 함수(Julianmembershipfunction)는 날짜를 표현하는데 1월부터 12월에 해당하는 12개의 인자를 사용한다. 이 12개의 인자 중 2개만이 활성화되고, 나머지 10개의 인자는 0으로 설정한다. 활성화되는 2개의 인자는 각각 주어진 날짜의 월(Month)과 인접 월(Adjacent_Month)의 값을 표현한다. 예를 들어, 주어진 날짜가 4월 20일 이라면 제안한 줄리안멤버십 함수에 의해서 인접 월(Adjacent_Month)은 5, 해당 월의 값(Month_value)는 0.8, 인접 월의 값(Adjacent_Month_value)는 0.2가 되어 날짜를 나타내는 12개 인자는 0,0,0,0.8, 0.2,0,0,0,0,0,0,0가 된다. 이 인자들의 의미는 주어진 날짜(4월 20일)

가 4월에 해당되는 날짜이지만,5월에 인접해있는 날짜이므로, 4월에 해당하는 4번째 인자는 0.8, 5월에 해당하는 5번째 인자는 0.2로 설정하여 날짜의 연속성을 표현한 것이다. 인접 월(Adjacent_Month)의 정의와 인접 월의 값(Adjacent_Month_Value), 해당 월의 값(Month_Value)을 계산하는 과정은 Fig.6에 기술하고, 줄리안 멤버십 함수는 Fig.7에 나타냈다.

MTMDCW_2019_v22n9_1069_f0006.png 이미지

Fig. 6. Definition of Month and Adjacent Month.

MTMDCW_2019_v22n9_1069_f0007.png 이미지

Fig. 7. Julian membership function.

3.3 날짜를 적용한 예보 모델들

Cos,S_Cos,Julian 예보 모델은 RM14 모델을 기반으로 하되, 고농도의 감지확률을 향상시키기 위해서 고농도 자료와 상관도가 높은 날짜 데이터를 각각의 방법에 의해 표현하여 학습 인자로 추가한 모델이다. Cos과 S_Cos 예보모델은 날짜 인자를 1개의 값으로 표현하고,Julian 예보모델은 12개의 연속된 인자로 표현한다.

날짜 인자를 추가한 3 개의 모델 모두 RM14를 기반으로 하므로 Cos과 S_COS 예보모델은 T5의 측정자료 14개와 예보구간의 예보 자료 16개를 사용하고, 거기에 1개의 날짜 인자가 추가되어 총 31개의 인자가 입력되고,Julian 예보모델은 12개의 날짜인자가 추가되어 42개의 입력인자를 갖는다. 각각 Table 8와Table 9에 Cos,S_Cos,Julian 예보모델의 입력인자와 네트워크 파라메타를 상세히 기술했다.

4. 실험 결과 및 고찰

4.1 실험환경 및 실험 데이터

본 연구에서 개발한 5개의 예보모델과 평가 및 분석 프로그램은 windows10 기반의 visualc++2010을 사용하여 구현했으며, 실험에 사용한 데이터는 2015년 01월 01일부터 2017년 12월 31일까지의 서울권역 6시간 평균 데이터로 예보대상 물질은 PM10다. 이 중 학습에 2015년 01월 01일부터 2016년 12월 31일까지의 자료를 사용하고, 평가에는 2018년 01월 01일부터 2018년 12월 31일까지의 데이터를 이용했다. 각 DNN 예보모델에 사용한 인자는 상이하나, 과거의 대기질 및 기상 측정 자료와 예보구간의 대기질 및 기상 예보자료를 사용했다. 각 예보모델별로 사용한 인자는 2장과 3장에서 상세히 기술했다.

4.2 실험 결과

Table10과 Fig.8에 5개의 DNN 예보모델과 수치예보모델(CASE4)의 예보 결과를 일별로 나타냈다. 예보 성능은 지수적중률(Accuracy), 감지확률(POD), 오경보율(FAR)로 평가했는데, 모델에 따라 일별, 평가지표별로 좋고 나쁨의 성능 차이가 있으나, 예보에서 가장 중요한 구간인 D+1과 감지확률의 우수성 등을 종합적으로 판단했을 때,Julian 예보 모델이 가장 우수한 결과를 보였다.

ORIM은 D+0 구간에서는 지수적중률 76%, 감지확률 83%, 오경보율 26%로 우수한 결과를 보이나, D+1과 D+2 구간에서는 지수적중률과 감지확률이 60%대로 크게 떨어지고, 오경보율이 60% 이상으로크게 증가한다. 이것은 지나치게 긴 구간의 과거 측정 자료를 학습에 포함함으로써 오히려 예보 성능을 저하시킨 요인으로 분석된다.

RM14는 이를 개선하기 위해서 ORIM 모델에서 과거 30시간의 측정 자료를 사용한 것을 축소하여 과거 6 시간의 측정 자료만 학습에 포함시켰다. 그 결과 RM14 모델은 지수적중률과 오경보율이 ORIM에 비해 개선되었다. 하지만, 감지확률이 79%, 50%, 53%로 좋은 성능을 보이지 못했다.

감지확률을 개선하기 위해 날짜인자를 추가한 예보모델은 Cos,S_Cos,Julian 모델로 Cos는 3장의 관련 연구에서 소개한 방법을 적용한 예보모델이고, S_Cos은 Cos 함수를 고농도 발생 추이에 좀 더 적합하도록 개선한 방법이다.Cos는 RM14 대비 지수적중률은 -2%이내로 비슷하고, 오경보율은 D+2 구간에서 오히려 12% 증가했으며, 감지확률은 D+1 구간에서 63%로 13% 개선된 결과를 보인다. 이는 고농도 감지의 기대치가 70%이상 이라는 기준으로 볼 때목표에 도달하지 못한 결과이다.S_Cos는 Cos과 비교해 보면 지수적중률 ±4% 이내, 오경보율 ±5% 이내로 비슷하고, 감지확률이 D+2 구간에서 11% 향상되었다. Julian 예보 모델은 지수적중률이 79%, 70%, 66%로 S_Cos보다 3% 이내로 떨어지나 감지확률이전 구간 70%대로 크게 향상되고, 오경보율도 전 구간 50% 이내로 기대치에 근접한 결과를 보였다. 또한, 수치모델인 CASE4와 비교했을 때도 지수적중률은 다소 떨어지나, 감지확률 및 오경보율이 우수하다. 이는 고농도와 상관도가 높은 날짜 데이터를 표현하는데 있어 제안한 줄리안 멤버십 함수가 효과적이고, 이를 적용한 Julian 예보모델이 고농도 감지에 적합한 모델임을 증명할 수 있는 결과이다.

Table 8. Input Data of Cos, S_Cos and Julian

MTMDCW_2019_v22n9_1069_t0008.png 이미지

Table 9. Network parameter of Cos, S_Cos and Julian

MTMDCW_2019_v22n9_1069_t0009.png 이미지

Table 10. PM10 prediction result for Seoul by DNN models

MTMDCW_2019_v22n9_1069_t0010.png 이미지

MTMDCW_2019_v22n9_1069_f0008.png 이미지

Fig. 8. PM10 prediction result for Seoul by DNN models.

5. 결론

본 논문에서는 서울 권역의 PM10 예보를 위해서 DNN을 기반으로 한 5가지 예보 모델을 개발했다. ORIM는 과거의 30시간 동안의 측정데이터와 예보구간의 예보 데이터를 사용한 모델로 D+0의 예보 성능은 우수하나, 하루를 초과하는 과거 데이터를 사용함으로 인해 D+1 이상 구간의 성능이 떨어지고, 특히 오경보율이 증가하는 문제점을 보였다. 이 문제를 해결하기 위해서 RM14 모델에서는 과거 6시간의 측정 데 이터만 사용했다. 그 결과 지수적중률과 오경보율이 개선되었으나 감지확률은 D+1이상의 구간에서 50%대로 기대치에 미치지 못했다. 이것은 학습데이터에 고농도를 감지하는 인자가 미비하여 발생하는 현상으로 이를 개선하기 위해 고농도의 발생과 밀접한 영향을 미치는 날짜 인자를 추가하여 Cos, S_Cos, Julian 모델을 개발했다.Cos과 S_Cos는 기본적으로날짜 데이터를 cos 함수 값으로 표현한 방법으로 RM14와 비교해 볼 때, 지수적중률은 비슷하고, S_Cos의 경우 감지확률이 좀 더 개선되었다. 하지만 여전히 예보에서 가장 중요한 구간인 D+1에서 60%대의 감지확률을 보였다.Julian 예보모델은 날짜를 표현하는데 제안한 줄리안 멤버십 함수를 사용해서 12개의 인자로 나타낸 모델로 S_Cos과 비교하면 지수적중률은 -3% 이내로 비슷하지만, 감지확률은 전예보구간이 70%대로 최대 18% 성능이 향상되었으며, 오경보율도 전 구간 50% 이내로 기대치에 부합하는 결과를 보였다.

고농도의 농도와 일수가 점점 증가하는 현 대기상황으로 볼 때, 미세먼지 예보에 있어서 가장 중요한 성능은 고농도를 잘 감지하는 것으로 제안한 Julian 예보모델은 이러한 요구에 충족하여 예보 모델로써 활용도가 높을 것으로 사료된다.

향후 과제로는 고농도 감지에 효율적인 학습인자의 추가 선별과 예보 성능 향상을 위해서 주변 권역의 자료를 이용하는 연구를 진행할 예정이다.

References

NIER, A Study of Data Accuracy Improvement for National Air Quality Forecasting(III), NIER-RP2016-248, 11-1480523-002809-01, 2016.
NIER, A Study of Construction of Air Quality Forecasting System using Artificial Intelligence(I) , NIER-SP2017-148, 11-1480523-000 3221-01, 2017.
Y. Bengio, A. Courville, and P. Vincent, "Representation Learning: A Review and New Perspectives," IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 35, Issue 8, pp. 1798-1828, 2013. https://doi.org/10.1109/TPAMI.2013.50
J. Schmidhuber, "Deep Learning in Neural Networks: An Overview," Neural Network, Vol. 61, Issue C, pp. 85-117, 2015. https://doi.org/10.1016/j.neunet.2014.09.003
G. Grivas and A. Chaloulakou, "Artificial Neural Network Models for Prediction of PM10 Hourly Concentrations, in The Greater Area of Athens, Greece," Atmospheric Environment, Vol. 40, No. 7, pp. 1216-1229, 2006. https://doi.org/10.1016/j.atmosenv.2005.10.036
A.B. Chelani, D.G. Gajghate, and M.Z. Hasan, "Prediction of Ambient PM10 and Toxic Metals using Artificial Neural Networks," Journal of the Air and Waste Management Association, Vol. 52, No. 7, pp. 805-810, 2002. https://doi.org/10.1080/10473289.2002.10470827
I.G. McKendry, "Evaluation of Artificial Neural Networks for Fine Particulate Pollution (PM10 and PM2.5) Forecasting," Journal of the Air and Waste Management Association, Vol. 52, No. 9, pp. 1096-1101, 2002. https://doi.org/10.1080/10473289.2002.10470836
A. Chaloulakou, G. Grivas, and N. Spyrellis, "Neural Network and Multiple Regression Models for PM10 Prediction in Athens: A Comparative Assessment," Journal of the Air and Waste Management Association, Vol. 53, No. 10, pp. 1183-1190, 2003. https://doi.org/10.1080/10473289.2003.10466276
G. Corani, "Air Quality Prediction in Milan: Feed-Forward Neural Networks, Pruned Neural Networks and Lazy Learning," Ecological Modelling, Vol. 185, Issue 2-4, pp. 513-529, 2005. https://doi.org/10.1016/j.ecolmodel.2005.01.008
M. Cai, Y. Yin, and M. Xie, "Prediction of Hourly Air Pollutant Concentrations Near Urban Arterials using Artificial Neural Network Approach," Transportation Research Part D: Transport and Environment, Vol. 14, No. 1, pp. 32-41, 2009. https://doi.org/10.1016/j.trd.2008.10.004
W. Lu, W. Wang, X. Wang, S. Yan, and J.C. Lam, "Potential Assessment of A Neural Network Model with PCA/RBF Approach for Forecasting Pollutant Trends in Mong Kok Urban Air, Hong Kong," Environmental Research, Vol. 96, No. 1, pp. 79-87, 2004. https://doi.org/10.1016/j.envres.2003.11.003
J. Fan, Q. Li, J. Hou, X. Feng, H. Karimian, and S. Lin, "A Spatiotemporal Prediction Framework for Air Pollution Based on Deep RNN," Proceeding of ISPRS Annals of the Photogrammetry, Remote Sensing and Spatial Information Sciences, Volume IV-4/W2, 2017 2nd International Symposium on Spatiotemporal Computing, pp. 15-22, 2017.
H. Bae, S. Yu, and H. Kwon, "Fast Data Assimilation using Kernel Tridiagonal Sparse Matrix for Performance Improvement of Air Quality Forecasting," Journal of Korea Multimedia Society, Vol. 20, No. 2, pp. 363-370, 2017. https://doi.org/10.9717/kmms.2017.20.2.363
X. Feng, Q. Li, J. Hou, L. Jin and J. Wang, "Artificial Neural Networks Forecasting of PM2.5 Pollution Using Air Mass Trajectory Based Geographic Model and Wavelet Transformation," Atmospheric Environment, Vol. 107, pp. 118-128, 2015. https://doi.org/10.1016/j.atmosenv.2015.02.030

Cited by

신경망의 계층 연관성 전파를 이용한 DNN 예보모델의 입력인자 분석 vol.24, pp.8, 2019, https://doi.org/10.9717/kmms.2021.24.8.1122

Journal of Korea Multimedia Society (한국멀티미디어학회논문지)

Improvement of PM10 Forecasting Performance using Membership Function and DNN

멤버십 함수와 DNN을 이용한 PM10 예보 성능의 향상

Abstract

Keywords

1. 서론

2. 심층신경망을 이용한 PM10 예보모델

2.1 입력인자와 DNN 예보모델

2.2 ORIM 예보 모델

2.3 RM14 예보 모델

3. 제안한 멤버십 함수를 이용한 예보모델

3.1 관련연구

3.2 Julian 멤버십 함수

3.3 날짜를 적용한 예보 모델들

4. 실험 결과 및 고찰

4.1 실험환경 및 실험 데이터

4.2 실험 결과

5. 결론

References

Cited by

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)

Improvement of PM₁₀ Forecasting Performance using Membership Function and DNN

멤버십 함수와 DNN을 이용한 PM₁₀ 예보 성능의 향상