DOI QR코드

DOI QR Code

Design of Precipitation/non-precipitation Pattern Classification System based on Neuro-fuzzy Algorithm using Meteorological Radar Data : Instance Classifier and Echo Classifier

기상레이더를 이용한 뉴로-퍼지 알고리즘 기반 강수/비강수 패턴분류 시스템 설계 : 사례 분류기 및 에코 분류기

  • Ko, Jun-Hyun (Dept. of Electrical Engineering, The University of Suwon) ;
  • Kim, Hyun-Ki (Dept. of Electrical Engineering, The University of Suwon) ;
  • Oh, Sung-Kwun (Dept. of Electrical Engineering, The University of Suwon)
  • Received : 2014.11.05
  • Accepted : 2015.06.15
  • Published : 2015.07.01

Abstract

In this paper, precipitation / non-precipitation pattern classification of meteorological radar data is conducted by using neuro-fuzzy algorithm. Structure expression of meteorological radar data information is analyzed in order to effectively classify precipitation and non-precipitation. Also diverse input variables for designing pattern classifier could be considered by exploiting the quantitative as well as qualitative characteristic of meteorological radar data information and then each characteristic of input variables is analyzed. Preferred pattern classifier can be designed by essential input variables that give a decisive effect on output performance as well as model architecture. As the proposed model architecture, neuro-fuzzy algorithm is designed by using FCM-based radial basis function neural network(RBFNN). Two parts of classifiers such as instance classifier part and echo classifier part are designed and carried out serially in the entire system architecture. In the instance classifier part, the pattern classifier identifies between precipitation and non-precipitation data. In the echo classifier part, because precipitation data information identified by the instance classifier could partially involve non-precipitation data information, echo classifier is considered to classify between them. The performance of the proposed classifier is evaluated and analyzed when compared with existing QC method.

Keywords

1. 서 론

지구온난화로 야기된 기후변화는 재해기상 및 극한기후의 빈번한 발생으로 사회·경제적으로 영향을 불러오고 있다. 1998년~2007년 동안 기상재해에 따른 경제적 손실액은 약 48조원으로 10년간 GDP 약 8000조원의 0.6%에 해당한다(소방방재청, 통계청). 또한 2011년 집중호우 빈도수는 133회로 연평균 60회의 1980년대와 비교해 큰 폭으로 증가했다. 이로 인하여 기상학계는 재해기상 및 기후변화 관련 국가적 이슈에 학술적·정책적 공동 대응 및 협력방안이 필요하다는 의견이 제기되고 있으며, 여러 기상모델에 입력 자료로 사용되고 있는 레이더 관측 데이터의 중요성도 증가하고 있다. 하지만 현재 기상레이더에서 생성된 레이더 관측 데이터는 Fig 1.과 같이 강수 에코와 비강수 에코가 혼재되어 있으며, 비강수 에코가 존재하여 관측의 정확도를 저하시키는 문제가 있다[1]. 레이더 에코란 기상레이더의 안테나에서 발사한 전파가 멀리 있는 강수입자 등에 부딪히면 산란·반사 등이 발생하여 그 전파의 일부분이 안테나 방향으로 되돌아오는데, 이 때 되돌아오는 수신 전력을 레이더 에코라고 한다. 레이더 영상에 나타나는 에코는 강수입자를 나타내는 강수 에코와 기상관측에 방해가 되는 비강수 에코로 구별된다. 비강수 에코는 지형 에코(Ground echo), AP 에코, 파랑(Sea-Clutter) 에코, 청천 (Clear) 에코, 채프 에코, 태양섬광 에코, 레이더간섭 에코 등 다양하게 나타나고 있으며, 본 연구에서는 비강수 에코 중 많은 부분을 차지하고 있는 지형 에코, AP 에코, 파랑 에코, 청천 에코의 분류를 시행한다. 지형 에코는 지형물 등에 의하여 레이더 빔의 일부 또는 전체가 반사되거나 산란되어 나타나는 에코이며, 청천 에코는 강수는 발생하지 않지만 대기 중의 곤충이나 작은 부유입자, 난류 등에 의해 레이더 파가 반사되어 발생되는 에코이고, 대기굴절에 의해 레이더 파가 지면에 맞고 오는 AP 에코와 해상에 맞고 돌아오는 파랑 에코 등이 존재한다. 강수 사례에는 위에서 언급한 강수 에코와 비강수 에코가 혼재되어 레이더 영상에 나타나며, 비강수 사례에는 비강수 에코가 레이더 영상에 나타난다. 이러한 비강수 에코의 존재로 인하여 관측의 정확도를 저하시키는 문제가 발생한다. 본 연구에서는 강수 에코와 비강코수 에의 각 특성을 파악하고, 기상레이더를 통해 나온 기상 레이더 관측 데이터를 전처리하여 사례 분류기 및 에코 분류기의 입력데이터로 사용한다. 또한 뉴로-퍼지 알고리즘을 이용하여 사례 분류기와 에코 분류기가 연속적으로 동작하는 시스템을 설계하였다. 사례 분류기는 확인된 기상레이더 자료 정보가 비강수 사례라면 레이더 영상에서 전체 에코들을 제거한다. 반대로 사례 분류기를 통해 확인된 기상레이더 자료 정보가 강수 사례라면 에코 분류기로 레이더 영상에서 강수 에코는 나타내며 비강수 에코는 제거한다. 사례 분류기 및 에코 분류기는 뉴로-퍼지 알고리즘인 FCM 기반 Radial Basis Function Neural Networks(RBFNN)를 이용한 패턴분류기를 사용하였으며, RBFNN의 가장 좋은 성능의 파라미터를 설정하기 위하여 Particle Swarm Optimization을 이용하였다. 본 논문은 다음과 같은 구성으로 이루어져 있다. 먼저 2장에서는 기상레이더 관측 데이터의 구조와 특성분석, 그리고 사례 분류기와 에코 분류기에 사용 될 입력데이터의 구성에 대하여 설명한다. 3장에서는 제안된 뉴로-퍼지 알고리즘인 RBFNN의 구조에 대하여 설명하며, 4장에서는 RBFNN의 파라미터를 설정하기 위한 최적화 알고리즘인 PSO에 대해 설명한다. 5장에서는 전반적인 시스템의 구조에 대해 설명하며, 6장에서는 여러 테스트 데이터를 사례 분류기 및 에코 분류기에 적용하고, 그 성능에 대하여 검증한다. 마지막으로 7장에서는 연구에 대한 결론을 서술하였다.

그림 1강수와 비강수의 SDZ 비교 그래프 Fig. 1 Graph for Comparison of SDZ of PRE and N-PRE

 

2. 기상레이더 데이터를 이용한 특성분석

기상레이더 관측 데이터는 방대한 양의 데이터를 가지고 있기 때문에 뉴로-퍼지 알고리즘에 사용하기 위해선 데이터의 전처리가 필요하다. 데이터의 전처리를 위해 먼저 데이터의 구조를 이해하고, 강수/비강수 데이터 정보에 대한 특성분석을 수행하였다. 특성분석을 통해 강수/비강수 사례 분류기 및 에코 분류기에 사용 될 입력변수를 생성하여 입력데이터를 구축하였으며, 이 입력데이터를 이용하여 사례 분류기 및 에코 분류기에 적용시켰다.

2.1 기상레이더 데이터인 UF 데이터의 구조분석

Radar는 ‘Radio Detection And Ranging’의 약자로 전자기파를 이용하여 어떤 물체를 감지하고 그 물체가 관측자로부터 어떤 상대적인 위치에 있는가를 분석해내는 일종의 원격탐사 장비이다. 이러한 기상레이더에 의한 데이터는 다른 어떤 관측수단으로 제공하기 힘든 실제적인 데이터를 제공하는 원천이 되고 있다. 기상레이더 데이터는 Radar site에서 관측되는 데이터를 바이너리(binary)형태 자료로 저장한 데이터를 말한다. 저장되는 형태는 고도(sweep), 방위(ray), 레이더 반경(bin)의 3차원 좌표로 구성되어 있으며, 각 좌표에 해당하는 필터링 후 반사도(CZ), 필터링 후 시선속도(VR), 필터링 후 스펙트럼 폭(SW), 필터링 전 반사도 (DZ)가 저장된다. 저장되는 반사도는 dBZ(decibel Z)라는 단위를 사용하는데, 이는 반사도 인자의 대수(logarithm)이다[2].

즉, 1mm6/m3에 대한 비 값을 대수로 나타낸 것을 의미한다. 예를 들면, 단위부피 1m3안에 직경 1mm인 물방울이 한 개 있으면 0[dBZ], 10개 있으면 10[dBZ], 100개 있으면 20[dBZ], 1000개 있으면 30[dBZ]가 되는 것이다. 또한 Z는 레이더 방정식을 이용하여 다음과 같이 식 (2)로 계산될 수 있다. 즉,

여기서, 는 평균 반사전력 (Watt), pt는 최대 송신 출력(Watt), G는 안테나 이득 (무 차원), λ는 레이더 파장 (m), θ3dB는 안테나 빔 출력 반치 폭(radian), h는 펄스 지속시간 (펄스폭)(sec), c는 전자기파의 전파속도, 상수(빛의 속도)는 3×108msec−1, γ는 레이더와 목표물간의 거리 (m), Z는 레이더 반사도 인자, K는 복소 굴절율(일반적으로 |K|2 값은 물일 경우 0.93, 얼음일 경우 0.2로 취해진다.), Z는 레이더 반사도 인자를 의미한다[3][4].

2.2 기상레이더 데이터를 가공한 입력변수의 특성분석

기상레이더 데이터는 10분에 하나의 파일이 존재하며, 10분마다 데이터를 산출할 수 있다. 기상레이더 데이터의 파일명은 “RDR_SSS_YYYYMMDDHHNN”의 형식으로 되어있으며, 여기서 SSS는 레이더가 설치 된 장소, YYYY는 연도, MM은 월, DD는 일, HH는 시각, NN은 분을 나타내며, 한 파일 속에는 해당 시각의 고도, 방위, 레이더 반경의 극좌표(ray, bin)에 대한 CZ, VR, SW, DZ가 기록된다. 또한 데이터에는 131072라는 Null값이 존재하며 이는 쓰레기 값을 나타낸다. 만약 어느 좌표 DZ에 131072 값이 있다면 에코가 존재하지 않는다는 의미이다. 기상레이더 데이터는 CZ, VR, SW, DZ로 구성되어 있지만 필터링 전 정보와 필터링 후 정보인 CZ와 DZ만을 사용하였다. VR과 SW는 필터링 전 정보가 없기 때문에 강수에코와 비강수에코를 비교할 수가 없어 제외하였다. 또한 CZ는 DZ와 비교했을 때 반사도 값이 작아지는 현상을 보여 참조용으로 사용하였다. 또한 이전 연구과제에서는 DZ만을 사용하여 소속변수로 DZ, 반사도의 표준편차(SDZ), 연직기울기(VGZ), 변곡점의 변화율(SPN)을 사용하였지만 본 연구과제에서는 뉴로-퍼지 알고리즘 적용 시 반사도의 빈도수(FR)를 추가하여 총 5가지 소속변수를 뉴로-퍼지 알고리즘에 입력시켰다. 또한 실험에 사용될 오성산 레이더의 강수와 비강수에 대한 SDZ, VGZ, SPN, FR의 도수분포를 분석하였다.

표 1에코 특성분석을 위한 강수 및 비강수의 유형 선택 Table 1 Pattern selection of PRE and Non-PRE for echo characteristic analysis

반사도의 표준편차는 주어진 고도각상으로 반사도의 산포도를 계산하는 것으로 최하층의 고도각 일 때 방위각과 레이더 반경의 좌표에 생성되는 DZ값으로 계산하며, 식 (3)과 같이 계산한다.

i는 레이더의 방위를, j는 레이더의 레이더 반경을 의미한다. 고도각을 0.5°로 맞춰 SDZ를 구한 이유는 필터링 되기 전 DZ값들의 정보가 손실 되지 않기 때문이다. 본 연구에서 m과 n=3으로 중심 값에서 주변 좌표들의 표준편차를 계산한다.

강수에코에 대한 반사도 표준편차의 분포는 0 ~ 10dB 사이에 나타나며, 이상굴절(AP) 에코, 파랑 에코, 지형 에코의 경우에는 0 ~ 13dB 사이에, 청천에코는 강수에코와 마찬가지로 0 ~ 10dB 사이에 나타난다. 이상굴절 에코, 파랑 에코, 지형에코의 반사도는 공간적으로 변화가 크게 나타나지만 강수에코와 청천에코는 반사도의 변화가 다른 비강수 에코처럼 심하게 일어나지 않는다. 따라서 강수에코의 표준편차가 이상굴절 에코, 파랑 에코, 지형 에코의 표준편차보다 작게 나타난다. 청천에코와 강수 에코를 비교할 때, 청천에코의 SDZ 분포는 유사하나 1 ~ 4dB 사이에서의 빈도수는 강수에코보다 적다는 특성을 갖는다.

반사도의 연직 기울기는 두 개의 고도각에 대한 반사도의 차이를 고도각 간의 차이로 나눈 것으로 식 (4)와 같이 계산한다.

여기서 θ는 고도각을 의미하고, i는 방위, j는 레이더 반경, k는 고도를 의미한다. 식 (4)에서 나타낸 바와 같이 주어진 (i,j,k)에서의 반사도 자료를 그 보다 높은 고도에 해당하는 (i,j,k+1)에서의 반사도 자료와의 차이를 구하게 되는데 본 논문에서 두 고도각을 0.5°와 1.5°로 지정하여 두 고도각 간의 차이를 1°로 한다. 그 이유는 고도각 간의 차가 1°를 초과하게 되면 이상굴절 에코, 파랑에코나 청천에코 등 비강수 에코가 사라지는 장점이 있지만 강수에코의 정보도 유실되어 강수에코에 대해서 상관성이 떨어지는 단점이 있으며, 1°미만 일 경우 반사도의 연직 기울기가 과도하게 높아지게 되며 비강수 에코가 상당수 존재한다. 이러한 이유로 강수에코 정보가 손실되지 않고, 비강수 에코 또한 어느 정도 제거되는 1°차이를 설정하여 강수에코와 비강수 에코의 상관성을 고려하였다.

그림 2강수와 비강수의 VGZ 비교 그래프 Fig. 2 Graph for Comparison of VGZ of PRE and N-PRE

반사도의 연직경도를 살펴보면, 강수에코와 지형에코, 이상굴절 에코, 파랑에코와 청천에코는 약 −16 ~ 25dBZ/deg 사이로 분포한다. 반사도의 연직경도 계산은 레이더의 관측 고도각에 영향을 많이 받게 되는데 레이더마다 관측 고도각의 설정 값이 제각기 다르기 때문에 반사도의 연직경도는 레이더마다 다르게 나타날 수 있다. 지형에코는 레이더 빔이 지형에 의해 반사되어 형성되는 에코이므로 낮은 고도각 에서 특히 많이 나타나고 고도각이 높아질수록 지형에코의 영향은 점점 줄어들게 된다. 이상굴절에코와 파랑에코 또한 낮은 고도각에서 많이 나타나는 특성을 보이며, 고도각이 높아질수록 적어진다. 이에 반해 강수에코는 강수 시스템에 따라 차이는 있겠지만 연직적으로 분포하고 있기 때문에 비강수 에코에 비해 강수에코의 반사도의 연직경도는 낮아지게 된다.

SPN은 방위와 레이더 반경의 좌표에 생성되는 DZ값으로 전후의 변곡점의 수를 계산하며, 계산된 변곡점 개수를 백분율로 나타낸 것이다. 변곡점은 방위와 레이더 반경의 좌표의 반사도와 이웃한 (Bin을 중심으로 전후) 사이의 반사도 차이가 설정한 임계값(threshold)보다 작아야하고 부호가 반대일 경우에만 1로 카운트하고 아니면 0으로 카운트하는 조건을 따른다.

이렇게 정의된 값을 아래의 식과 같이 주어진 영역에 대해서 백분율로 계산한 것이 SPN이며, 기존 연구에서와 같이 임계값을 4dBZ로 설정하였다.

SPN의 경우 강수에코는 약 20%에 분포하고 있으며 이상굴절 에코, 파랑 에코와 청천 에코, 지형에코는 55% 이내에 분포하고있다. SPN은 앞에서 설명한 바와 같이 반사도의 부호가 얼마나 자주 바뀌며, 바뀔 때에 임계 값의 크기에 영향을 받는 변수로 반사도의 연속성을 보이는 강수에코에서 비강수 에코 보다 작게 나타난다.

그림 3강수와 비강수의 SPN 비교 그래프 Fig. 3 Graph for Comparison of SPN of PRE and N-PRE

반사도의 빈도수는 고도각이 0.5°일 때 반사도 값의 빈도수를 계산한다. 반사도는 대략 −20dBZ 에서 80dBZ까지 0.5dBZ 간격으로 설정 되어 있다.

그림 4강수와 비강수의 FR 비교 그래프 Fig. 4 Graph for Comparison of FR of PRE and N-PRE

각 반사도의 빈도수를 그래프 상으로 비교해 보았을 때, 강수 에코는 대부분 10~40 dBZ 사이에 비강수 에코보다 반사도 값의 빈도수가 높게 나타나고, 비강수 에코에는 −17~10 dBZ 사이에 강수보다 반사도 값의 빈도수가 높게 나타나는 특성을 보였다.

 

3. 사례 분류 및 에코 분류를 위한 RBFNN의 구조 및 설계

RBFNN은 일반 역전파 학습규칙을 사용하는 다층 퍼샙트론(MLP)에 비해 수렴속도가 빠르고 입력층, 1개의 은닉층, 출력층으로 구성된 네트워크로 단순하며 일반적인 NN(Neural Network) 구조에 기반을 둔다. RBFNN 구조는 언어적 해석관점에서 식 (7)과 같이 “If-then”의 퍼지 규칙으로 표현되며 퍼지추론 메커니즘에 의해 구동된다[5].

여기서 x는 입력 데이터, 는 FCM 클러스터링에 의한 i=(1, ...,c)번째 그룹의 소속 함수(membership function), fji (x)는 j=(1, ..., s)번째 출력에 대한 i번째 퍼지 규칙의 다항식이다.

RBFNN은 입력층, 은닉층, 출력층으로 구성된 기존의 신경회로망의 기본 틀을 두고 있지만 크게 기능적 구조로 그림 5와 같다. 조건부는 입력 데이터를 FCM 클러스터링을 통해 데이터의 중심점과의 거리로 소속행렬을 구한다. 결론부는 입력 데이터를 다항식으로 표현하고 추론부는 조건부의 소속행렬과 결론부에서 구한 다항식을 결합하고 최소자승법(LSE)으로 다항식의 계수를 구하여 최종 출력을 구한다[6].

그림 5방사형 기저함수 신경회로망의 전반적인 구조 Fig. 5 Overall architecture of Radial Basis Function Neural Networks.

∎ RBFNN의 조건부

FCM 클러스터링을 사용하는 RBFNN의 조건부 기능은 학습데이터의 특성 반영을 위해 입력 공간을 c개의 클러스터 수(퍼지규칙 수)만큼 분리하고 각 영역의 소속정도를 퍼지 집합으로서 출력한다. FCM 클러스터 방법은 각 데이터와 특정 클러스터 중심과의 거리에 소속 정도를 부여하고 이 소속정도에 따라 데이터를 분류하는 알고리즘이다. FCM 클러스터링은 목적함수인 식 (8)을 최소화함으로서 입력데이터의 각 클러스터에 대한 소속 값을 구한다.

여기서, c는 클러스터의 개수, N은 입력 패턴 수, m은 퍼지화 계수이다. xk는 k번째 입력 벡터이고 vi는 i번째 클러스터의 중심이다. uik는 k번째 데이터가 i번째 클러스터에 속하는 소속정도를 나타내는 0과1사이의 실수로 식(9)와 식(10)의 조건을 만족한다.

식 (8)의 ∥•∥는 식 (11)로 표현되는 가중 유클리디안 거리(weighted Euclidean distance)를 사용한다.

여기서, σj는 입력 패턴들의 j번째 입력 차원의 표준편차이다. 가중 유클리디안 거리는 데이터 크기 분포에 크게 영향을 받지않는 알맞은 거리 정보를 제공하므로 많이 사용되고 있다. n차원 유클리드 공간상의 N개의 패턴으로 구성된 입력 벡터 집합X=[x1, x2, ... , xn], xk ∈ Rn, 1 ≤ k ≤ N과 클러스터 중심 V=[v1, v2, ... , vn], vi∈Rn, 1 ≤ i ≤ C 에 대한 소속정도를 소속행렬로 표현하면 U=[uik]로 표현되고 uik와 vi는 식 (12)과 식 (13)에 의해 각각 계산된다.

∎ RBFNN의 결론부

RBFNN 구조의 결론부는 조건부에서 분리한 각 로컬 영역을 다항식 함수의 로컬 회기모델로서 표현하여 식 (7)의 “then” 이후의 규칙을 형성한다. 식 (7)의 fi (x)에서 출력 뉴런에 대한 첨자 j(=1,...,s)를 생략한 fi (x)는 식 (14)~(16)의 형태를 갖는 세가지 타입의 함수 중 하나의 형태를 갖는다. 즉, 로컬 회기 모델은 상수항, 일차식 또는 이차식으로 표현되어 진다. fi (x)가 식(14)의 상수항인 경우 FCM 클러스터링을 통한 소속 함수를 활성 함수로 사용한 RBFNN과 동일한 구조를 갖는다[7].

식 (14)~(16)의 다항식 함수들은 조건부의 소속 함수(활성 함수)에 의해 활성화 되며 각 퍼지 규칙의 로컬 회기 모델로 동작한다. 입력 공간의 차원이 매우 클 경우 식 (16)의 2차 항에 대해 입력변수들의 조합수가 증가하여 계산 량이 크게 증가하기 때문에 본 논문에서는 10차원 이상의 경우에 대해 식 (17)로 표현되는 감소된 2차 함수를 사용하여 계산 량을 줄인다.

본 논문에서 제안한 RBFNN는 기존의 식 (17)의 형태를 갖는 상수항의 연결가중치를 식 (14)~(16)형태의 1차식과 2차식으로 확장함으로서 은닉층 뉴런의 출력간의 비선형 결합으로 인해 분류기로서의 성능을 향상시킨다.

∎ RBFNN의 추론부

추론부에서는 네트워크의 최종출력을 구하게 된다. 그림 5에서 “∏”로 표기된 뉴런은 각 다항식을 의미하며, “∑”으로 표기된 뉴런에 의해 입력신호들은 합하여져 그 결과를 출력층 뉴런의 최종 출력으로 내보낸다. 이와 같은 일련 과정은 퍼지추론 과정과 같으며, 퍼지 뉴럴 네트워크와 같은 형태를 갖게 된다. 결론적으로 j(=1,...,s)번째 최종출력은 퍼지추론에 의한 식 (18)과 같이 표현된다.

규칙 후반부 다항식의 계수를 동정하기 위한 후반부 파라미터 동정은 LSE를 사용하여 후반부 파라미터 계수를 동정하였는데, LSE는 각 규칙에 파라미터를 동시에 구하는 전역학습 방법이다. 또한 패턴분류기의 성능평가를 위해 식 (19)의 패턴분류율을 이용하여 실행하였다[8].

 

4. PSO를 이용한 RBFNN의 파라미터 최적화

본 장에서는 제안한 퍼지 모델의 성능 향상에 주요한 역할을하는 중요 파라미터(입력 수, 클러스터의 수, FCM 클러스터링 방법에서의 퍼지화 계수, 그리고 규칙 후반부 다항식의 형태)를 최적화하기 위하여 접목된 입자 군집 최적화(Particle Swarm Optimization : PSO) 알고리즘에 대하여 기술한다. PSO는 자연 선택의 진화 메커니즘이 아닌 새떼와 물고기 떼와 같은 생체군집의 사회적 행동약식을 바탕으로 하고 있다. PSO 역시 군집기반 알고리즘으로 병렬처리 특징을 가지며, 군집과 개체는 Swarm과 Particle로 표현된다. PSO의 각 Particle의 최적의 해를 얻기 위해 다차원 탐색공간을 날아다니며, 그들 자신과 이들 이웃의 경험에 대한 정보를 이용하여 최적의 위치로 이동해 간다. PSO는 이론의 간결성, 구현의 용이성, 연산의 효율성과 같은 특징을 보인다. 짧은 계산시간 안에 최적의 해를 생성 할 수 있고, 다른 확률적 방법보다 안정적인 수렴특징을 나타낸다.

그림 6PSO를 이용한 최적 FCM 기반 RBFNN의 선택흐름도 Fig. 6 Flow chart for selection of optimized FCM-based RBFNN using PSO

PSO에서 swarm은 n개의 particle을 가지며 이들은 주어진 문제의 해가 된다. 각 particle은 m차원 실수벡터로 구성된다. 여기서 m은 파라미터의 수가 된다. 따라서 각 파라미터는 주어진 문제의 차원을 나타낸다[10].

 

5. 전반적인 기상레이더를 이용한 강수/비강수 패턴분류기의 설계과정

앞에서 설명한 2, 3, 4장을 결합하여 기상레이더 데이터를 이용한 강수/비강수 패턴분류기를 설계하였다. 강수/비강수 패턴분류기는 사례 분류를 수행하는 부분과 에코 분류를 수행하는 부분으로 나뉜다. 먼저 기상레이더 데이터가 어떤 형태를 가지며 내부에 저장된 값들이 어떤 값들을 갖는지 구조분석을 하였으며, 구조분석을 통하여 바이너리 형태의 자료를 실수 형태의 자료로 변환하였다. 변환된 값들을 가지고 고도의 변화에 따라 SDZ, VGZ, SPN, FR과 같은 입력변수들의 특성을 분석하였다.

기상레이더 데이터의 강수/비강수 사례 및 에코를 분류하기 위한 설계과정은 다음과 같다.

[Step 1] 강수/비강수 자료들을 분류하고 각 사례의 특성분석을 실시한다.

[Step 2] 특성분석을 통하여 사례 분류와 에코 분류에 적합한 입력변수들을 선택한다.

[Step 3] 사례 분류를 위한 학습데이터 및 검증데이터, 테스트데이터를 구성하고 에코 분류를 위한 학습데이터 및 검증데이터, 테스트데이터를 구성한다.

[Step 4] 사례 분류를 수행하며 사례 분류가 비강수일 경우, 비강수 에코를 제거하며 레이더 영상으로 출력 후 프로그램을 종료한다.

[Step 5] 만약 사례 분류가 강수일 경우, 에코 분류를 수행하며 레이더 영상으로 출력 후 QC자료와 비교하여 성능을 평가한다.

[Step 6] 프로그램을 종료한다.

그림 7강수 에코를 분류하고 비강수 에코를 제거하기 위한 에코 분류 과정 Fig. 7 Flow chart for selection of optimized FCM-based RBFNN using PSO

 

6. 실험 및 결과고찰

6.1 학습데이터 구성 및 입력데이터 구성

뉴로-퍼지 알고리즘을 이용한 패턴분류를 수행하기 위해서는 입력데이터의 구성이 중요하다. 입력데이터는 사례 분류기의 입력데이터와 에코 분류기의 입력데이터 두 가지로 나눈다. 사례 분류기의 입력데이터를 구축하기 위하여 입력변수는 기상레이더 데이터에서 SDZ 그래프의 폭, SDZ 그래프의 기울기의 합(SDZ 0 ~ 4.5까지), 고도 4번째와 고도 5번째의 반사도 구간별 빈도수로 구성하였다. 이때, 1개의 기상레이더 데이터에서는 1개의 입력데이터가 생성된다.

그림 8뉴로-퍼지 알고리즘의 사례분류를 위한 입력데이터 구축 Fig. 8 Construction of input data for instance classification

사례 분류기의 입력 데이터는 최적화 알고리즘을 사용할 때 overfitting을 줄이기 위해 training, validation, testing인 3split 데이터로 강수 데이터와 비강수 데이터를 나누었다. training 데이터는 00분과 30분으로 선택하였으며, validation 데이터는 10분과 40분, testing 데이터는 20분과 50분으로 선정하였다. 또한 출력은 강수는 1로, 비강수는 0으로 패턴을 지정하였으며 각 데이터는 강수 사례와 비강수 사례를 취합하여 training 데이터는 강수 1524개와 1480개를 합한 3004개, validation 데이터는 1600개, testing 데이터는 1000개로 구성하였다.

표 2기상레이더 데이터를 이용한 사례분류의 입력데이터 구 성표 Table 2 Configuration table of Input data for instance classification using meteorological radar data

에코 분류기의 입력데이터를 구축하기 위하여 여러 가지 강수 유형과 비강수 유형을 알아볼 필요가 있다. 강수 유형에는 층운형, 대류성 강우밴드, 대류셀 등 여러 가지 모양과 많은 유형이 존재한다. 에코 분류를 위한 데이터는 각 좌표에 대한 에코정보가 강수 에코인지, 비강수 에코인지를 판별해야 하기 때문에 1개의 UF 데이터에서 344,520개의 좌표에 대한 데이터가 생성된다. 이때, 각 좌표에 대한 에코 정보뿐만 아니라 NULL값이 존재한다. 슈퍼컴퓨터가 아닌 이상 사례 분류처럼 많은 기간을 학습 할 수 없기 때문에 강수 에코 및 비강수 에코의 특징이 잘 나타나는 데이터를 샘플링 하였다. 또한 각 데이터의 NULL값을 제거하고 입력변수가 중복되는 값들 중 하나만 사용하여 입력데이터를 구성하였다. 테스트는 1개의 기상레이더 데이터의 344,520개의 좌표정보에 대하여 실시간으로 수행한다

6.2 성능 평가

제안된 패턴분류기의 성능평가 방법은 패턴분류율을 사용하며, 사례 분류기 부분과 에코 분류기 부분으로 나누어진다. 사례 분류기의 성능평가 방법은 강수인지 비강수인지를 얼마나 맞추느냐를 평가한다. 데이터가 강수인데 테스트했을 시 비강수라면, 또한 데이터가 비강수인데 테스트했을 시 강수라면 Error_count를 수행하고 사례 분류율을 구한다. 하지만 이는 실시간으로 테스트할 시엔 사용하지 않는다. 기상레이더 데이터를 실시간으로 수행 할 시에는 기상레이더 데이터를 하나씩 평가하기 때문에 사례 분류기의 패턴분류율을 구할 수가 없다. 따라서 사례 분류기의 성능평가는 오로지 테스트 성능을 평가하기 위해서만 사용한다.

표 3기상레이더 데이터를 이용한 에코분류의 입력데이터 구 성표 Table 3 Configuration table of input data for echo classification using meteorological radar data

그림 9사례분류를 위한 성능평가 Fig. 9 Performance evaluation for instance classification

에코 분류기의 성능평가 방법은 레이더 에코를 그림으로 표현해야하기 때문에 방위와 레이더 반경 좌표에서의 에코가 강수 에코인지 비강수 에코인지를 얼마나 맞추느냐를 평가한다. 좌표에서의 에코가 강수 에코인데 테스트했을 시 비강수 에코라면, 또한 방위와 레이더 반경 좌표에서의 에코가 비강수 에코인데 테스트했을 시 강수 에코라면 Error_count를 수행하고 패턴분류율을 구한다. 에코 분류기의 패턴분류율은 사례 분류기와는 다르게 기상레이더 데이터를 실시간으로 수행할 시에 사용할 수 있다.

그림 10에코분류를 위한 성능평가 Fig. 10 Performance evaluation for echo classification

6.3 PSO를 이용한 RBFNN 패턴분류기의 파라미터 설정

RBFNN에서는 퍼지화 계수, 입력 수, 퍼지 규칙 수, 다항식 형태에 따라 성능이 달라지기 때문에 PSO를 이용하여 최적의 성능을 나타내는 파라미터를 탐색하였으며, 초기 PSO의 설정 값 및 RBFNN의 파라미터 탐색범위를 설정하였다.

표 4Polynomial Type ( 0 : Constant 1 : Linear 2 : Modified quadratic )

사례 분류를 위한 퍼지 룰 수의 탐색범위가 에코 분류를 위한 퍼지 룰 수의 탐색범위보다 넓은 이유는 에코 분류를 위한 학습 데이터가 더 많기 때문에(사례 분류 3000개, 에코 분류 160만개) 퍼지 룰 수가 많아지면 연산이 복잡해져 슈퍼컴퓨터가 아닌 이상 메모리 아웃이 생기기 때문이다.

6.4 오성산 및 고산 기상레이더에 대한 테스트

테스트는 오성산 및 고산 기상레이더 데이터를 이용하였으며 강수 에코 사례, 파랑에코 사례, 청천에코 사례를 선정하였다. 사례 분류 부분은 데이터를 실시간으로 테스트 할 시에 에코 분류처럼 기상레이더 데이터를 하나씩 평가하지만, 본 연구에서 사례 분류 부분의 성능을 확인하기 위하여 6개월간의 기상레이더 데이터를 취합한 테스트 데이터로 성능을 평가하였다. 다음 표는 오성산 및 고산 기상레이더의 사례 분류 성능표이다.

표 5기상레이더 데이터를 이용한 사례 분류기의 성능 Table 5 Performance of instance classifier using meteorological radar data

사례 분류뿐만 아니라 에코 분류까지 수행하기 위해서는 기상레이더 데이터를 실시간으로 분류하여야 한다. 실시간 테스트는 강수, 파랑, 청천으로 나누어서 수행하였으며 논문에는 2시간씩의 성능을 표시하였다. 또한 분류 전 DZ와 기상청에서 현재 사용하는 QC, 오성산 기상레이더만을 수행하였던 기존 에코 분류기, 제안된 패턴분류기를 비교하여 성능을 평가하였다. 기존 분류기와 QC가 제거하지 못하는 데이터로 테스트하였다. 오성산 레이더의 테스트로는 강수 에코 사례로 수행하였다. 비강수 에코 사례를 확인해 본 결과 비강수 에코는 잘 제거되지만 강수 에코 사례에서 강수 에코 또한 제거하는 문제가 발생하였다. 이는 강수 에코의 특성이 비강수와 비슷하기 때문에 기존 분류기에서 강수 에코를 비강수 에코라고 판단한 것이라 생각된다. 오성산의 강수 에코 사례는 2013년 7월 16일 23시 00분 ~ 2013년 7월 17일 01시 00분까지를 수행하였다. 사례 분류 부분에서 강수로 분류되었기 때문에 에코 분류를 수행한다.

표 6오성산 기상레이더 데이터를 이용한 강수 에코 데이터의 성능 평가 Table 6 Performance evaluation of precipitation echo data using Osungsan meteorological radar data

그림 11의 (a)에서는 지형에코와 강수 에코가 같이 나타나고 있다. QC(b)에서는 레이더 영상이 깔끔하게 나오지만 dBZ값이 낮은 부분이 제거된다. 제안된 패턴분류기(d)와 비교해 보면 제거되는 부분이 확실하게 보인다. 기존 분류기(c)를 보면 지형에코와 강수에코가 제거되는 것을 볼 수 있다. 하지만 제안된 패턴분류기(d)를 보면 지형 에코는 제거되며 강수 에코는 남아 있는 것을 확인 할 수 있다, 기존 에코 분류기에서는 사례 분류를 수행하는 것이 아니라 판단모듈로 강수인지 비강수인지를 판별하기 때문에 강수 사례인데도 비강수 특성과 비슷한 특성을 보이면 비강수로 잘못 분류하는 데이터가 생긴다. 기존 에코 분류기가 분류하지 못하는 부분을 제안된 패턴분류기는 정확하게 분류를 한다.

그림 11오성산 기상레이더 데이터의 강수에코 비교(13.07.16. 23:20) Fig. 11 Comparison of classified precipitation echo using Osungsan meteorological radar data(13.07.16. 23:20)

고산 레이더의 강수 에코 사례에 대한 테스트는 2013년 7월 4일 05시 00분 ~ 07시 00분까지를 수행하였다. 강수 에코 사례는 사례 분류 부분에서 강수로 분류되었기 때문에 에코 분류를 수행한다. 고산 사이트의 파랑에코 사례와 청천에코 사례의 테스트로는 2013년 5월 12일 03시 00분 ~ 05시 00분 그리고 2013년 5월 12일 07시 40분 ~ 09시 40분까지를 수행하였다. 그림 12의 (a)에서는 지형에코와 청천에코가 같이 나타나고 있다. QC(b)와 기존 분류기인 (c)를 보면 청천에코가 어느 정도는 제거되지만 여전히 남아있는 것을 볼 수 있다. 하지만 제안된 패턴분류기인 (d)를 보면 지형에코와 청천에코가 확실히 제거되는 것을 확인 할 수 있다.

그림 12고산 기상레이더 데이터의 청천 에코 비교(13.05.12. 07:40) Fig. 12 Comparison of classified clear echo using Gosan meteorological radar data (13.05.12. 07:40)

표 7고산 기상레이더 데이터를 이용한 강수 에코 데이터의 성능 평가 Table 7 Performance index of precipitation echo data using Gosan meteorological radar data

표 8고산 기상레이더 데이터를 이용한 파랑 에코 데이터의 성능 평가 Table 8 Performance index of sea-clutter echo data using Gosan meteorological radar data

 

7. 결 론

본 연구에서는 기상레이더를 이용한 뉴로-퍼지 알고리즘 기반 강수/비강수 패턴분류기를 설계하기 위하여 사례 분류 부분과 에코 분류 부분을 구성하였다. 패턴 분류기로는 RBFNN을 제안하였고, 에코 분류를 위한 특성분석을 실시하였다. 또한 뉴로-퍼지 알고리즘 기반 강수/비강수 패턴분류기의 입력으로 사용 될 입력데이터 및 학습데이터를 구성하였으며, RBFNN의 최적의 파라미터를 찾기 위해 PSO를 이용하였다. 기존의 에코 분류만 수행하는 것과 달리 1차적으로 강수 사례인지 비강수 사례인지를 판별한다. 사례 분류 부분에서 출력 값이 강수 사례라면 2차적으로 에코 분류를 수행하고, 비강수 사례라면 존재하는 에코를 제거하여 레이더 영상으로 출력한다. 최종 출력은 QC, 기존 에코 분류기와 비교하여 성능을 검증하였으며, 사례 분류를 선행한 제안된 패턴분류기의 성능이 우수함을 확인하였다. 사례 분류 및 에코분류에 적합한 입력변수를 더 찾아내고 지금의 기상레이더보다 좋은 성능의 기상레이더로 정확한 데이터를 추출할 수 있다면 앞으로 정확한 기상관측이나 예측에 많은 도움이 되리라 생각된다. 또한 기상레이더 데이터뿐만 아니라 비선형적인 데이터의 여러 사례를 분류하거나 모델을 구현하고자 하는 연구에 응용할 수 있을 것으로 보인다.

표 9고산 기상레이더 데이터를 이용한 청천 에코 데이터의 성능 평가 Table 9 Performance index of clear echo data using Gosan meteorological radar data