1. 서 론
지구 온난화가 심각해짐에 따라 집중호우, 태풍과 같은 기상이변이 빈번히 일어나며, 이로 인한 산사태 및 홍수가 일어남에 따라 인명 및 재산피해가 심각하게 증가하고 있다. 이러한 이유로 빠른 시간에 정보를 추출하여 호우정보를 관측할 수 있는 기상레이더가 중요시 되고 있다. 그러나 기상레이더 자료에는 강수정보를 나타내는 강수에코 뿐만 아니라, 관측 시 레이더의 위치, 대기의 상태, 주위 지형, 이상굴절 등에 따라 비(非)강수 에코(Non-precipitation echos) 가 관측된다. 비(非)강수에코는 맑은 날에 나타나기도 하지만 호우 시에도 관측이 되어 강수에코와 비(非)강수에코가 같이 나타나기 때문에 정확한 강수정보를 얻을 때에 혼란을 야기한다. 따라서 레이더 자료에서 비(非)강수 에코를 제거 하는 작업은 보다 정확한 레이더 관측을 위해 반드시 선행 되어야 하는 과정이다[1].
기상청에서 현업으로 사용되는 QC데이터는 강수사례 시 0~10dBZ인 약한 반사도 값을 갖는 정보를 제거하여 레이더 자료의 정확성이 낮다. 또한 비(非)강수사례시 비(非)강수 에코들이 어느 정도는 제거되지만 전부 제거되지 않는 문제 가 발생한다. 본 논문에서는 이러한 문제점을 개선하기 위하여 기상레이더 데이터의 특성을 분석하며, 이러한 기상레이더 데이터들 중 에코 분류에 대한 연관성을 찾아내고 정확한 결과를 얻기 위해 학습 및 테스트 자료를 구성한다.
기상레이더 데이터의 각 입력변수는 다른 성격(예, 다른 범위 혹은 이산성, 연속성 등)을 가지고 있으므로, 이를 일괄적으로 수정하는 작업도 필요하다. 또한 1개의 기상레이더 데이터가 가지는 정보가 많기 때문에 학습데이터 생성시 몇 사례 밖에 적용되지 못하는 문제가 발생한다. 따라서 효과적인 강수 및 비(非)강수사례의 샘플링 방법이 고안되어야 한다. 강수에코와 비(非)강수에코의 분류를 위한 분류기는 평가방법에 입각한 RBFNN에 의해 설계된다. 제안된 분류기의 구조는 각 분류기의 특성에 맞게 설계되어진다.
본 논문은 다음과 같은 구성으로 이루어져 있다. 먼저 2장에서는 자료의 특성분석과 학습데이터 및 테스트데이터의 구성에 대해 설명하고, 3장에서는 제안한 모델과 에코판단 모듈 방법에 대해 고안하고자 한다. 4장에서는 에코 분류를 수행하여 결과에 대한 설명과 비교를 한다. 5장에서는 앞선 실험결과에 따른 결론에 대해 기술한다. 본 연구에서는 기상레이더 데이터인 UF 데이터를 분석하여 강수에코와 비 (非)강수에코를 분류하는 분류기를 개발하는 것을 목적으로 한다. RBFNN 패턴 분류기를 사용하여 에코를 분류한 결과를 비교하고, 이를 통해 현재 기상청에서 현업으로 구동되고 있는 QC에 적용할 수 있는 분류기를 제안하여 뉴로-퍼지 모델의 에코분류 성능을 확인한다.
2. 기상레이더 자료 특성분석 및 입력데이터 구성
기상레이더 자료의 에코를 분류하기 위해 기상청에서 사용하는 자료로는 UF(Universal Format)데이터를 사용한다. UF 기상레이더 데이터는 레이더 설치 지역마다의 레이더에서 관측되는 자료들을 바이너리(binary)형태 자료로 저장된 데이터를 말한다[2]. 저장되는 값들은 필터링 후 반사도 (CZ), 필터링 후 시선속도(VR), 필터링 후 스펙트럼 폭(SW), 필터링 전 반사도(DZ)가 저장된다[3]. 하지만 UF 데 이터에는 몇 가지 문제점이 있다. 첫 번째는 CZ, VR, SW, DZ로만 강수 에코인지 비(非)강수에코인지 파악할 수가 없다. CZ와 DZ의 범위는 강수 사례와 비(非)강수 사례일 때가 유사하여 강수 사례와 비(非)강수 사례가 분류되는 특징을 파악할 수 없었다. 또한 VR, SW역시 강수 사례와 비(非)강수 사례일 때의 값들이 유사하여 강수에코와 비(非)강수에 코 특징을 파악할 수 없었다. 두 번째로는 뉴로-퍼지 알고리즘은 강수에코와 비(非)강수에코에 대한 소속변수가 통계적으로 나타나는 특성을 이용한다. VR, SW는 필터링을 거친 후의 자료이기 때문에 비(非)강수에코에 대한 정보는 거의 없다. 만일 VR, SW가 소속변수로서의 역할을 제대로 하려면 비(非)강수에코에 대한 정보가 반드시 존재해야 하므로 VR과 SW는 소속변수로 채택될 수가 없다. 마지막으로, CZ가 필터링 후의 반사도 값이라고 하지만 강수 사례일 때 여전히 지형에코가 존재한다. 이 뿐만이 아니라 비(非)강수 사례에서 비(非)강수에코 또한 존재하여 필터링을 거친 후의 데이터라고는 하지만 정보의 신뢰성이 낮다[4].
이러한 문제점 때문에 기상레이더 데이터의 DZ(필터링 전 dBZ 값)를 이용하여 반사도의 표준편차(SDZ), 누적 DZ 를 구하였으며, 그 특성을 분석하였다. 분석결과 강수에코와 지형에코에서는 에코의 DZ 범위는 같지만 SDZ와 FR에 상당한 차이를 보였다. 또한 강수에코와 Clear에코에서는 1시간누적 DZ, 2시간 누적 DZ가 상당한 차이를 보여 입력변수로 사용하였다.
그림 1입력데이터 구성 과정 Fig. 1 Construction procedure of input data
3. 제안된 분류기 및 에코분류 방법
본 장에서는, UF 데이터를 이용하여 에코 분류를 위한 다항식 방사형 기저함수 신경회로망과 에코판단 모듈의 적용방법에 대해 설명한다.
3.1 다항식 방사형 기저함수 신경회로망(RBFNN)의 구조
먼저 일반적인 RBF 신경회로망은 일반적으로 3개의 층(입력층, 은닉층, 출력층)을 가진 신경회로망으로써 n차원의 입력 벡터 x=[x1, x2, …,xn]T는 은닉층을 통해 비선형식으로 변환되고, 은닉층을 통해 얻어진 활성 레벨들은 출력층에 위치한 뉴런에 의해서 최종적으로 선형 형태로 변환된다[5].
RBF 신경회로망은 빠른 학습시간과 일반화(generality) 능력 그리고 단순화(simplicity) 능력이 다른 알고리즘과 비교해서 우수한 성능을 보이고, 데이터를 분류하는 작업과 비선형 시스템의 모델링 등에 사용된다. 일반적으로 널리 사용되어지는 방사형 기저함수 형태는 식 (1)과 같이 가우시안 형태로 표현되어진다[6].
여기서 xj는 j번째 입력 데이터, vijj은 j번째 입력의 i(i=1, ..., k)번째 RBF의 중심, σi는 i번째 은닉층 노드에서 RBF의 활성화 영역을 결정하는 분포상수이며 일반적으로 은닉층을 구성하는 모든 노드들은 ‘1’의 값을 가진다. 네트워크의 출력 y(x)는 각각의 활성화 레벨의 선형 조합으로써 다음 식 (2)와 같이 계산된다.
은닉층에서의 개발이 결정적인 RBF 신경회로망 설계에 있어서 중요한 특징으로 부각된다. 그 이유는 (a) 은닉층의 형태와 수는 기본적인 설계의 초점이 되고, (b) 입력공간에서의 은닉층의 분포는 네트워크의 기능에서 중요한 관련이 있으며, (c) 각각의 은닉층에서의 파라미터의 최적화는 본질적으로 가장 중요하다. 기존의 논문들에서는 이와 같은 중요한 설계 이슈들에 대해 다루기 위해 여러 가지 방법들이 시도되어지고 있다. 즉, RBF 노드 상호간의 연결가중치와 노드 중심 및 폭과 같은 파라미터 변경 등이 연구되었으며, 입력 데이터 중에서 임의로 중심 선택법 등이 사용되어졌다. 또한 은닉층의 형태가 결정되어진 후, 출력층에서 신경들의 가중치에 대한 최적화가 직접적으로 이루어진 논문들 도 있다[7][8].
제안한 RBFNN에서는 그림 2와 같이 조건부에 기존의 가우시안 함수가 아닌 FCM 클러스터링 방법을 사용하였다. FCM 알고리즘은 각 클러스터에 데이터의 소속정도를 퍼지 집합으로 출력하는 방사형의 형태를 가지고 있어 활성함수로써 사용하기에 적합하여 가우시안 함수의 역할을 대체하여 사용할 수 있었다. 결론부에서는 다항식(상수, 일차선형, 변형된 2차 선형)을 사용한다. 규칙 후반부 다항식의 계수를 동정하기 위한 후반부 파라미터 동정은 최소자승법(Least Square Equation: LSE)을 사용하였다. LSE는 오차 제곱의 합이 최소가 되도록 계수를 추정하여 주고, 전역 모델의 학습을 한 번에 구하여 오류역전파 알고리즘을 사용할 때와 달리 학습시간을 최소화 할 수 있는 특징을 가진다. 여기서, y(x)는 모델의 출력 데이터를 의미한다.
그림 2제안한 RBFNNs Fig. 2 Proposed Radial Basis Function Neural Networks
조건부에서 사용된 FCM 클러스터링 알고리즘은 데이터들 간의 거리를 기준으로 소속정도를 측정하여 이를 바탕으로 데이터들을 특성별로 분석하여 클러스터를 기준으로 특성을 판별한다. FCM 클러스터링 방법은 n개의 벡터 xi (i=1,...,n) 집합을 c개의 클러스터로 분할하고, 각 클러스터의 목적함수가 최소가 되는 중심 값을 찾는 방법이다. FCM 클 러스터링 방법의 목적은 0과 1사이의 소속감 정도를 가지고, 주어진 데이터들을 몇 개의 클러스터로 나눌 수 있는지를 판별하기 위한 퍼지 분할을 사용한다는 점이다. 즉 퍼지분할을 적응하기 위해서, 소속 함수 U는 0과 1사이의 값을 가진 요소들로 나타내며, 데이터 집합에 대한 소속감 정도 U 의 합은 항상 1이다. U라 표시되는 partition matrix를 구하 기 위한 FCM 학습 데이터 분류 방법은 다음과 같다[9].
[단계 1] 클러스터의 개수 c(2⩽c⩽n)를 정하고 퍼지화계수 m(1
여기서 uij는 소속행렬의 파라미터이다.. [단계 2] 식 (4)∼(7)를 이용하여 FCM 클러스터 중심 vi(i=1, 2, ..., c)을 계산한다. FCM 클러스터링에 대한 목적함수는 다음과 같은 형태를 가지고 있다.
여기서, uik는 0과 1사이의 소속을 나타내는 정도의 값으로 i번째 클러스터에 속해져 있는 xk의 k번째 데이터의 소속정도를 나타낸다. vi는 i번째 클러스 터 중심 벡터이다. m은 partition matrix의 애매함 의 정도에 대한 영향을 나타내는 퍼지화 계수이다. 이 값은 m∈[1, ∞]와 같은 범위를 가지고 있다. 식 (5)의 목적함수를 최소화하기 위해서 먼저 vi와 uik와 관련된 식의 목적함수를 다음과 같이 분화시켜야 한다.
식 (5)에서 주어진 목적함수를 만족하기 위하여 식 (6)과 식 (7)에 의해서 구해진 값들을 이용하여 클러스터 중심 벡터를 구한다. ▪Euclidean distance :
[단계 3] 다음과 같이 새로운 소속행렬 U(r+1)을 계산한다.
[단계 4] 다음 식(9)를 계산해서 만일 ⊿>Ɛ 이면 r=r+1로 정하고 [단계 2]로 가서 다시 알고리즘을 반복 수행하고 그렇지 않고 ⊿≤Ɛ이면 알고리즘을 종료한다. 여기서, Ɛ는 임계값이다.
본 절에서는 제안한 퍼지 모델의 성능 향상에 주요한 역할을 하는 에코 판단모듈에 대하여 기술한다. 판단모듈은 확실하게 알고 있는 비(非)강수 에코의 특성을 이용하여 비 (非)강수에코가 확실한 부분은 RBFNN으로 평가하는 것이 아니라 제가하는 것이다. 다음은 표 1은 에코 판단모듈 지표이다[10]. 표 1에코 판단모듈 지표
Table 1 Tavle of echo judgement module 위의 표처럼 먼저 1차적으로, 테스트 데이터의 정보를 파악하여 제거할 데이터와 판단할 데이터를 구분한다. 그리고 2차적으로, 구분한 DZ 값들로 제거할 데이터인지 분류기로 분류해야할 데이터인지를 판단한다. 비강수 에코가 확실한 부분은 DZ의 dBZ값이 음수이거나, Null 값이 있으며 레이더 영상으로 나타나지 않는다. 한반도에서 발생한 시간당 최고 강수량은 서울지역의 1937년 7월 30일 146.9mm이기 때문에 DZ의 dBZ 값이 60이상(계산 상 205.04mm)인 부분은 제거한다. (10)은 dBZ 값을 시간당 강수량으로 계산하는 식이며, (11)은 판단 모듈을 사용할시 RBFNN을 사용할 것인지를 판단하는 식이다.
여기서 Z는 dBZ를 로그스케일로 바꾸기 전 값이며, R은 시간당 강수량이다. 강수에코의 사례는 많고 종류도 다양하기 때문에 많은 사례 중에서 대류형, 층운형, 발달하는 대류셀, 대류셀+층운형, 태풍에 의한 대류셀의 강수사례들 중 하나씩을 샘플링 하여 강수 학습데이터를 구성하였으며, 비강수 학습데이터로는 맑은 날의 지형에코와 Clear 에코들을 샘플링 하여 구성하였다. 또한 각 입력변수들이 중복되는 데이터들을 제거하여 학습데이터를 20% 줄일 수 있었다. 또한 학습데이터에 사용되지 않은 강수 사례 및 비강수 사례들로 테스트하여 성능을 평가한다. 오성산 레이더의 층운형과 대류형 강수 사례, 그리고 강설 사례를 테스트 하였다. 층운형 강수 사례는 2012년 4월 21일 05시∼06시 7개의 레이더 자료를, 대류형 강수 사례는 2012년 10월 22일 07∼08시 7개의 레이더 자료를, 강설 사례는 2012년 12월 14일 06시∼07시까지 7개의 레이더자료를 테스트 하였으며, 총 21개의 자료를 테스트 하였다. 그림 3-5의 (a)의 가운데를 보면 빨간색으로 지형에코가 나타나고 있다. 그림 3-5의 (d)를 보면 지형에코가 제거되는 것을 확인 할 수 있고, 레이더에서 필터링을 거쳐 나오는 CZ와 비교해 보았을 때 0∼10dBZ인 약한 강수에코가 약간 제거됨을 확인할 수 있다. 하지만 기상청에서 현업으로 사 용하고 있는 QC자료와 비교해 보았을 때, 약한 강수에코를 더 많이 살려내는 성능을 확인할 수 있다. 표 2각 테스트 데이터의 성능 지표
Table 2 Performance index of each test data 그림 3레이더 자료(오성산 2012년 4월 21일 05시00분)의 반 사도를 이용한 층운형 강수 에코 지도
Fig. 3 Stratiform PRE map by using reflectivity of radar data(KSN 05:00 on 21 Apr. 2012) 그림 4레이더 자료(오성산 2012년 10월 22일 07시00분)의 반사도를 이용한 대류형 강수 에코 지도
Fig. 4 Convection PRE map by using reflectivity of radar data (KSN 07:00 on 22 Oct. 2012) 그림 5레이더 자료(오성산 2012년 12월 14일 06시00분)의 반사도를 이용한 강설 에코 지도
Fig. 5 Snowfall echo map by using reflectivity of radar data (KSN 06:00 on 14 Dec. 2012) 지형에코 사례의 테스트로는 오성산 레이더의 2012년 5월 15일 10시∼11시 총 7개의 레이더 자료를 테스트 하였다. 그림 6의 (a)를 보면 지형에코가 나타나고 있다. 그리고 (b)와 (c)를 보면 필터링을 거쳤지만 지형에코가 생기는 것 을 볼 수 있다. 하지만 그림 6의 (d)를 보면 지형에코는 확실히 지워지는 것을 확인 할 수 있으며, 레이더에서 필터링 을 거쳐 나오는 CZ와 비교해 보았을 때 지형에코는 CZ보다 더 잘 제거되는 것을 확인 할 수 있다. 그리고 기상청에서 현업으로 사용하고 있는 QC자료와 비교해 보아도 지형에코가 잘 제거되는 것을 볼 수 있다. 표 3각 테스트 데이터의 성능 지표
Table 3 Performance index of each test data 그림 6레이더 자료(오성산 2012년 5월 15일 10시00분)의 반 사도를 이용한 지형 에코 지도
Fig. 6 Ground echo map by using reflectivity of radar data (KSN 10:00 on 15 May. 2012) 청천(Clear) 에코 사례의 테스트로는 오성산 레이더의 2012년 5월 6일 22시∼23시, 2012년 10월 7일 19시∼20시까지 총 14개의 레이더 자료를 테스트 하였다. 표 4각 테스트 데이터의 성능 지표
Table 4 Performance index of each test data 그림 7의 (a)를 보면 지형에코와 청천(Clear) 에코가 같이 나타나고 있다. 그리고 (b)와 (c)를 보면 필터링을 거쳤지만 청천(Clear) 에코가 생기는 것을 볼 수 있다. 하지만 각 그림의 (d)를 보면 지형 에코와 청천(Clear) 에코가 확실히 지 워지는 것을 확인 할 수 있으며, 레이더에서 필터링을 거쳐 나오는 CZ와 비교해 보았을 때 청천(Clear) 에코는 CZ보다 더 잘 제거되는 것을 확인 할 수 있다. 그리고 기상청에서 현업으로 사용하고 있는 QC자료와 비교해 보아도 청천(Clear) 에코가 잘 제거되는 것을 볼 수 있다. 그림 7레이더 자료(오성산 2012년 10월 7일 19시00분)의 반 사도를 이용한 청천(Clear) 에코 지도
Fig. 7 Clear echo map by using reflectivity of radar data (KSN 19:00 on 7 Oct. 2012) 본 연구는 기상레이더 데이터를 사용하여 강수에코와 비(非)강수에코를 분류하여, 실시간으로 기상레이더 지도에서 강수에코와 비(非)강수에코가 섞어있는 부분 중 비(非)강수에코를 제거하여 지도상에서 강수에코만을 나타내는 연구이 다. 강수에코와 비(非)강수에코를 분류하기 위하여 RBFNN 패턴분류기를 사용하였다. 레이더 자체에서 필터링을 거친 반사도 값인 CZ와 기상청에서 현업으로 사용되는 QC 데이터와 비교해 보았을 때, 강수사례 시 CZ의 값보다 지형에코 부분은 많이 제거되며 QC 데이터에서 0~10dBZ인 약한 반사도 값들이 제거되는 에코들을 살려 내었다. 비(非)강수 사례 시 비(非)강수에코들이 제거되지 않은 CZ와 QC보다 더 많이 제거됨을 볼 수 있었다. 다량의 데이터에 대하여 처리하는 방법을 제시하여 사이즈가 큰 데이터를 처리하는 연구를 수행할 수 있었고, 동일한 자료를 활용하여 현재 기상청에서 사용하는 모델과 성능을 비교하므로 인해 분류기의 성능을 알 수 있었다. 본 연구의 결과를 바탕으로 RBFNN 모델을 사용하여 오성산 레이더 사이트 뿐만 아니라 여러 레이더 사이트에 대한 강수/비(非)강수 에코를 분류하는 연구가 수행될 수 있을 것으로 기대한다.3.2 에코 판단모듈
4. 실험 방법 및 평가
4.1 강수 및 강설에코 사례의 테스트
4.2 지형에코 사례의 테스트
4.3 청천(Clear)에코 사례의 테스트
5. 결 론
References
- Cho, Y. H., G. Lee, K. E. Kim, and I. Zawadzki, "Identification and removal of ground echoes and anomalous propagation using the characteristics of radar echoes." J. Atmos. Oceanic Technol., 23, 1206-1222 (2006). https://doi.org/10.1175/JTECH1913.1
- Tanvir Islam, Miguel A. Rico-Ramirez, Dawei Han, Prashant K. Srivastava, "Artificial intelligence techniques for clutter identification with polarimetric radar signatures." Atmospheric Research, Volumes 109-110, June, Pages 95-113 (2012). https://doi.org/10.1016/j.atmosres.2012.02.007
- Walther, A., Schroder, M., Fischer, J., & Bennartz, R. "Comparison of precipitation in the regional climate model BALTIMOS to radar observations." Theoretical and Applied Climatology, 1-14. (2009).
- Berenguer, M., Sempere-Torres, D., Corral, C., & Sanchez-Diezma, R. "A fuzzy logic technique for identifying nonprecipitating echoes in radar scans." Journal of Atmospheric and Oceanic Technology, 23(9), 1157-1180. (2006). https://doi.org/10.1175/JTECH1914.1
- G. Pajares, M. Guijarro, A. Ribeiro, "A Hopfield Neural Network for combining classifiers applied to textured images." Neural Networks, Vol.23, pp. 144-153, (2010). https://doi.org/10.1016/j.neunet.2009.07.019
- S. Abbasbandy, M. Otadi, M. Mosleh," Numerical solution of a system of fuzzy polynomials by fuzzy neural network." Information Sciences 178 (8) 1948-1960. (2008) https://doi.org/10.1016/j.ins.2007.11.026
- S.-K. Oh, W. Pderycz, B.-J. Park, "Self-organizing neurofuzzy networks in modeling software data," Fuzzy Sets and Systems, vol. 145, pp. 165-181, (2004). https://doi.org/10.1016/j.fss.2003.10.009
- L. Sanchez, I. Couso, J.A. Corrales, "Combining GP operators with SA search to evolve fuzzy rule based classifiers." Information Science, 136, 175-191. (2001). https://doi.org/10.1016/S0020-0255(01)00146-3
- W. Pedrycz, "Conditional fuzzy clustering in the design of radial basis function neural networks," IEEE Trans. Neural Networks, vol. 9, pp. 601-612, July. (1998). https://doi.org/10.1109/72.701174
- J. H. Ko, S. K. Oh, H. K. Kim, "Design of Echo Classifier with the Aid of Neuro-Fuzzy algorithm Using Meteorolgical Radar Data." Conference on Information and Control Systems, Intelligent systems(I). pp. 80-81. October (2013)