DOI QR코드

DOI QR Code

Estimation for Ground Air Temperature Using GEO-KOMPSAT-2A and Deep Neural Network

심층신경망과 천리안위성 2A호를 활용한 지상기온 추정에 관한 연구

  • Taeyoon Eom (Major of Atmospheric Sciences, Department of Astronomy, Space Science and Geology, Chungnam National University) ;
  • Kwangnyun Kim (Major of Atmospheric Sciences, Department of Astronomy, Space Science and Geology, Chungnam National University) ;
  • Yonghan Jo (Major of Atmospheric Sciences, Department of Astronomy, Space Science and Geology, Chungnam National University) ;
  • Keunyong Song (Climate Service Department, Seoul Metropolitan Office of Meteorology, Korea Meteorological Administration) ;
  • Yunjeong Lee (Climate Service Department, Seoul Metropolitan Office of Meteorology, Korea Meteorological Administration) ;
  • Yun Gon Lee (Department of Astronomy, Space Science and Geology, Chungnam National University)
  • 엄태윤 (충남대학교 우주지질학과 대기과학전공) ;
  • 김광년 (충남대학교 우주지질학과 대기과학전공) ;
  • 조용한 (충남대학교 우주지질학과 대기과학전공) ;
  • 송근용 (기상청 수도권기상청 기후서비스과) ;
  • 이윤정 (기상청 수도권기상청 기후서비스과) ;
  • 이윤곤 (충남대학교 우주지질학과)
  • Received : 2023.02.24
  • Accepted : 2023.03.28
  • Published : 2023.04.30

Abstract

This study suggests deep neural network models for estimating air temperature with Level 1B (L1B) datasets of GEO-KOMPSAT-2A (GK-2A). The temperature at 1.5 m above the ground impact not only daily life but also weather warnings such as cold and heat waves. There are many studies to assume the air temperature from the land surface temperature (LST) retrieved from satellites because the air temperature has a strong relationship with the LST. However, an algorithm of the LST, Level 2 output of GK-2A, works only clear sky pixels. To overcome the cloud effects, we apply a deep neural network (DNN) model to assume the air temperature with L1B calibrated for radiometric and geometrics from raw satellite data and compare the model with a linear regression model between LST and air temperature. The root mean square errors (RMSE) of the air temperature for model outputs are used to evaluate the model. The number of 95 in-situ air temperature data was 2,496,634 and the ratio of datasets paired with LST and L1B show 42.1% and 98.4%. The training years are 2020 and 2021 and 2022 is used to validate. The DNN model is designed with an input layer taking 16 channels and four hidden fully connected layers to assume an air temperature. As a result of the model using 16 bands of L1B, the DNN with RMSE 2.22℃ showed great performance than the baseline model with RMSE 3.55℃ on clear sky conditions and the total RMSE including overcast samples was 3.33℃. It is suggested that the DNN is able to overcome cloud effects. However, it showed different characteristics in seasonal and hourly analysis and needed to append solar information as inputs to make a general DNN model because the summer and winter seasons showed a low coefficient of determinations with high standard deviations.

본 연구는 천리안위성 2A호의 Level 1B (L1B) 정보를 사용해 지상기온을 추정하기 위한 심층신경망(deep neural network, DNN) 기법을 적용하고 검증을 실시하였다. 지상기온은 지면으로부터 1.5 m 높이의 대기온도로 일상생활뿐만 아니라 폭염이나 한파와 같은 이슈에 밀접한 관련을 갖는다. 지상기온은 지표면 온도와 대기의 열 교환에 의해 결정되므로 위성으로부터 산출된 지표면 온도(land surface temperature, LST)를 이용한 지상기온 추정 연구가 활발하였다. 하지만 천리안위성 2A호 산출물 LST는 Level 2 정보로 구름영향이 없는 픽셀만 산출되는 한계가 있다. 따라서 본 연구에서는 Advanced Meteorological Imager 센서에서 측정된 원시데이터에 오직 복사와 위치보정을 마친 L1B 정보를 사용해 지상기온을 추정하기 위한 DNN 모델을 제시하고 그 성능을 가늠하기 위해 위성 LST와 지상관측 기온 사이의 선형회귀모델을 기준모델로 사용하였다. 연구기간은 2020년부터 2022년까지 3년으로 평가기간 2022년을 제외한 기간은 훈련기간으로 설정했다. 평가지표는 기상청의 종관기상관측소에서 정시에 관측된 기온정보로 평균 제곱근 오차를 사용하였다. 관측지점에서 추출된 픽셀 중 손실된 픽셀의 비율은 LST는 57.91%, L1B는 1.63%를 보였으며 LST의 비율이 낮은 이유는 구름의 영향 때문이다. 제안한 DNN의 구조는 16개 L1B 자료와 태양정보를 입력 받는 층과 은닉층 4개, 지상기온 1개를 출력하는 층으로 구성하였다. 연구결과 구름의 영향이 없는 경우 DNN 모델이 root mean square error (RMSE) 2.22℃로 기준모델의 RMSE 3.55℃ 보다 낮은 오차를 보였고, 흐린 조건을 포함한 총 RMSE는 3.34℃를 나타내면서 구름의 영향을 제거할 수 있을 것으로 보였다. 하지만 계절과 시간에 따른 분석결과 여름과 겨울철에 모델의 결정계수가 각각 0.51과 0.42로 매우 낮게 나타났고 일 변동의 분산이 0.11과 0.21로 나타났다. 가시채널을 고려해 태양 위치정보를 추가한 결과에서 결정계수가 0.67과 0.61로 개선되었고 시간에 따른 일 변동의 분산도 0.03과 0.1로 감소하면서 모든 계절과 시간대에 더 일반화된 모델을 생성할 수 있었다.

Keywords

1. 서론

최근 기후변화의 영향으로 전 세계 곳곳에서 이상기상현상이 빈번하게 발생하고 있다. 2021년 6월 미국과 캐나다의 태평양 북서부 지역의 여러 도시에서 기록적인 폭염으로 온열 질환 사망자가 급증하였다(Philip et al., 2022). 겨울철 온화한 날씨로 난방시설이 부족한 대만에서는 최근 한파로 인해 150여명이 사망하였다. 기후변화는 이미 한반도 생태계에도 영향을 주고 있다. 각 지역의 기후에 맞게 재배되던 과일이나 야채 같은 특산물이 모호해지고, 해수온도의 변화로 바다에서 양식하던 물고기가 집단 폐사하는 등 온도변화에 민감한 산업에서는 그 영향이 가시화되고 있다(Lee et al., 2018).

기상학적으로 지상기온은 지표면으로부터 1.5 m정도 높이에서 측정된 대기의 온도로 사용되며(Mihalakakou et al., 1994; Beltrami, 2001; Hong et al., 2018), 일상적인 인간생활과 밀접하게 관련되는 기상 요소이다. 기상청의 기상특보 중 한파와 폭염은 기온을 기준으로 발표된다. 특히, 폭염은 심각한 인명 및 재산피해를 발생시키는 자연재해이며, 최근 폭염의 심각성이 대두되면서 피해를 경감하기 위한 지속적인 연구가 요구되고 있다(Lee et al., 2020). 기상청은 2022년을 기준으로 전국에 95개의 종관기상관측소(automated synoptic observing system, ASOS)와 525개의 방재기상관측소(automatic weather system, AWS)를 운영하고 있다. 이러한 지상관측(in-situ)은 정확한 기온 정보를 얻을 수 있다는 장점이 있지만 우리나라는 지형이 복잡하고 기상요소의 시공간적 변동성이 크게 나타나기 때문에, 현재 12 km 수준의 공간적 관측밀도로는 국지적인 기상현상의 공간 특성을 파악하기 어렵다(Kim et al., 2020). 이러한 지점 단위 지상관측의 한계를 보완해줄 대안으로 위성을 활용한 다양한 기상정보 산출 연구가 수행되고 있다. 대표적으로 지표면 부근의 기온 역전에 의해 발생하는 안개는 위성의 적외 3.7 μm와 11 μm 채널 간 밝기온도 차이를 이용해서 산출된다(Bendix et al., 2005; Gultepe et al., 2007; Han et al., 2020). 또한 고온 건조한 조건에서 발생하기 쉬운 산불은 최근 국내외로 대형 산불이 장기간 발생하면서 위성자료를 활용한 산불감시 연구가 주목 받고 있다(Cuomo et al., 2001; Xu and Zhong, 2017; Toan et al., 2019). 하지만 위성관측은 지구에서 방출되는 복사에너지를 측정하는 것으로 대기 중 흡수와 산란의 영향을 받으며 특히 지표와 위성 사이에 구름이 있으면 차폐(mask)로 인해 산출물 생산에 큰 장애가 된다.

우리나라는 최초의 기상위성으로 천리안위성 1호를 2010년에 발사해 2011년부터 정식으로 운영하면서 16종의 기상산출물을 생산했고, 임무주기 완료에 따라 차세대 기상위성인 천리안위성 2A호(GEO-KOMPSAT-2A, GK-2A)를 2018년 12월에 발사해 52종의 기상 및 융합산출물을 제공하고 있다. GK-2A 위성에 탑재된 advanced meteorological imager (AMI) 센서는 일본의 Himawari-8 위성의 AHI 센서와 유사한 성능을 가지고 있고, 16개 파장역과 높은 시공간 해상도를 갖는다(Lee et al., 2018). AMI 센서의 공간해상도는 가시채널 0.5–1.0 km, 적외 채널 2 km로 기존 천리안위성 1호보다 2배 높은 해상도를 갖고, 시간해상도는 한반도 중심의 국지 영역이 2분, 전 지구 영역이 10분의 시간해상도를 갖는다(Park et al., 2016).

지상기온과 밀접한 관계를 갖는 지표면 온도(land surface temperature, LST)는 GK-2A 위성의 기본 산출물 중 하나로 서로 다른 두 채널의 분리대기창 기법을 사용하여 산출되고 2 km 공간해상도에 10분 단위로 산출된다. GK-2A LST 알고리즘 문서에 따르면 미국의 moderate resolution imaging spectroradiometer (MODIS) 위성의 LST Collection 6와 비교해서 0.969의 상관계수 (correlation coefficient, r)와 2.281K의 평균 제곱근 오차(root mean square error, RMSE)를 보였으며 지상관측 검증에서 0.95의 상관계수와 RMSE 2.021K를 보였다(Choi and Suh, 2020). 한편, 국내외 선행연구에서는 위성기반 LST와 지상관측 기온의 상관 및 관계성 분석을 통해서 지표면 부근의 지상기온을 추정하고자 하였다(Jones et al., 2004; Fu et al., 2011; Shen and Leptoukh, 2011; Shin et al., 2014; Yoo et al., 2018; Chung et al., 2018). 하지만 위성 기반 LST는 위성의 원시관측 자료로부터 산출되는 2차 산출물로 구름에 의한 영향을 받기 때문에, 구름이 없는 격자에서만 산출되는 한계가 있다. 반면 Level 1(L1B) 자료는 구름 및 대기상태에 상관없이 관측영역의 모든 격자에 대해서 위치와 복사보정 이후에 자료가 제공된다. 한편 심층신경망(deep neural network, DNN)은 선형관계에서 찾기 힘든 데이터세트에 내재된 특징을 학습하는 기계학습 방법으로 최근 위성 산출물 연구에 많이 활용되고 있다(Yeom et al., 2019; Tao et al., 2016; Terliksiz and Altýlar, 2019). 따라서, 이번 연구에서 구름 격자에 의해 산출되지 못하는 기상위성 산출물의 한계를 극복하기 위해 L1B 자료와 DNN 기법을 활용한 지상기온 추정방법을 제안하고 기준모델(baseline model)로 위성 LST와 지상기온 사이의 선형회귀 모델을 사용하여 제안한 모델의 성능을 평가하고자 한다.

2. 연구자료

2.1. 연구지역과 연구기간

본 연구에서는 한반도 영역에 대한 천리안 2A호 위성자료(GK-2A)를 사용하였으며, 기상청에서 제공하는 95개 ASOS의 기온자료를 이용하여 데이터세트를 구성하였다. 구성된 데이터세트는 각 지상관측소의 위경도를 기준으로 가장 가까운 위성자료 화소 값을 사용하였다. 연구기간은 2020년 1월 1일 0시부터 2022년까지 12월 31일 23시까지 한국시간을 기준으로 시간자료를 사용하였으며, 2020년과 2021년은 모델의 훈련기간으로 설정하고 2022년을 평가기간으로 설정하였다.

2.2. GK-2A Level 1B

GK-2A위성의 AMI 센서는 총 16개 밴드에 대한 관측정보를 제공하고 가시채널 4개(VI, Band 1~4)와 근적외 채널 2개(NR, Band 5, 6), 단파적외채널 1개(SW, Band 7), 수증기채널 3개(WV, Band 8~10) 그리고 적외채널 6개(IR, Band 11~16)로 구성되어 있다(Table 1). 가시채널의 해상도는 파랑(VI004)과 초록(VI005)채널이 1 km, 빨강(VI007)이 0.5 km를 갖으며 육상과 해상을 구분하는 VI008 채널은 1 km 공간해상도를 갖는다(Kim et al., 2021). 그 외의 채널은 모두 2 km 공간해상도를 갖으며, 근적외 채널은 권운과 눈/얼음 탐지, 단파적외채널은 안개 및 하층운, 산불 탐지, 수증기 채널은 층별 수증기 특징 감시 등을 목적으로 한다. 시간해상도는 전구 영역이 10분 주기, 확장 국지영역과 국지영역은 2분 주기로 관측이 수행된다. 위성으로부터 관측된 자료는 지상으로 송신되어 기본 전처리(preprocessing) 과정에 해당하는 복사와 위치보정을 거쳐 신뢰도를 확보한 L1B 자료를 생산한다. 채널별로 전처리된 자료는 픽셀당 11~14개의 비트에 값을 저장하며 가장 앞측 2개 비트에 품질유형을 좋은 품질, 조건에 따라 사용가능한 품질, 관측 영역 외부, 오류 존재로 총 4단계로 구성된 품질정보(data quality flag, DQF)를 표시하고 있다. 본 연구에서 지상관측 지점별로 추출된 가장 가까운 픽셀 값을 품질과 부호가 없는 정수 형태로 나누어 추출하였으며 연구기간 동안 추출된 픽셀의 DQF는 모두 이진표기 0b00으로 좋은 품질에 해당하는 것으로 확인됐다.

OGCSBN_2023_v39n2_207_f0001.png 이미지

Fig. 1. The GK-2A datasets offer various areas focused on Korea. (a) The dashed line shows satellite areas for GK-2A, and the solid line indicates study areas. (b) The air temperature data observed at ground stations are measured by 95 in-situ from 1 January 2020 to 31 December 2022 in the local time.

Table 1. Specifications of GK-2A/AMI

OGCSBN_2023_v39n2_207_t0001.png 이미지

2.3. GK-2A Land Surface Temperature

이번 연구에서 GK-2A위성의 LST 산출물은 기준모델인 지상기온과의 선형회귀 모델을 생성하기 위해 사용되었다. GK-2A위성의 LST 산출 알고리즘은 서로 다른 흡수대를 갖는 인접한 두 개의 대기창 채널을 이용하여 대기효과를 보정하는 분리 대기창 기법(window split)과 복사전달모델(radiative transfer model)을 포함한 다양한 요소들로 구성된다(Choi and Suh, 2018; Choi and Suh, 2020). LST를 산출하기 위해 GK-2A의 L1B 자료 중 밴드 13과 밴드 15가 사용되고 Level 2에 구름 마스크 산출물이 사용된다. 산출된 LST는 2 km의 공간해상도를 갖으며 한반도 영역에 대해서 10분 주기로 생성된다. 지표면 온도는 지상 1.5 m높이의 기온과 열교환으로 지상기온과 상관성이 높게 나타나는 산출물 중 하나로 위성 LST를 활용한 지상기온 추정에 관한 연구가 많이 제시되고 있다(Yang et al., 2017; Jee et al., 2014; Liu et al., 2017; Liu et al., 2019). 이번 연구기간 동안 GK-2A의 LST 산출물은 지상관측소에서 관측된 지면온도와 RMSE가 5.11℃의 차이를 보였고 회귀분석에서는 상관계수 0.941, 결정계수 0.845를 보였다. 또한 구름 마스크에 엄격한 적용을 받아 맑은 하늘 조건에서만 산출된 정보를 이용할 수 있었다.

2.4. 지상기온 정보

기상청에서 운영하는 95개 ASOS에서 관측된 지상 기온 정보는 기준 모델인 선형회귀 모델과 심층신경망 모델이 추정해야 되는 대상으로 사용된다. 학습기간에 해당하는 2020년과 2021년의 매시간 전체 지상기온은 –24.2~38.2℃ 범위에서 평균 13.42℃, 표준편차 9.79℃를 보였다(Fig. 2). 계절별 평균과 표준편차는 각각 겨울(December-January-February, DJF)은 2.13±6.04℃, 봄(March-April-May, MAM)은 12.49±6.17℃, 여름(June-July-August, JJA)은 24.09±3.89℃, 가을(September-October-November, SON)은 14.81±7.1℃를 나타냈다. 기온의 특징이 뚜렷한 여름과 겨울에 사분범위(interquartile range)의 Q1과 Q3에 해당하는 값이 각각 –1.8℃와 6.4℃, 21.3℃와 26.7℃로 나타났다. 선형회귀와 심층 신경망 모델의 훈련은 계절을 구분하지 않았고, 심층신경망 모델에 계절과 시간대에 따른 기온특성을 고려하기 위해 태양의 천정각(zenith. angle), 고도각(elevation angle), 방위각(azimuth angle) 그리고 균시차(equation of time)를 정보를 추가하여 DNN 모델을 생성하였다.

OGCSBN_2023_v39n2_207_f0002.png 이미지

Fig. 2. Histogram of hourly-measured air temperature at 95 in-situ sites from 1 January 2020 to 31 December 2021.

2.5. 데이터세트 구축

심층신경망과 선형회귀 모델은 각각 기계학습의 한 분야로 훈련과 검증을 위한 데이터세트를 구축하였다. 모든 위성정보는 지상관측소의 위경도 좌표에 가장 가까운 화소를 추출하였으며 심층신경망 모델 학습을 위한 GK-2A위성의 L1B 16개 밴드 데이터가 기온을 추정할 수 있게 구성하였다(Table 2). 기준모델인 선형회귀 모델은 LST와 지상기온의 사이에 단순회귀(simple linear regression)분석이 가능하게 구성하였다. GK-2A위성의 LST 뿐만 아니라 많은 산출물들이 구름이 없는 맑은 화소에서만 추출되는데(Chen et al., 2018), 전체 데이터세트의 57.91%가 LST값이 산출되지 않아 제외되었다. 반면 L1B 데이터는 원시자료에 방사와 위치보정만 수행된 자료로 모든 정보가 디지털 숫자 형태로 존재하며 전체 1.63%의 누락비율을 보였다. GK-2A위성은 태양풍에 의한 흔들림 제어를 위해 매일 1회 자세제어 휠을 초기화하는 휠 오프로딩(wheel offloading)을 수행하는데 8월부터 12월 사이에 coordinated universal time (UTC) 6시 정각에 휠 오프로딩을 수행하여 위성관측을 멈추기 때문에 누락비율이 다소 증가하였다. 구축된 데이터세트의 누락비율에서 L1B가 LST에 비해 현저히 낮게 나타나면서 L1B를 이용한 지상기온 산출 시 구름에 의한 관측 공백을 감소시킬 수 있을 것으로 기대한다

Table 2. Structure of the dataset to train models

OGCSBN_2023_v39n2_207_t0002.png 이미지

OGCSBN_2023_v39n2_207_f0003.png 이미지

Fig. 3. Missing ratio of datasets. The LST dataset took 57.91% missing ratio because it is retrieved only clear sky pixels. There were slight incresments of the missing ratio on L1B because the GK-2A conducts wheel-offloading at UTC 6 from August to December to provide a high pointing accuracy once of day.

3. 연구방법

3.1. 제안하는 심층 신경망 모델

제안하는 심층신경망은 지상기온을 추정하기 위해 16개 밴드정보나 태양정보를 특성(feature)으로 받는 입력층과, 4개의 은닉층(hidden layers) 그리고 1개의 지상 기온을 산출하는 출력층으로 구성되어 있다(Fig. 4). 모든 층은 완전연결계층(fully connected layer)으로 연결되고 배치 정규화(batch normalization)와 leaky rectified linear unit (ReLU) 함수를 통과하게 된다. 배치 정규화(식 1)는 각각의 층에서 입력 받은 데이터의 분포를 정규화하는 것으로 일반적으로 기계학습 분야에서 학습 속도와 성능을 높여 주는 것으로 알려져 있다(Loffe and Szegedy, 2015; Santurkar et al., 2018). Leaky ReLU 함수(식 2)는 비선형 함수로 변수들의 선형 관계에서 추측하기 어려운 관계를 찾기 위해 사용되는 활성함수의 하나로 기존에 단순하 구조를 갖는 ReLU 함수의 문제점 중 하나인 역전파(backpropagation) 과정에서 발생할 수 있는 기울기 소실(vanishing gradient) 문제를 해소하고 어떤 특성이 죽는 현상을 방지할 수 있는 함수로 DNN을 활용한 회귀문제에 많이 사용되고 있다(Agarap, 2018; Dubey and Jain, 2019).

\(\begin{aligned}\hat{x}=x-\frac{E[x]}{\sqrt{\operatorname{Var}[x]}}\end{aligned}\)       (1)

x: Sample of a minibatch

\(\begin{aligned}\hat{x}\end{aligned}\): Normalized sample with zero mean

Var[x]: Standard deviation for minibatch

E[x]: Mean of minibatch

\(\begin{aligned}f(x)=\begin{cases} a x, & x<0 \\ x, & x \geq 0\end{cases} \end{aligned}\)       (2)

a: Negative slope, default is 0.01.

OGCSBN_2023_v39n2_207_f0004.png 이미지

Fig. 4. Structure of the proposed deep neural network to predict a ground air temperature from 16 bands data of L1B. Every single neurons except the output is composed with a batch normalization function and leaky rectified linear unit (ReLU) function.

DNN 모델은 구축된 데이터세트에서 2020년과 2021년 자료를 사용해 학습하고 첫번째로 오직 16개 원시밴드 자료만 사용하여 입력층에서 16개 특성을 갖는DNN 모델과 두 번째로 밴드별 주야간 특성을 고려하여 태양의 천정각, 고도각, 방위각 그리고 균시차 정보를 추가해 20개의 특성을 받는 DNN 모델로 구성하였다.

3.2. 모델의 검증 및 분석

먼저, 제안한 DNN 모델의 성능을 평가하기 위해 GK-2A LST와 지상기온의 회귀모델을 기준모델로 설정하고 심층신경망 학습을 통해 얻은 DNN 모델로 추정한 2022년의 지상기온을 지상에서 관측된 자료와 비교하였다. 이때 평가지표로 RMSE를 사용하고 모델의 결정계수(coefficient of determination, R2)를 비교하였다. 다음으로 DNN 모델의 계절분석을 통해 계절에 따른 DNN 산출물의 특징을 분석하고 시간에 따른 일 변동 특성을 살펴본다. 마지막으로 AMI 센서는 4개의 가시 채널을 갖으므로 태양의 청전각, 방위각, 고도각 등 태양정보 추가에 따른 DNN 모델의 개선점을 살펴본다.

4. 연구결과 및 토의

본 연구에서는 GK-2A 위성 L1B 16개 밴드자료를 이용해 지상기온을 추정하는 심층신경망 모델을 제시하였다. 먼저 모델의 성능을 평가하기 위해 기준모델로 같은 기간 LST를 이용한 기온과의 선형회귀 모델을 채택해 그 결과를 비교하고, 심층신경망 모델의 결과를 계절과 시간별로 구분하여 DNN 모델의 특징을 분석하였다. 또한 태양위치 정보 추가에 따른 모델성능을 알아보기 위해 태양 천정각, 고도각, 방위각, 그리고 균시차 정보를 추가한 두 번째 모델을 생성하여 개선된 모델의 특징을 알아보았다. 모든 모델의 훈련기간은 동일하게 2020년과 2021년의 데이터세트를 사용하였으며, 이하 결과 분석에는 2022년의 데이터세트를 사용해 산출된 모델 자료를 사용하였다.

4.1. 심층신경망모델 성능 비교

지상기온을 추정하기 위한 심층신경망의 성능을 가늠하기 위해 Fig. 5(a)에서 기준모델인 GK-2A 위성의 LST 산출물과 지상관측 기온의 단순 선형회귀모델의 성능을 나타내었다. 그 결과 RMSE 가 3.55℃로 나타났으며 결정계수(R2)는 0.9로 나타났다. 여기서 LST는 Level 2에 해당하는 위성 산출물로 구름탐지 정보를 참고해 구름이 없는 맑은 하늘 픽셀에서만 산출된다. 따라서 Fig. 5(b–d)에서 심층신경망 모델의 결과를 같은 맑은 하늘 조건과 그 외에 흐린 조건 그리고 구름 여부에 관계없이 전체 기간으로 구분하여 분석하였다. 구분조건은 LST 산출 알고리즘에 따라 산출유무에 따라 맑은 하늘 조건과 흐린 하늘 조건을 구분하였다. 맑은 날에 산출된 DNN 모델의 지상기온 산점도의 성능지표는 RMSE 2.22℃로 나타났으며 R2 0.96으로 기준모델보다 개선된 지표를 보여주었다. 하지만 0℃ 이하에서 일부 실제 측정된 기온보다 과대 추정되는 특징을 보였다. LST가 산출된 맑은 조건 외에 구름이 존재하는 경우 산출된 DNN 모델의 지상기온 산점도를 분석해보면 RMSE 4.05℃로 기준모델보다 높게 나타났지만, 모든 구름조건에 대한 전체결과 산점도를 분석해보면 RMSE 3.34℃, R2 0.9로 기준모델보다 좋은 성능지표를 나타냈다.

OGCSBN_2023_v39n2_207_f0005.png 이미지

Fig. 5. Scatter plots of the air temperature retrieved with the linear regression model and deep neural network models in 2022, the test year. (a) The linear regression model indicated that RMSE is 3.55℃. (b) It showed 2.22℃ RMSE that the result of DNN on clear sky conditions. (c) The results excepted clear sky conditions showed 4.05℃, but (d) it was improved than the baseline model that all samples with 3.34℃ RMSE.

4.2. 계절별

계절에 따라 분류한 DNN 모델 결과와 지상에서 관측된 기온의 사이의 특징을 분석하기 위해 계절을 12, 1, 2월(DJF), 3, 4, 5월(MAM), 6, 7, 8월(JJA), 9, 10, 11월(SON)로 구분하였다(Fig. 6). 검증기간에 해당하는 2022년의 겨울(Fig. 6a)에 RMSE 4.1℃로 가장 높게 나타났으며 R2는 0.42로 가장 낮게 나타나면서 오직 16개 밴드정보를 활용한 DNN 모델 결과에서 가장 낮은 신뢰도를 보이는 계절로 나타났다. 특히 낮은 기온구간에서 일부 과대 산출되는 경향을 보였다. 봄(Fig. 6b)에는 RMSE 3.07℃, R2 0.8로 두번째로 낮은 오차와 가장 높은 결정계수를 보여주었다. 여름(Fig. 6c)에는 RMSE 2.9℃로 가장 낮게 나타났지만 R2는 0.51로 사계절 중 두 번째로 낮게 나타났다. 가을(Fig. 6d)에는 RMSE 3.15℃, R2 0.79로 나타났으며 겨울과 마찬가지로 낮은 기온구간에서 과대 산출되는 경향을 나타냈다. 계절별로 RMSE는 낮은 순으로 여름, 봄, 가을 그리고 겨울로 나타났고, 결정계수는 높은 순으로 봄, 가을, 여름 그리고 겨울로 나타났다. 지상 기온 분포분석에서 뚜렷한 기온의 계절특징을 보이는 겨울과 계절에 inter quatile range (IQR)의 Q1에 해당하는 –1.8℃와 21.2℃보다 낮은 기온에서 오차가 커지는 공통적인 특징을 보였다.

OGCSBN_2023_v39n2_207_f0006.png 이미지

Fig. 6. Seasonal scatter plots between in-situ air temperature and the results of DNN model. (a) DJF showed the highest RMSE, 4.10℃ with the lowest coefficient of determination (R2), 0.42. (b) MAM showed RMSE 3.07℃, but it was the highest R0.8. (c) JJA showed RMSE 2.9℃ with R0.51. (d) SON showed RMSE 3.15℃ with R0.79.

4.3. 시간별

제안한 DNN 모델 결과와 관측된 기온 사이의 일 변동에 따른 특징을 알아보기 위해 RMSE와 결정계수를 시간에 따라 분석하였다(Fig. 7). Fig. 7에 막대그래프는 RMSE를 나타내며 녹색의 진하기는 RMSE가 높은 순으로 나열하였다. 별(☆)은 결정계수를 나타내며 0.5 이상은 빨간색, 0.0 미만은 파란색으로 제시하였다. 시간에 따른 RMSE의 변화를 살펴보면 전체기간(a) 동안 오전에는 7시(3.8℃)에 가장 높고 오후에는 15시(3.05℃)에 가장 낮게 나타났다. 계절별로는 겨울(b)에 오전 8시(5.5℃)에 가장 높게 나타났고 15시(2.69℃)에 가장 낮게 나타났다. 오전/오후에 따른 RMSE가 가장 높게 나타나는 시간은 봄(c)에는 오전 6시(3.27℃), 오후 6시(3.37℃)에, 여름(d)에는 오전 4시(2.91℃), 오후 7시(3.29℃)에, 가을(e)에는 오전 7시(3.61℃), 오후 4시(3.36℃)에 가장 높은 RMSE를 보였다. 평균 결정계수와 그 분산(variance)은 전체기간(a) 동안 0.9에 0.01을 보였다. 계절별로는 겨울(b)에는 0.25에 0.21을 나타내면서 가장 낮은 평균 R2와 높은 분산을 보였다. 봄(c)에는 0.73 에 0.03, 여름(d)에는 0.35에 0.11를 보였고, 가을(e)에는 0.74에 0.04를 보였다(Table 3). 시간에 따른 일 변동에서 모델의 분산의 높다는 것은 시간대별로 모델의 성능이 달라지는 것을 의미함으로 개선이 필요하다.

OGCSBN_2023_v39n2_207_f0007.png 이미지

Fig. 7. Daily changes of RMSE and Rbetween in-situ air temperature and the results of DNN model. The bars filled with green sorting values are RMSE and the stars are R2, negatives filled with blue, 0.0–0.5 filled with white, over 0.5 filled with red. The mean and standard deviation of Rshowed (a) all are 0.90, 0.01, (b) DJF are 0.25, 0.21, (c) MAM are 0.73, 0.03, (d) JJA are 0.35, 0.11, and (e) SON are 0.74, 0.04.

Table 3. Daily RMSE, correlation coefficient, and coefficient between in-situ air temperature and the model result using 16 bands L1B data

OGCSBN_2023_v39n2_207_t0003.png 이미지

4.4. 태양정보를 추가한 심층신경망

16개 밴드를 사용한 심층신경망 모델에서 계절에 따른 다른 특징과 시간에 따른 일 변동의 주기성을 나타내면서 태양의 천정각, 고도각, 방위각, 균시차 정보를 추가하여 20개 특성을 입력 받는 DNN 모델을 생성하고 그 결과를 분석하였다.

Fig. 8에서 태양정보를 추가한 DNN 모델을 계절별로 분석한 결과, RMSE와 결정계수가 각각 겨울(a)에는 3.36℃에 0.61로 가장 높은 RMSE와 낮은 R2를 보였다. 봄(b)에는 2.85℃에 0.83, 여름(c)에는 2.39℃에 0.67, 가을에는 2.64℃에 0.85를 보이면서 모든 계절에서 기존에 16개 밴드를 사용한 DNN 모델보다 나은 성능을 나타냈다.

OGCSBN_2023_v39n2_207_f0008.png 이미지

Fig. 8. Seasonal scatter plots between in-situ air temperature and the results of DNN model appending solar information. (a) DJF showed the highest RMSE, 3.36℃, with the lowest R0.61. (b) MAM showed RMSE 2.85℃ with R0.83. (c) JJA showed the lowest RMSE, 2.39℃, with R0.67. (d) SON showed RMSE 2.64℃ with the highest R0.85.

OGCSBN_2023_v39n2_207_f0009.png 이미지

Fig. 9. Daily changes of RMSE and Rbetween in-situ air temperature and the results of DNN model appending solar information. The mean and standard deviation of Rshowed (a) all are 0.925, 0.009, (b) DJF are 0.482, 0.101, (c) MAM are 0.77, 0.03, (d) JJA are 0.561, 0.031, and (e) SON are 0.82, 0.019.

일 변동에 따른 분석에서 모든 시간대에 RMSE가 모두 감소하였고 시간에 따른 그 변동경향은 유사하게 나타났다. R2는 겨울을 제외한 모든 계절에서 0.5 이상을 나타냈고 전체기간(a) 동안 평균 결정계수는 0.92에 0.01의 편차를 보였다. 계절별로 평균 결정계수와 그 편차는 겨울(b)에는 0.48에 0.1로 가장 낮은 평균 결정계수와 높은 편차를 보였다. 봄(c)에는 0.77에 0.03, 여름(d)에는 0.56에 0.03, 가을(e)에는 0.82에 0.02의 편차를 보이면서 모든 계절에서 16개 밴드 자료만을 사용한 DNN 모델보다 나은 성능을 보여주었다.

Table 4. Daily RMSE, correlation coefficient, and coefficient between in-situ air temperature and the results of DNN model appending solar information

OGCSBN_2023_v39n2_207_t0004.png 이미지

5. 결론

본 연구에서는 천리안위성 2A호의 관측자료를 활용한 지상기온 산출을 목적으로 AMI 센서에서 관측된 원시데이터에 복사와 위치보정을 마친 L1B 자료를 사용하여 지상기온을 산출하였다. 지상기온 산출에 사용된 모델은 심층신경망 모델로 구름에 의한 마스크 없이 모든 픽셀에 대해서 디지털 숫자로 표현되는 16개 밴드정보를 입력자료로 사용하였다. 연구기간 중 2020년과 2021년은 훈련기간으로 2022년을 검증기간으로 사용하였다. 그 결과 기준모델로 채택된 GK-2A LST 산출물과 지상기온의 선형회귀 모델은 RMSE 3.55℃에 R2 0.9를 보였고 같은 맑은 하늘 픽셀 조건에서만 산출된 오직 16개 밴드자료만을 사용한 DNN 모델이 RMSE 2.22℃에 R2 0.96을 나타내면서 기준모델보다 우수한 성능을 보여주었다. 맑은 조건을 제외한 구름의 영향이 있는 흐린 조건에서 RMSE 4.05℃에 R2 0.83을 나타냈지만 모든 조건에서 RMSE 3.34℃에 결정계수 0.9로 기준모델보다 나은 성능을 보여주면서 구름에 의한 방해를 극복할 수 있을 것으로 보여진다. 제시한 모델이 기준모델 보다 나은 성능을 보여주면서 모델 결과에 대하여 계절과 시간에 따라 특징을 살펴본 결과 봄과 가을에 RMSE와 R2가 각각 3.07℃에 0.8, 3.15℃에 0.79를 나타냈지만 겨울에는 4.1℃에 0.42를 보이면서 가장 높은 RMSE와 낮은 R2을 나타냈다. 여름에는 RMSE 2.9℃로 가장 낮은 오차를 보였지만 결정계수가 0.51에 그쳤다. 결정계수의 일 변동을 분석한 결과 전체 평균 결정계수는 0.9에 0.01의 편차를 보였으며 계절별로 모든 시간에 대한 결정계수의 평균과 그 편차가 봄과 가을에 각각 0.73에 0.03, 0.74에 0.04를 보였지만 겨울에 0.25에 0.21로 가장 낮은 평균 R2와 높은 편차를 나타내면서 가장 설명력이 떨어지는 계절로 나타났고 그 다음으로 여름이 0.35에 0.11로 나타났다. 오직 16개 밴드정보를 이용한 DNN 모델에서 계절별로 다른 특징과 시간대별로 RMSE와 R2의 일 변동이 주기성이 띄면서 태양의 영향을 추가한 DNN 모델을 생성하고 평가한 결과, 모든 계절에서 RMSE가 감소하고 R2가 증가하였다. 무엇보다 시간별 분석에서 겨울을 제외한 모든 계절의 R2가 0.5 이상을 나타내면서 모든 시간대에 DNN 모델의 성능 향상을 볼 수 있었으며, 겨울에는 여전히 낮은 0.48의 평균 R2와 높은 0.1 분산을 보이면서 모델의 설명력이 떨어졌지만 태양정보 추가에 따른 유의미한 성능 향상이 있었다. 이번 연구를 통해 향후 GK-2A의 L1B자료를 사용한 정확한 지상기온산출을 위해 해결해 나가야 할 문제는 다음과 같다. 1) Fig. 5에 따르면 DNN모델의 RMSE가 구름에 따라 큰 차이를 보이면서 구름을 고려한 모델의 필요, 2) Fig. 6과 Fig. 8에 따르면 겨울철 RMSE가 가장 크게 나타났고 낮은 온도범위에서 오차가 커지는 문제, 3) Figs. 7, 9에 따르면 일 변동에 따른 계절별 결정계수의 편차 문제를 해결해야 한다.

사사

본 연구는 2022년 수도권기상청 재원으로 ‘스마트 드론 윈드길 및 도시 열정보지도 서비스 기술개발(2022-0263-10)’ 사업의 지원을 받아 수행한 결과이며, 이에 감사드립니다.

Conflict of Interest

No potential conflict of interest relevant to this article was reported.

References

  1. Agarap, A. F., 2018. Deep learning using rectified linear units (ReLU). arXiv preprint arXiv:1803.08375. https://doi.org/10.48550/arXiv.1803.08375
  2. Beltrami, H., 2001. On the relationship between ground temperature histories and meteorological records: a report on the Pomquet station. Global and Planetary Change, 29(3-4), 327-348. https://doi.org/10.1016/S0921-8181(01)00098-4
  3. Bendix, J., Thies, B., Cermak, J., and Nauss, T., 2005. Ground fog detection from space based on MODIS daytime data-A feasibility study. Weather and Forecasting, 20(6), 989-1005. https://doi.org/10.1175/WAF886.1
  4. Chen, N., Li, W., Gatebe, C., Tanikawa, T., Hori, M., Shimada, R., and Stamnes, K., 2018. New neural network cloud mask algorithm based on radiative transfer simulations. Remote Sensing of Environment, 219, 62-71. https://doi.org/10.1016/j.rse.2018.09.029
  5. Choi, Y. Y. and Suh, M. S., 2018. Development of Himawari-8/Advanced Himawari Imager (AHI) land surface temperature retrieval algorithm. Remote Sensing, 10(12), 2013. https://doi.org/10.3390/rs10122013
  6. Choi, Y. Y. and Suh, M. S., 2020. Development of a land surface temperature retrieval algorithm from? GK2A/AMI. Remote Sensing, 12(18), 3050. https://doi.org/10.3390/rs12183050
  7. Chung, J. H., Lee, Y. G., and Kim, S. J., 2018. A Study on the air temperature prediction of South Korea using multiple linear regression model and MODIS LST. In Proceedings of the 2018 Korean Society of Agricultural Engineers Annual Conference, Yesan, Republic of Korea, Nov. 1-2, p. 235.
  8. Chung, J. H., Lee, Y. G., and Kim, S. J., 2019. Assessment of surface temperature mitigation effects of wetlands during heat and cold waves using daytime and nighttime MODIS land surface temperature. Journal of Wetlands Research, 21(spc), 123-133. https://doi.org/10.17663/JWR.2019.21.S-1.123
  9. Cuomo, V., Lasaponara, R., and Tramutoli, V., 2001. Evaluation of a new satellite-based method for forest fire detection. International Journal of Remote Sensing, 22(9), 1799-1826. https://doi.org/10.1080/01431160120827
  10. Dubey, A. K. and Jain, V., 2019. Comparative study of convolution neural network's relu and leaky-relu activation functions. In: Mishra, S., Sood, Y., Tomar, A. (eds.), Applications of computing, automation and wireless systems in electrical engineering, Springer, pp. 873-880. https://doi.org/10.1007/978-981-13-6772-4_76
  11. Fu, G., Shen, Z., Zhang, X., Shi, P., Zhang, Y., and Wu, J., 2011. Estimating air temperature of an alpine meadow on the Northern Tibetan Plateau using MODIS land surface temperature. Acta Ecologica Sinica, 31(1), 8-13. https://doi.org/10.1016/j.chnaes.2010.11.002
  12. Gultepe, I., Pagowski, M., and Reid, J., 2007. A satellite-based fog detection scheme using screen air temperature. Weather and Forecasting, 22(3), 444-456. https://doi.org/10.1175/WAF1011.1
  13. Han, J. H., Suh, M. S., Yu, H. Y., and Roh, N. Y., 2020. Development of fog detection algorithm using GK2A/AMI and ground data. Remote Sensing, 12(19), 3181. https://doi.org/10.3390/rs12193181
  14. Hong, S. O., Byon, J. Y., Park, H., Lee, Y. G., Kim, B. J., and Ha, J. C., 2018. Sensitivity analysis of near surface air temperature to land cover change and urban parameterization scheme using unified model. Atmosphere, 28(4), 427-441. https://doi.org/10.14191/ATMOS.2018.28.4.427
  15. Jee, J. B., Lee, K. T., and Choi, Y. J., 2014. Analysis of land surface temperature from MODIS and Landsat satellites using by AWS temperature in capital area. Korean Journal of Remote Sensing, 30(2), 315-329. https://doi.org/10.7780/kjrs.2014.30.2.13
  16. Jones, P., Jedlovec, G., Suggs, R., and Haines, S., 2004. Using MODIS LST to estimate minimum air temperatures at night. In Proceedings of the 2004 13th Conference on Satellite Meteorology and Oceanography, Norfolk, VA, USA, Sept. 20-23, pp. 13-18.
  17. Kim, J. H., Lim H. C., and Yoo, S. H., 2021. Assessing the socioeconomic value of utilizing the geostationary orbit: The case of GEO-KOMPSAT-2A. Innovation Studies, 16(1), 159-185. https://doi.org/10.46251/INNOS.2021.2.16.1.159
  18. Kim, H. M., Jeong, J. H., Kim, H., Park, C. G., Kim, B. J., and Kim, S. B., 2020. Effects of observation network density change on spatial distribution of meteorological variables: Three-dimensional meteorological observation project in the Yeongdong region in 2019. Atmosphere, 30(2), 169-181. https://doi.org/10.14191/ATMOS.2020.30.2.169
  19. Kim, D., Gu, M., Oh, T. H., Kim, E. K., and Yang, H. J., 2021. Introduction of the advanced meteorological imager of GEO-KOMPSAT-2A: In-orbit tests and performance validation. Remote Sensing, 13(7), 1303. https://doi.org/10.3390/rs13071303
  20. Lee, D. C., Won, K. M., Park, M. A., Choi, H. S., Jung, S. H., 2018. An analysis of mass mortalities in aquaculture fish farms on the Southern Coast in Korea. Ocean Policy Research, 33(1), 1-16. https://doi.org/10.35372/kmiopr.2018.33.1.001
  21. Lee, H. D., Min, K. H., Bae, J. H., and Cha, D. H., 2020. Characteristics and comparison of 2016 and 2018 heat wave in Korea. Atmosphere, 30(1), 1-15. https://doi.org/10.14191/Atmos.2020.30.1.001
  22. Liu, H., Zhou, Q., Zhang, S., and Deng, X., 2019. Estimation of summer air temperature over China using Himawari-8 AHI and numerical weather prediction data. Advances in Meteorology, 2019, Article ID 2385310. https://doi.org/10.1155/2019/2385310
  23. Liu, S., Su, H., Tian, J., Zhang, R., Wang, W., and Wu, Y., 2017. Evaluating four remote sensing methods for estimating surface air temperature on a regional scale. Journal of Applied Meteorology and Climatology, 56(3), 803-814. https://doi.org/10.1175/JAMC-D-16-0188.1
  24. Loffe, S. and Szegedy, C., 2015. Batch normalization: Accelerating deep network training by reducing internal covariate shift. arXiv preprint arXiv: 1502.03167. https://doi.org/10.48550/arXiv.1502.03167
  25. Mihalakakou, G., Santamouris, M., and Asimakopoulos, D., 1994. Use of the ground for heat dissipation. Energy, 19(1), 17-25. https://doi.org/10.1016/0360-5442(94)90101-5
  26. Park, J., Bok, J., Oh, H., and Lim, H., 2016. Development of radiometric calibration system for AMI. In Proceeding of the 2016 14th International Conference on Space Operations, Daejeon, Korea, May 16-20, p. 2325. https://doi.org/10.2514/6.2016-2325
  27. Philip, S. Y., Kew, S. F., Van Oldenborgh, G. J., Anslow, F. S., Seneviratne, S. I., Vautard, R., and Otto, F. E., 2022. Rapid attribution analysis of the extraordinary heat wave on the Pacific coast of the US and Canada in June 2021. Earth System Dynamics, 13(4), 1689-1713. https://doi.org/10.5194/esd-13-1689-2022
  28. Santurkar, S., Tsipras, D., Ilyas, A., and Madry, A., 2018. How does batch normalization help optimization?. arXiv preprint arXiv:1805.11604. https://doi.org/10.48550/arXiv.1805.11604
  29. Shen, S. and Leptoukh, G. G., 2011. Estimation of surface air temperature over central and eastern Eurasia from MODIS land surface temperature. Environmental Research Letters, 6(4), 045206. https://doi.org/10.1088/1748-9326/6/4/045206
  30. Shin, H., Chang, E., and Hong, S., 2014. Estimation of near surface air temperature using MODIS land surface temperature data and geostatistics. Spatial Information Research, 22(1), 55-63. https://doi.org/10.12672/ksis.2014.22.1.055
  31. Tao, Y., Gao, X., Hsu, K., Sorooshian, S., and Ihler, A., 2016. A deep neural network modeling framework to reduce bias in satellite precipitation products. Journal of Hydrometeorology, 17(3), 931-945. https://doi.org/10.1175/JHM-D-15-0075.1
  32. Terliksiz, A. S. and Altylar, D. T., 2019. Use of deep neural networks for crop yield prediction: A case study of soybean yield in Lauderdale county, Alabama, USA. In Proceedings of the 2019 8th International Conference on Agro-Geoinformatics, Istanbul, Turkey, July 16-19, pp. 1-4. https://doi.org/10.1109/Agro-Geoinformatics.2019.8820257
  33. Toan, N. T., Cong, P. T., Hung, N. Q. V., and Jo, J., 2019. A deep learning approach for early wildfire detection from hyperspectral satellite images. In Proceedings of the 2019 7th International Conference on Robot Intelligence Technology and Applications, Daejeon, Korea, Nov. 1-3, pp. 38-45. https://doi.org/10.1109/RITAPP.2019.8932740
  34. Xu, G. and Zhong, X., 2017. Real-time wildfire detection and tracking in Australia using geostationary satellite: Himawari-8. Remote Sensing Letters, 8(11), 1052-1061. https://doi.org/10.1080/2150704X.2017.1350303
  35. Yang, Y., Cai, W., and Yang, J., 2017. Evaluation of MODIS land surface temperature data to estimate near-surface air temperature in Northeast China. Remote Sensing, 9(5), 410. https://doi.org/10.3390/rs9050410
  36. Yeom, J. M., Park, S., Chae, T., Kim, J. Y., and Lee, C. S., 2019. Spatial assessment of solar radiation by machine learning and deep neural network models using data provided by the COMS MI geostationary satellite: A case study in South Korea. Sensors, 19(9), 2082. https://doi.org/10.3390/s19092082
  37. Yoo, C., Im, J., Park, S., and Quackenbush, L. J., 2018. Estimation of daily maximum and minimum air temperatures in urban landscapes using MODIS time series satellite data. ISPRS Journal of Photogrammetry and Remote Sensing, 137, 149-162. https://doi.org/10.1016/j.isprsjprs.2018.01.018