The Estimation of Arctic Air Temperature in Summer Based on Machine Learning Approaches Using IABP Buoy and AMSR2 Satellite Data

Han, Daehyeon;Kim, Young Jun;Im, Jungho;Lee, Sanggyun;Lee, Yeonsu;Kim, Hyun-cheol;

doi:10.7780/kjrs.2018.34.6.2.10

Korean Journal of Remote Sensing (대한원격탐사학회지)

Volume 34 Issue 6_2
/
Pages.1261-1272
/
2018
/
1225-6161(pISSN)
/
2287-9307(eISSN)

Korean Society of Remote Sensing (대한원격탐사학회)

DOI QR Code

The Estimation of Arctic Air Temperature in Summer Based on Machine Learning Approaches Using IABP Buoy and AMSR2 Satellite Data

기계학습 기반의 IABP 부이 자료와 AMSR2 위성영상을 이용한 여름철 북극 대기 온도 추정

Han, Daehyeon (School of Urban and Environmental Engineering, Ulsan National Institute of Science and Technology) ;
Kim, Young Jun (School of Urban and Environmental Engineering, Ulsan National Institute of Science and Technology) ;
Im, Jungho (School of Urban and Environmental Engineering, Ulsan National Institute of Science and Technology) ;
Lee, Sanggyun (Centre for Polar Observation and Modelling, University College London) ;
Lee, Yeonsu (School of Urban and Environmental Engineering, Ulsan National Institute of Science and Technology) ;
Kim, Hyun-cheol (Unit of Arctic Sea-Ice Prediction, Korea Polar Research Institute)

한대현 (울산과학기술원 도시환경공학부) ;
김영준 (울산과학기술원 도시환경공학부) ;
임정호 (울산과학기술원 도시환경공학부) ;
이상균 (런던대학교 극지관측및모델링센터) ;
이연수 (울산과학기술원 도시환경공학부) ;
김현철 (극지연구소 북극해빙예측사업단)

Received : 2018.12.19
Accepted : 2018.12.20
Published : 2018.12.31

https://doi.org/10.7780/kjrs.2018.34.6.2.10 Citation PDF KSCI HTML

Download PDF

⟨ Previous Next ⟩

Abstract

It is important to measure the Arctic surface air temperature because it plays a key-role in the exchange of energy between the ocean, sea ice, and the atmosphere. Although in-situ observations provide accurate measurements of air temperature, they are spatially limited to show the distribution of Arctic surface air temperature. In this study, we proposed machine learning-based models to estimate the Arctic surface air temperature in summer based on buoy data and Advanced Microwave Scanning Radiometer 2 (AMSR2)satellite data. Two machine learning approaches-random forest (RF) and support vector machine (SVM)-were used to estimate the air temperature twice a day according to AMSR2 observation time. Both RF and SVM showed $R^2$ of 0.84-0.88 and RMSE of $1.31-1.53^{\circ}C$. The results were compared to the surface air temperature and spatial distribution of the ERA-Interim reanalysis data from the European Center for Medium-Range Weather Forecasts (ECMWF). They tended to underestimate the Barents Sea, the Kara Sea, and the Baffin Bay region where no IABP buoy observations exist. This study showed both possibility and limitations of the empirical estimation of Arctic surface temperature using AMSR2 data.

북극 지역의 대기 온도는 바다 및 해빙, 대기 사이의 에너지 교환에 큰 역할을 하므로 북극 대기 온도를 정확하게 파악하는 것은 중요하다. 하지만 현장 관측 자료들은 북극 대기 온도의 공간적인 분포를 나타내는 데에 한계가 있다. 따라서 본 연구에서는 부이(buoy) 자료와 Advanced Microwave Scanning Radiometer 2(AMSR2) 위성자료를 이용하여 기계학습 기반 여름철 대기 온도 추정 모델을 구축하였다. 기계학습으로는 random forest(RF) 및 support vector machine(SVM)을 사용하였으며, AMSR2 관측 시간에 따라 하루 두 번의 대기 온도를 추정하였다. 또한 추정된 대기 온도를 유럽 중기예보센터(European Centre for Medium-Range Weather Forecasts, ECMWF)의 ERA-Interim 재분석자료의 대기 온도와 공간 분포를 비교하였다. 교차 검증 결과 두 가지 기계학습 기법 모두 0.84-0.88의 $R^2$ 및 $1.31-1.53^{\circ}C$의 RMSE를 보였다. 공간적인 분포에서 IABP 부이 관측 자료가 존재하지 않는 바렌츠해(Barents Sea), 카라해(Kara Sea) 및 배핀만(Baffin bay) 지역에서는 기계학습 모델이 ERA-Interim 대기 온도에 비하여 과소 추정하는 경향을 보였다. 본 연구는 경험적인 북극 대기 온도 추정의 가능성과 한계점을 서술하였다.

Keywords

1. 서론

북극 대기 온도는 대기와 해양, 그리고 해빙의 상호작용에 큰 영향을 미치는 중요한 요소이며 이는 기후 예측 및 모델링 등 다양한 연구의 기본이 된다. 특히, 기후 변화에 따른 지구 온난화가 진행됨에 따라 북극 지역의 대기 온도는 저위도 지역에 비하여 더욱 민감하고 빠르게 변화하고 있기 때문에 보다 중요한 지표로 간주되며(Serrenze and Barry, 2011; Dodd et al., 2015), 지속적인 관측과 분석을 수행할 필요가 있다. 북극 대기 온도는 북극 지역의 국지적 기후 특성(local climate characteristics)을 대표하는 지표로 활용할 수 있으며(Zhou et al., 2018), 지표면의 에너지 밸런스 및 복잡한 물리적 관계를 규명하는데 활용된다. 또한 북극 대기 온도는 북극의 복사 균형의 변화가 지구 전체의 변화보다 두드러지는 북극 증폭(arctic amplification)의 척도를 측정하는 주요 지표로도 활용되고 있다(Francis and Vavrus, 2015; Cohen et al., 2014, Serreze and Barry, 2011). 이러한 북극의 대기 온도를 관측하기 위하여 여러 국가 및 기관에서 지상 관측소, 인공위성, 선박 및 부이 등을 운용하고 있다.

지상 관측소의 경우 북극에 인접한 국가들이 알래스카, 시베리아, 그린란드, 북부 캐나다 등지에 다양한 관측소를 설치하여 관측을 수행하고 있으며, 대표적으로 미국 해양대기청(National Oceanic and Atmospheric Administration, NOAA)에서 제공하는 전 세계 9,000여 개 이상의 관측소의 자료를 바탕으로 제작된Global Surface Summary of the Day(GSOD)가 있다(https://data.noaa.gov/dataset/dataset/global-surface-summary-of-the-day-gsod). 북극 해상 및 해빙지역에서는 부이를 이용한 관측이 이뤄지며, 대표적으로 the International Arctic Bouy Programme(IABP)에서 운영하는 표류 부이 자료가 있다. IABP에서는 1979년부터 꾸준히 대기 온도, 대기압, 해빙의 표류 및 속도에 대한 자료를 6-12시간 간격으로 제공하고 있다(https://nsidc.org/data/G00791). 그 중 대기 온도는 2 m 높이에서 덮개로 보호된 온도계를 통해 관측되고 있다.

인공위성 관측 자료는 대표적으로 미국 항공우주국(National Aeronautics and Space Administration, NASA)의 Aqua 위성탑재체인 Advanced Microwave Scanning Radiometer - Eth Observing System(AMSR-E) 및 일본 항공우주국(Japan Aerospace Exploration Agency, JAXA)의 Global Change Observation Mission 1st-Water(GCOM-W1) 위성의 the Advanced Microwave Scanning Radiometer 2(AMSR2) 센서로부터 전 지구의 육상지역에 대하여 매일 획득 및 제공되는 최고 및 최저온도 자료가 있다(https://nsidc.org/data/NSIDC-0451). 또한 유럽 중기예보 센터 (European Centre for Medium-Range Weather Forecasts, ECMWF)에서 제공하는 ERA-Interim 및 NASA에서 제공하는 Modern-Era Retrospective analysis for Research and Applications(MERRA) 등과 같이 다양한 종류의 관측 자료를 자료 동화 및 수치해석 모델로 재가공한 대기 온도 재분석자료가 있다. 이 외에, National Snow & Ice Data Center(NSIDC)에서 NASA의 각종 위성에서 얻어지는 자료를 활용하여 북극 대기 온도의 변화를 시·공간적으로 분석할 수 있도록 제공하고 있다(https://nsidc.org/soac). 하지만, 널리 활용되는 재분석자료는 상대적으로 공간해상도가 낮으며 기초가 되는 관측자료가 대부분 육상 관측자료에 의존한다는 한계가 있다.

지상 관측소 자료의 경우 넓은 영역에 비해 상대적으로 관측소 자체의 수가 많지 않고 그 관측 기록이 시간적으로 짧은 특성을 가지고 있으며(Dodd et al., 2015) 지상의 대기 온도에 대한 측정이 이루어지기 때문에 해상 및 해빙지역의 대기 온도 자료가 없다. 또한 위성 관측 영상은 북극 지역에 대하여 꾸준하고 연속적이며 높은 공간 해상도의 확보를 통한 상세한 관측이 가능한 장점이 있지만(Merchant et al., 2013), 현재 제공되는 위성관측기반 대기 온도 자료의 경우 일 최고 및 최저기온만 제공이 되고 있을 뿐만 아니라 육상에 대해서만 제공이 되기 때문에 해상 및 해빙지역의 대기 온도를 파악하는 데에는 한계가 있다(Du et al., 2017). 반면 부이를 이용한 실측자료의 경우 해상 및 해빙지역의 대기온도(0.1°C 미만의 오차), 대기압 등의 자료를 정확히 알 수 있으며(Rigor, 2002) 기존 육지에 초점이 맞추어진 관측 자료의 한계를 극복할 수 있다는 장점이 있다.

북극의 대기 온도와 관련된 연구는 꾸준히 진행되어 왔지만 대다수의 연구는 북극 대기 온도의 과거 패턴의 분석을 통한 기후 변화 및 북극의 환경 변화에 대한 연구에 초점을 맞추고 있으며, 대기 온도 자체의 추정에 대한 연구는 상대적으로 미흡한 실정이다. 각 의 현장 관측 자료를 이용한 연구도 있지만, 대부분의 연구는 광역적인 분석이 가능한 ERA-Interim 2 m 대기 온도와 같은 재분석자료나 Climatic Research Unit Temperatureversion 4(CRUTEM4) 및 HadCRUT4 등과 같은 수치 모델 자료를 활용하고 있다(Cowtan et al., 2014). 이러한 연구 경향은 상대적으로 접근이 제한된 극지방의 어려운 현장 관측과 더불어 주기적으로 수축과 팽창을 반복하는 해빙의 특성상 고정된 위치에서의 꾸준한 관측의 어려움으로 인하여 재분석자료 및 수치 모델에 의존한 연구가 진행되고 있는 것으로 보인다(Dodd et al., 2015). 북극의 대기 온도를 추정하는 연구는 상대적으로 많지 않은 실정이며, 국내보다는 국외에서 주로 이루어지고 있다. 또한 수치·기후 모델을 활용한 추정 및 관측자료를 활용한 공간 분포 추정을 활용한 연구가 주로 이루어지고 있다. 대표적으로 Zhou et al.(2018)은 관측자료(태양복사 및 알베도)를 지역기후모델인 HIRHAM5 모델을 활용하여 북극 지역의 대기 온도를 추정한 뒤 GSOD 관측소 자료 및 ERA-Interim 재분석자료와 비교하여 정확도를 분석하였다. 계절에 따른 대기 온도에 대한 모의가 잘 이루어졌으나, 지상관측소 관측 자료를 활용했기 때문에 실제 북극 해상 및 해빙지역의 대기 온도를 추정하기에는 한계가 있다. IABP 부이 자료를 활용한 북극 대기온도와 관련된 연구는 관측 자료 분석을 통한 극지방의 기후변화 탐지 및 재분석자료나 기후 모델과의 비교를 통한 정확도 검증이 있다. Rigor et al.(2000)은 1979년부터 1997년 사이의 부이 관측자료를 바탕으로 북극지역의 꾸준한 기온상승을 관측하였고, Liu et al.(2008)은 북극 해양에 대한 NCEP2 및 ERA40 재분석자료와 IABP 부이 관측 대기온도가 전반적으로 일치하는 것을 확인 하였으며 광역 기후 자료인 Intergovernmental Panel on Climate Change - the Fourth Assessment Report(IPCC-AR4)와 비교하여 차이 및 이유를 분석하였다. 하지만 해당 부이 자료를 이용하여 해상 및 해빙지역에서의 대기 온도를 추정하는 연구는 활발하지 않은 상황이다.

앞서 언급한 한계점과 관련하여 본 연구에서는 해상 및 해빙지역의 대기 온도를 잘 반영할 수 있는 부이 관측자료를 이용하여 위성 기반 대기 온도를 추정하였다. 높은 시간 해상도와 구름에 의한 영향을 최소화하기 위하여 수동 마이크로파 센서인 AMSR2 자료를 이용하여 위성 시간에 맞춰서 하루 두 차례의 대기 온도를 추정하였다. 관측자료를 이용한 경험적인 모델을 만들기 위하여 기계학습 기법 중 random forest(RF) 및 support vector machine(SVM)을 이용하였으며, 그 결과를 부이의 대기 온도 관측값 및 ERA-Interim 재분석자료의 대기 온도와 비교 분석하였다. 나아가 추정된 대기온분포를 ERA-Interim 재분석자료와 공간적으로 비교 및 분석하였다.

2. 연구 지역 및 자료

1) 연구지역 및 IABP 부이 자료

본 연구는 북극의 해상 및 해빙 지역을 대상으로 수행되었다(Fig. 1). 현장 관측 자료로는 IABP에서 제공하는 부이 자료 중 2013년부터 2016년까지의 여름철(6-9월) 자료를 이용하였다. IABP에서는 현재 러시아 지역을 제외한 북극 지역에서 약 34개의 부이를 통해 대기 온도를 제공하고 있으며, 실시간으로 자료를 수신 및 취합하여 배포한다. IABP의 부이는 해빙에 설치되며 2 m 높이에서 덮개로 보호된 센서로 대기 온도를 관측하고 있다. 따라서 본 연구에서 다루는 대기 온도의 관측값은 2 m 높이의 대기 온도이다.

OGCSBN_2018_v34n6_2_1261_f0001.png 이미지

Fig. 1. The study area of this study.

2) AMSR2 위성자료

AMSR2는 일본의 GCOM-W1 위성에 탑재된 수동 마이크로파 위성이다. AMSR2는 2012년 5월에 발사되었으며, 700 km 상공의 고도에서 하루에 두 번(ascending: 오후 1시 30분, descending: 오전 1시 30분) 해당 지역을 관측한다. 탑재된 센서는 6, 7, 10, 18, 23, 36, 89 GHz의 주파수 영역에서 자료를 수집하며, 이중 편파 채널로 구성되어 있다. 일본기상청은 Global Portal System(https://gportal.jaxa.jp)에서 AMSR2 밝기온도 자료 및 산출물을 제공한다. 본 연구에서는 2013년부터 2016년의 6-9월에 해당하는 10 km 공간 해상도의 일별 7가지 채널의 ascending 및 descending 모드의 밝기 온도를 다운로드하여 자료를 구축하였다.

3) ERA-Interim 재분석자료

ERA-Interim은 ECMWF에서 제공하는 전지구적 대기 재분석 자료이며, 1979년부터 현재까지의 자료가 지속적으로 제공된다. ERA-Interim 재분석자료는 00시부터 3시간 간격의 2 m 높이의 대기 온도를 제공하며, 본 연구에서는 부이 자료의 날짜와 일치하는 시점의 0.125° 해상도의 대기 온도 자료를 이용하였다.

3. 연구방법

본 연구의 전반적인 흐름도는 Fig. 2와 같다. 먼저 2013년부터 2016년도까지의 IABP 부이 자료를 수집한 후, 해당 날짜에 해당하는 AMSR2 위성자료 및 ERA-Interim 재분석자료를 수집하였다. 모델 학습 및 성능 비교를 위하여 세 자료 간의 시간 및 공간 일치 작업을 수행하였다. 기계학습 모델의 성능 검증을 위하여 추정된 대기 온도를 부이 자료의 대기 온도와 비교하는 교차 검증을 수행하였다. 마지막으로 공간적인 분포를 비교하기 위하여 2016년에 대한 추정된 일별 대기 온도 분포를 평균하여 월별 공간분포를 구한 뒤, ERA-Inteim 월별 대기 온도와 분석하였다.

OGCSBN_2018_v34n6_2_1261_f0002.png 이미지

Fig. 2. Overall scheme of this study. Red box represents the process of building machine learning models and green box shows the process of validation methods.

1) 자료 구축

연구에 필요한 자료를 구축하기 위하여 2013년부터 2016년까지의 여름철 IABP 부이 대기 온도 자료, AMSR2 밝기 온도 자료, 그리고 ERA-Interim 대기 온도 자료를 수집하였다.

수집된 자료들의 시간 및 공간 해상도가 다르기 때문에 이를 일치시켜주는 작업이 수행되었다. 본 연구의 목적이 AMSR2 자료를 이용한 대기 온도 추정이기 때문에, 시간은 AMSR2의 관측 시간인 오후 1시 30분(ascending)과 오전 1시 30분(descending)이 기준이 되었다. 해당 시간의 부이 자료를 구축하기 위하여 오후 1시부터 2시 및 오전 1시부터 2시까지의 부이 대기온도 관측자료를 수집하였다. 오후 1시부터 2시까지의 부이 대기 온도 관측 자료를 평균하여 오후 1시 30분 대기 온도로 사용하였고(ascending time), 같은 방법으로 오전 1시부터 2시까지의 부이 자료를 평균하여 오전 1시 30분의 대기 온도로 사용하였다(descending time). 부이 자료를 AMSR2 관측 시간인 오후 1시 30분과 오전 1시 30분 부근으로 맞추지 못한 이유는, IABP에서는 여러 부이가 있으며 부이마다 시간을 제공하는 간격이 다소 다르나 일반적으로 1시간 간격으로 자료를 제공하기 때문이다. 본 연구에서 수집한 오전 및 오후 1시-2시 사이의 부이 중, 1시 및 2시 정각에 제공되는 부이가 전체의 92.5%를 차지했다. 따라서 AMSR2 관측 시간에 획득된 자료를 구하기 힘들며 분 단위의 시간 분포도 다르기 때문에, 1시부터 2시까지의 모든 부이 자료를 평균하여 ascending time 및 descending time의 자료로 이용하였다. ERA-Interim 대기 온도 자료 또한 시간에 대하여 선형 보간을 실시하였다. AMSR2 관측 시간인 오전 및 오후 1시 30분과 가장 가까운 시간의 ERA-Interim 자료는 오전 및 오후 12시와 3시의 자료이다. 이 둘을 평균하여 AMSR2의 관측 시간에 해당하는 자료로 이용하였다.

공간적인 보간의 경우 관측 자료인 부이의 위치를 기준으로 삼았다. 평균적으로 부이 지점과 가장 가까운 AMSR2 격자 중심의 거리는 약 3800 m이며, 공간적인 오차를 줄이기 위하여 부이 지점에 해당하는 AMSR2 밝기온도를 bilinear 기법을 이용하여 보간하였다. 같은 방법으로 ERA-Interim 자료 또한 bilinear 기법을 이용하여 부이 위치에 해당하는 값을 추출하였다. 또한 기계학습 모델의 성능을 비교하기 위하여 이 지점에 해당하는 ERA-Interim 재분석자의 대기 온도 값을 추출하였다. 결과적으로 ascending 및 descending 시간대에 부이의 위치에 해당하는 ASMR2 밝기온도 및 ERA-Interim 대기 온도 자료가 구축되었다. 본 연구에서 사용한 월별 부이의 대기 온도의 공간적 분포는 Fig. 3와 같으며, AMSR2의 위성 시간에 따른 부이 분포는 Table 1와 같다. 수집된 부이 대기 온도 자료의 히스토그램은 Fig. 4와 같다. 마지막으로 기계학습을 이용한 대기 온도 추정 값과 ERA-Interim 대기 온도 사이의 공간적 차이를 분석하기 위하여 ERA-Interim 대기 온도를 AMSR2 격자에 맞춰 resampling 하였다.

OGCSBN_2018_v34n6_2_1261_f0003.png 이미지

Fig. 3. The distribution of air temperature from IABP buoy data in the summer of 2013-2016.

Table 1. The distribution of buoy data used in this study

OGCSBN_2018_v34n6_2_1261_t0001.png 이미지

OGCSBN_2018_v34n6_2_1261_f0004.png 이미지

Fig. 4. The histogram of buoy data from Jun.-Sep. between 2013-2016.

2) 기계학습 기법

(1) Random forest

RF는 대표적인 규칙 기반 및 앙상블 알고리즘으로, 반복적인 이진 분할을 통해 결과를 도출하는 분류 및 회귀 트리(Classification and Regression Tree, CART)로 구성되어 있다(Breiman, 2001). 단일 의사결정 트리는 결과에 대한 원인을 해석하기 쉽다는 장점이 있으며, 원격 탐사 분야의 다양한 분류 및 회귀 분야에 널리 사용되어 왔다. 하지만 단일 트리는 학습자료에 매우 민감하기 때문에 종종 과적합이 발생한다. 이러한 문제를 해결하기 위하여 RF는 학습 자료 중 일부를 무작위 추출하여 여러개의 독립적인 트리를 생성한다. 각 CART의 분기점에서 변수를 결정하기 위해 통계적 분산 값인 Gini 인덱스를 사용한다. 각각의 트리의 결과를 다수결 투표(분류) 혹은 평균(회귀)하여 최종 결과를 생성하는데, 이러한 앙상블 과정을 통하여 학습 데이터에 대한 과적합을 줄이며 안정적인 결과를 산출한다. 또한 사용되지 않은 샘플(out of bag, OOB)을 이용한 내부 검증을 통한 오차를 이용하여 상대적인 변수 중요도를 제공한다. RF는 여러 원격탐사 분야의 분류 및 회귀 문제에 널리 사용되어 왔다(Jang et al., 2017; Yoo et al., 2018).

(2) Support vector machine

SVM은 다차원 공간에 초평면(hyper plane)을 구성하여 훈련 샘플을 별도의 범주로 나누어 샘플을 선형으로 분리할 수 있는 학습 알고리즘이다. SVM은 입력 샘플을 특징 공간(feature space)에 선형으로 분리할 수 있다고 가정하지만, 서로 다른 클래스의 데이터 포인트는 겹칠 수 있으므로 샘플을 선형으로 분리하는 데 어려움이 있다. 이러한 문제를 해결하기 위해 SVM은 커널(kernel)이라고 불리는 함수를 사용하여 더 높은 차원으로 데이터를 투영한다. 원격탐사 분야에서는 일반적으로 방사기저함수(Radial basis function, RBF)가 널리 사용된다(Jang et al., 2017; Sonobe et al., 2017; Wang et al., 2018). 본 연구에서는 선형 커널 및 RBF 커널의 결과를 비교한 후, 더 좋은 성능을 보여주는 RBF 커널을 이용하였다.

4. 결과 및 토의

1) 기계학습 모델 성능 비교

대기 온도 추정 모델의 성능을 비교하고자 본 연구에서는 10-fold 교차 검증을 수행하였다(Fig. 5). 10-fold 교차 검증은 모델의 성능을 측정하기 위하여 전체 샘플을 10등분하여 9개의 부분 샘플을 학습 자료로 이용하여 모델을 구축하고, 나머지 1개의 부분 샘플을 검증 자료로 이용하는 방법이다. 검증의 대상이 되는 부분 샘플을 교체하면서 반복적으로 10번 검증하며, 샘플을 상호 배타적으로 분할해 결과적으로 전체 샘플에 대하여 모델을 평가하기 때문에 모델의 정확도를 추정하는데 널리 이용되고 있다(Yoo et al., 2018). 또한 기계학습으로 추정된 대기 온도의 결과와 비교하기 위하여 ERA-Interim 재분석자료의 대기 온도 또한 부이 관측 자료를 이용하여 검증하였다(Fig. 5). 붉은 색 선은 1대 1 비율을 나타내며 검은 색 선은 해당 모델의 결과와 부이 자료와의 선형적인 관계를 나타낸다. RF의 경우 ascending 시간대에서 SVM에 비해 높은 R²값과 낮은 RMSE값을 보였으나, descending 시간대에서는 SVM이 더 높은 R²와 낮은 RMSE값을 보였다. RF와 SVM 모두 비교적 높은 온도에서는 과소 추정을 하는 반면 낮은 온도 구간에서는 과대 추정하는 경향을 보였다. 이는 Fig. 3에서 볼 수 있듯이 대기 온도 분포의 불균형 때문으로 보이는데, 0°C 부근에서의 값에 비해 5°C 이상 및 -5°C 이하의 샘플 수가 급격히 감소하는 것을 확인할 수 있다. 결과적으로 비교적 높은 온도 및 낮은 온도에서의 샘플의 비율이 적기 때문에 해당 구간에서의 모의력이 떨어지는 것으로 보이며, 부족한 샘플을 보강하는 오버샘플링(over-sampling) 기법을 통해 개선될 수 있을 것으로 기대할 수 있다. ERA-Interim 재분석자료의 대기 온도는 기계학습 기반의 대기 온도 추정 값에 비해 ascending 및 descending 시간대 모두 낮은 R²값과 높은 RMSE를 보였다. 재분석자료의 낮은 해상도는 지역적인 대기 온도를 반영하지 못하며 과대·과소 추정되는 경우가 있는데(Tang et al., 2018), 부이 관측 지점에 비해낮은 해상도가 국지적인 대기 온도의 차이를 잘 반영하지 못한 것으로 보인다.

OGCSBN_2018_v34n6_2_1261_f0005.png 이미지

Fig. 5. Validation results for RF and SVM models and ERA-Interim air temperature in ascending and descending times compared with buoy air temperature, where red line shows 1:1 ratio and black line represents the fitted line of the data.

2) 공간적 분포 비교

대기 온도 추정 모델의 공간적인 모의 능력을 비교하기 위하여 2016년 여름에 대하여 일별 대기온도 추정 값을 구한 후 해당 시간의 ERA-Interim 재분석자료의 대기 온도와 비교하였다. Fig. 6에서는 2016년 여름철의 기계학습을 이용해 추정된 월별 대기 온도 분포와 ERA-Interim의 월별 대기 온도를 비교하였다. Fig. 7에서는 기계학습을 이용한 월별 대기 온도 추정 값과 ERA-Interim 재분석자료의 월별 대기 온도 값의 차이를 비교하였다. 온도 차이는 기계학습을 이용해 추정된 대기 온도에서 ERA-Interim 재분석자료의 대기 온도를 뺀 것으로, 양의 값은 모델의 과대추정을 의미하고 음의 값은 과소추정을 뜻한다. RF와 SVM 모두 북극 전반적으로 재분석 자료에 비해 과소추정을 하였으며(Fig. 7), 그 크기는 대부분 7월 및 8월의 바렌츠해 및 카라해 부근에서 가장 크게 나타난다. 북극 중심 및 보퍼트해(Beaufort Sea) 부근에서는 RF와 SVM 모델 모두 ERA-Interim 자료와의 차이가 6-9월에 모두 약 -3°C에서 3°C이내로 나타났다(Fig. 7). 하지만 재분석자료에 따르면 바렌츠해(Barents sea), 카라해(Kara Sea), 그리고 배핀만(Baffin Bay)에서 10°C 부근의 대기 온도를 확인할 수 있는 반면, RF와 SVM 모델 모두 해당 지역의 대기 온도를 재분석 자료에 비해 5°C 이상 과소 추정하고 있다(Fig. 6 and Fig. 7). 이러한 현상에는 두 가지 해석을 제시할 수 있는데, 먼저 Fig. 5의 검증 결과에서 볼 수 있듯이, 두 모델 모두 비교적 높은 대기 온도 구간에서 과소 추정을 하고 있기 때문으로 여겨진다. 또한 Fig. 3의 부이 분포를 확인했을 때 심한 과소 추정이 일어나는 바렌트해, 카라해 및 배핀만에는 관측 값이 없지만, Fig. 6의 ERA-Interim 재분석자료의 대기 온도를 통해서 해당 지역들의 대기 온도가 부이가 관측된 지점들에 비해 높다는 것을 확인할 수 있다. 그 결과 해빙에서는 모델을 통해 추정된 대기 온도 자료가 재분석자료와 일치하는 공간 분포를 보이는 반면 일부 해상에서는 재분석자료에 비해 과소추정을 하는 것으로 나타난다. 북극 전 영역에 대한 관측 자료가 골고루 수집된다면 모델 성능이개선될 것으로 기대할 수 있다.

OGCSBN_2018_v34n6_2_1261_f0006.png 이미지

Fig. 6. Spatial distribution of onthly air temperature of random forest, support vector machine, and ERA-Interim reanalysis data in the summer of 2016.

OGCSBN_2018_v34n6_2_1261_f0007.png 이미지

Fig. 7. Monthly bias distribution between estimated air temperatures from machine learning models and ERA-Interim reanalysis data in the summer of 2016.

모델과 재분석자료와의 평균적인 차이를 보면, 모든 경우에 걸쳐 전반적으로 모델이 재분석자료에 비해 과소추정을 하였다(Table 2). 하루 내의 시간별 차이를 나타내는 ascending과 descending 시간에서는 새벽 1시 30분을 나타내는 descending 시간에서의 차이가 더욱 크게 나타났다. 이는 대기 온도만으로는 분석할 수 없는 한계점이 있으며, 추후 다른 변수들과의 상관성을 통해 대기 온도의 일 변화를 분석할 필요가 있다.

Table 2. Bias between models and ERA-Interim (°C)

OGCSBN_2018_v34n6_2_1261_t0002.png 이미지

앞서 제시한 모델의 성능 평가 및 공간적 분석을 통해 본 연구의 가능성 및 한계점을 확인할 수 있었다. 본 연구의 가장 큰 한계점은 제한된 관측자료이다. 관측자료의 개수, 공간적 분포, 그리고 대기 온도 분포의 불균형으로 인해 비교적 관측 자료가 적은 해상에서 부족한 모의력을 보였다. 이러한 문제는 추후에 IABP 부이 자료 이외에 다양한 관측 자료를 이용한다면 개선될 것으로 보이며, 특히 러시아 부근의 자료를 보강한다면 바렌츠해 및 카라해 부근에서도 모의력이 크게 향상될 것으로 기대할 수 있다.

5. 결론

본 연구는 북극 해빙 및 해상 지역에서의 대기 온도를 추정하기 위하여 AMSR2 자료와 IABP 부이 자료를 이용하여 기계학습 기반의 대기 온도 추정 모델을 구축하였다. 2013년부터 2016년까지의 AMSR2의 ascending 및 descending 시간에 부근의 부이 자료 및 ERA-Interim 재분석 자료의 대기 온도를 수집하였다. AMSR2의 ascending 시간은 낮 1시 30분이므로 낮 1시부터 2시까지의 부이 자료를 이용하여 이용하였으며, descending 시간은 밤 1시 30분이므로 밤 1시부터 2시까지의 부이 자료를 이용하여 시간 및 공간 보간을 하였다. ERA-Interim 자료의 경우 오전 및 오후 12시와 3시의 자료를 이용하여 AMSR2 위성 관측 시간에 맞춰 선형 보간하였다. AMSR2 수평/수직 밝기온도를 모두 이용하여(6, 7, 10, 18, 23, 36. 89 GHz) 총 14개의 입력 변수가 RF 및 SV 기계학습의 입력 변수로 쓰였다. 전체 자료를 10-fold 교차 검증한 결과 두 모델은 각각 ascending 및 descending 시에 대해 약 0.84-0.88의 R²와 1.31-1.53°C의 RMSE를 보였다. 모델을 이용해 추정된 대기 온도를 ERA-Interim 재분석자료와 비교한 공간 분포에서는, 7-9월에 바렌츠해, 카라해 및 배핀만에서 과소 추정하는 결과를 보였다. 이는 부이 자료가 대부분 북극 중심 및 보퍼트해 부근에 위치한 반면, 바렌츠해, 카라해 및 배핀만에는 관측 결과가 없기 때문에 해당 지역들의 정보가 충분히 학습되지 않은 것으로 판단된다. 이것은 기계학습 기법의 한계이며, 향후 해당 지역의 관측 자료를 통해 샘플을 추가한다면 더 정확한 북극의 해빙 및 해상에서의 대기 온도를 추정할 수 있을 것으로 기대한다.

사사

이 논문은 극지연구소의 ‘북극 해빙 위성관측을 위한 분석 기술 개발(PE18120)’ 연구의 지원을 받았으며, 이에 감사드립니다.

References

Breiman, L., 2001. Random forests, Machine Learning, 45(1): 5-32. https://doi.org/10.1023/A:1010933404324
Cohen, J., J. A. Screen, J. C. Furtado, M. Barlow, D. Whittleston, D. Coumou, J. Francis, K. Dethloff, J. O. Entekhabi, and J. Jones, 2014. Recent Arctic amplification and extreme mid-latitude weather, Nature Geoscience, 7(9): 627. https://doi.org/10.1038/ngeo2234
Comiso, J. C., D. J. Cavalieri, C. L. Parkinson, and P. Gloersen, 1997. Passive microwave algorithms for sea ice concentration: A comparison of two techniques, Remote sensing of Environment, 60(3): 357-384. https://doi.org/10.1016/S0034-4257(96)00220-9
Cowtan, K. and R. G. Way, 2014. Coverage bias in the HadCRUT4 temperature series and its impact on recent temperature trends, Quarterly Journal of the Royal Meteorological Society, 140(683): 1935-1944. https://doi.org/10.1002/qj.2297
Dodd, E. M., C. J. Merchant, N. A. Rayner, and C. P. Morice, 2015. An investigation into the impact of using various techniques to estimate Arctic surface air temperature anomalies, Journal of Climate, 28(5): 1743-1763. https://doi.org/10.1175/JCLI-D-14-00250.1
Du, J., L. A. Jones, and J. S. Kimball, 2017. Daily Global Land Parameters Derived from AMSR-E and AMSR2 (Version 2.0), National Snow and Ice Data Center(NSIDC), Boulder, CO, USA.
Francis, J. A. and S. J. Vavrus, 2015. Evidence for a wavier jet stream in response to rapid Arctic warming, Environmental Research Letters, 10(1): 014005. https://doi.org/10.1088/1748-9326/10/1/014005
Jang, E., J. Im, G. H. Park, and Y. G. Park, 2017. Estimation of fugacity of carbon dioxide in the East Sea using in situ measurements and Geostationary Ocean Color Imager satellite data, Remote Sensing, 9(8): 821. https://doi.org/10.3390/rs9080821
Liu, J., Z. Zhang, Y. Hu, L. Chen, Y. Dai, and X. Ren, 2008. Assessment of surface air temperature over the Arctic Ocean in reanalysis and IPCC AR4 model simulations with IABP/POLES observations, Journal of Geophysical Research: Atmospheres, 113(D10).
Merchant, C. J., S. Matthiesen, N. A. Rayner, J. J. Remedios, P. D. Jones, F. Olesen, B. Trewin, P. W. Thorne, R. Auchmann, G. K. Corlett, P. C. Guillevic, and G. C. Hulley, 2013. The surface temperatures of Earth: steps towards integrated understanding of variability and change, Geoscientific Instrumentation, Methods and Data Systems, 2(2): 305-321. https://doi.org/10.5194/gi-2-305-2013
Rigor, I., 2002. IABP drifting buoy, pressure, temperature, position, and interpolated ice velocity, National Snow and Ice Data Center, Boulder, CO, USA.
Rigor, I. G., R. L. Colony, and S. Martin, 2000. Variations in surface air temperature observations in the Arctic, 1979-1997, Journal of Climate, 13(5): 896-914. https://doi.org/10.1175/1520-0442(2000)013<0896:VISATO>2.0.CO;2
Serreze, M. C. and R. G. Barry, 2011. Processes and impacts of Arctic amplification: A research synthesis, Global and Planetary Change, 77 (1-2): 85-96. https://doi.org/10.1016/j.gloplacha.2011.03.004
Sonobe, R., Y. Yamaya, H. Tani, X. Wang, N. Kobayashi, and K. I. Mochizuki, 2017. Assessing the suitability of data from Sentinel-1A and 2A for crop classification, GIScience & Remote Sensing, 54(6): 918-938. https://doi.org/10.1080/15481603.2017.1351149
Tang, G., A. Behrangi, Z. Ma, D. Long, and Y. Hong, 2018. Downscaling of ERA-Interim Temperature in the Contiguous United States and Its Implications for Rain-Snow Partitioning, Journal of Hydrometeorology, 19(7): 1215-1233. https://doi.org/10.1175/JHM-D-18-0041.1
Wang, L., H. Liu, H. Su, and J. Wang, 2018. Bathymetry retrieval from optical images with spatially distributed support vector machines, GIScience & Remote Sensing, 2018: 1-15.
Yoo, C., J. Im, S. Park, and L. J. Quackenbush, 2018. Estimation of daily maximum and minimum air temperatures in urban landscapes using MODIS time series satellite data, ISPRS Journal of Photogrammetry and Remote Sensing, 137: 149-162. https://doi.org/10.1016/j.isprsjprs.2018.01.018
Zhou, X., H. Matthes, A. Rinke, B. Huang, K. Yang, and K. Dethloff, 2019. Simulating Arctic 2-m air temperature and its linear trends using the HIRHAM5 regional climate model, Atmospheric Research, 217: 137-149. https://doi.org/10.1016/j.atmosres.2018.10.022

Cited by

Classification models for chemotherapy recommendation using LGBM for the patients with colorectal cancer vol.26, pp.7, 2018, https://doi.org/10.9708/jksci.2021.26.07.009

Korean Journal of Remote Sensing (대한원격탐사학회지)

The Estimation of Arctic Air Temperature in Summer Based on Machine Learning Approaches Using IABP Buoy and AMSR2 Satellite Data

기계학습 기반의 IABP 부이 자료와 AMSR2 위성영상을 이용한 여름철 북극 대기 온도 추정

Abstract

Keywords

1. 서론

2. 연구 지역 및 자료

1) 연구지역 및 IABP 부이 자료

2) AMSR2 위성자료

3) ERA-Interim 재분석자료

3. 연구방법

1) 자료 구축

2) 기계학습 기법

(1) Random forest

(2) Support vector machine

4. 결과 및 토의

1) 기계학습 모델 성능 비교

2) 공간적 분포 비교

5. 결론

사사

References

Cited by

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)