DOI QR코드

DOI QR Code

The Study of DMZ Wildfire Damage Area Detection Method Using Sentinel-2 Satellite Images

Sentinel-2 위성영상을 이용한 DMZ 산불 피해 면적 관측 기법 연구

  • Lee, Seulki (Department of Smart Regional Innovation, Kangwon National University) ;
  • Song, Jong-Sung (Division of Science Education, Kangwon National University) ;
  • Lee, Chang-Wook (Division of Science Education, Kangwon National University) ;
  • Ko, Bokyun (Division of Science Education, Kangwon National University)
  • 이슬기 (강원대학교 스마트지역혁신학과) ;
  • 송종성 (강원대학교 과학교육학부) ;
  • 이창욱 (강원대학교 과학교육학부) ;
  • 고보균 (강원대학교 과학교육학부)
  • Received : 2022.09.21
  • Accepted : 2022.10.12
  • Published : 2022.10.31

Abstract

This study used high-resolution satellite images and supervised classification technique based on machine learning method in order to detect the areas affected by wildfires in the demilitarized zone (DMZ) where direct access is difficult. Sentinel-2 A/B was used for high-resolution satellite images. Land cover map was calculated based on the SVM supervised classification technique. In order to find the optimal combination to classify the DMZ wildfire damage area, supervised classification according to various kernel and band combinations in the SVM was performed and the accuracy was evaluated through the error matrix. Verification was performed by comparing the results of the wildfire detection based on satellite image and data by the wildfire statistical annual report in 2020 and 2021. Also, wildfire damage areas was detected for which there is no current data in 2022. This is to quickly determine reliable results.

본 연구는 직접적인 접근이 어려운 demilitarized zone (DMZ)의 산불 피해 지역을 파악하기 위하여, 고해상도 위성영상 및 머신러닝 기반의 감독 분류 기법을 이용하였다. 고해상도 위성 영상은 Sentinel-2 A/B를 이용하였으며, SVM 감독분류 기법을 기반으로 토지피복도를 산출하였다. DMZ 산불 피해 지역을 분류하기 위한 최적의 조합을 찾기 위하여 SVM 내에 다양한 커널과 밴드 조합에 따른 감독 분류를 진행하고 오차 행렬을 통해 정확도를 평가하였다. 또한, 2020년, 2021년은 위성영상 자료 기반의 산불 탐지 결과와 산불 연보의 피해 지역 면적 간의 비교를 통한 검증을 수행하였다. 이후, 현재 피해 면적 자료가 없는 2022년의 산불 피해 지역을 탐지함으로써 신뢰할 만한 수준의 결과를 신속적으로 파악하고자 하였다.

Keywords

1. 서론

산불은 생태계에 막대한 영향을 미치는 재난 중 하나이다. 지역 규모의 산불은 토양 미생물의 변화, 종자 발아와 생장 촉진을 야기할 수 있고, 국지 규모의 산불은 토사 유출, 수생생태계 변화 등과 같이 생태계의 급진적인 변화와 더불어 인명 및 재산 피해 등 많은 손실을 야기할 수 있다. 따라서 산불을 예방하는 것이 최우선이나, 산불 발생 이후 피해 복구 및 향후 산불 예방 계획 수립을 위한 정확한 피해지 파악도 중요하다. 산림청은 산림청 훈령 제1200호에 따라 현장에서의 목측, 실측을 바탕으로 항공사진, 2,500:1 지형도에 의해 산불 피해 지역을 산정한다(산불 관리 통합 규정 제33조). 산불 피해면적이 10 ha 이상일 경우, GPS 측량 장비를 활용하여 피해 면적을 산출하여 산불 피해 대장으로 관리하고 있다(Youn, 2020). 그러나 산불 피해 대장에는 발화지점의 주소만이 제시되어 있어 산불 피해 지역의 공간적 범위를 특정할 수 없는 단점이 있다. 더욱이 산불은 여러 행정 구역에 피해를 주기 때문에 발화 지점을 기반으로 한 공간분석은 산불 피해 지역 추산에 오차가 발생할 수 있다(Kim and Choi, 2020).

특히 대한민국은 분단국가로 중립지대인 비무장 지대(demilitarized zone, DMZ)가 존재한다. DMZ의 경우 민간인 통제구역으로, 군사분계선 이남 지역에 대한 산불 피해 면적만 조사하여 DMZ 전체 지역에 대한 정확한 산불 면적을 확인하기 어렵다는 한계가 있다. 그러나 DMZ 및 인근 지역은 군사작전, 산불 등과 같이 인위적, 자연적인 요인에 의해 생태계가 영향 받고 있다. 따라서 DMZ의 생태계 보전과 관리, 추후 산림복구 계획 수립등의 활용을 위해서는DMZ의 산림 현황을 파악하는 것이 필수적이다. DMZ와 같이 접근하기 어려운 지역은 원격탐사 기법을 적용한 연구가 다수 수행되고 있다. 특히 산불 등과 같은 특정 요소에 대한 관측을 위해서 위성영상을 활용한 토지 피복 분석을 적극적으로 활용하고 있다.

본 연구는 위성영상 자료 기반의 토지 피복 분석을 이용하여 2020~2022년 상반기까지 DMZ에서 발생한 산불 피해 지역을 탐지하였다. 또한 위성영상 자료 기반의 산불 탐지 결과와 산불 연보의 피해 지역 면적 간의 비교를 통한 검증을 수행하고자 한다. 이후, 차년도에 발간되는 산불 통계 연보의 특성으로 현재 자료가 없는 2022년의 산불 피해 지역을 탐지함으로써 신뢰할 만한 수준의 결과를 신속적으로 파악하고자 한다.

2. 연구지역

연구지역인 DMZ는 북방한계선과 남방한계선 일대이며, 남북 군사분계선(military demarcation line, MDL)으로부터 남북으로 각각 2 km씩 4 km 폭을 갖는 총 248 km의 비무장 지역이다(Fig. 1). 대한민국 DMZ는 1953년 7월 27일 ‘국제연합군 총사령관을 일방으로 하고 조선인민군 최고 사령관 및 중국 인민지원군 사령관을 다른 일방으로 하는 한국 군사 정전에 관한 협정’에 남북이 서명함으로써 설치되었으며, MDL을 기준으로 남북이 구분된다. 이 지역은 한국전쟁 이후 비무장지대없이 양측 세력이 완전히 맞닿아 있을 시 군사적 충돌이 발생할 가능성의 증가를 방지하고 국제적인 교통로를 확보하기 위하여 설치되었으며, 이러한 이유로 군대 주둔, 무기 배치, 군사시설의 설치, 민간인 출입을 금지한다. 따라서 DMZ는 남북한 분단이라는 정치적 상황으로 인해 군사적 목적 이외에는 40여 년 넘도록 사람들의 출입이 통제되었던 만큼, 종 1급수 어류뿐만 아니라 멸종 위기에 처해 있는 동식물 등 높은 생물 다양성과 생태환경이 다양한 것으로 알려져 있다. 따라서 남북통일이 이뤄지더라도 생태계 보존 및 다양한 연구 활용이 예상되는 지역이다(Kwon et al., 2021; In, 2013).

OGCSBN_2022_v38n5_1_545_f0001.png 이미지

Fig. 1. The location of DMZ area. The White line indicates the 38th parallel, and the Red line indicates the study area.

3. 연구자료 및 방법

1) 연구 자료

본 연구는 유럽우주국(European space agency, ESA)에서 제공하는 Sentinel-2A, Sentinel-2B 위성 영상 자료를 사용하였다. Sentinel-2 위성은 290 km 촬영 폭으로, 10일을 주기로 회전하며, Sentinel-2A, Sentinel-2B 위성체가 180° 떨어져 있기 때문에 대략 5일 주기로 촬영할 수 있다. 따라서 본 연구에서는 2020~2022년도 상반기(2022.01.01.~2022.06.30.) 자료를 사용하였다. 자료는 산불 발생 날짜에 맞추어 DMZ를 포함하고 있는 2개의 영상(T52SCH, T52SDH)을 검색하였다.

매년 산림청에서 국내 산불 면적을 조사, 정리하여 발행한 산불통계 연보는 차년도에 발행되므로 2020, 2021년의 자료는 산불통계 연보를 참고하였으나, 2022년 산불통계 연보는 발행되지 않았다. 따라서 2022년 산불 발생 일은NASA의 fire information for resource management system (FIRMS)의 자료를 참조하여 영상을 취득하였다. 또한, 본 연구에서 사용된 GIS 자료는 국토교통부에서 발행한 행정구역도를 이용하였으며, 읍면동 자료와 리자료는 법정동 자료를 이용하였다. 특히, 산불 통계 연보에서는 산불 발생 위치를 행정구역만으로 표기하기 때문에 Sentinel-2 위성영상과 GIS 자료를 이용하여 정확한 산불 발생 위치를 확인하였다(Table 1).

Table 1. Used data for DMZ wildfire damage area analysis

OGCSBN_2022_v38n5_1_545_t0001.png 이미지

2) 분류 기법

비선형 자료를 분류하는 관계들을 추정하는 기계학습 알고리즘이 많이 제안되고 있으며, 많이 쓰이는 방법에는 random forest (RF), artificial neural network (ANN), deep neural network (DNN), convolution neural network (CNN), support vectormachine (SVM) 등이 있다(Dietterich, 2000; Schmidhuber, 2015). 본 연구에서는 Sentinel-2 위성영상을 이용하여 DMZ 산불 피해 면적 분류에서 분류 알고리즘의 성능을 비교하기 위하여 많이 사용하고 있는 분류 기법인 ANN과 SVM 기법을 적용하였으며, SVM 기법을 적용한 결과의 성능이 우수했기 때문에 SVM 기법을 이용한 분류를 수행하였다.

(1) SVM 기법

SVM기법은 지도학습 중 하나의 방법으로 학습에 필요한 변수의 일부를 자동으로 결정함으로써 구조적 오류를 최소화시킬 수 있기 때문에 우수한 성능을 나타내는 학습 알고리즘이다(Choi et al., 2006; Jang, 2018). SVM은 서포트 벡터(support vector)와 마진(Margin)을 이용하여 분류를 위한 기준선을 정의하는 최적의 결정 경계(decision boundary)를 정의하는 모델이다(Melgani and Bruzzone, 2004). 이때 서포트 벡터는 결정 경계에 가장 가까이에 위치한 자료, 마진은 서포트 벡터와 결정 경계 사이의 거리를 의미한다(Kim et al., 2018). 그러나 SVM이 선형으로 결정 경계를 분리할 수 없는 자료의 경우 커널(kernel) 기법을 이용한다. 커널 기법은 입력 자료의 차원을 다차원 공간으로 투영(mapping)하여 최적의 결정 경계를 찾는 방법이다(Hsu et al., 2003; Maulik and Chakraborty, 2017; Kim et al., 2018). SVM은 데이터가 비선형인 경우, 적절한 초평면을 생성할 수 없기 때문에 특정한 함수를 이용하여 자료를 고차원으로 사상시키면, 학습 데이터가 특징 공간에서의 함수의 내적으로 표현된다. 하지만 이는 직접 계산이 불가하므로, 임의의 커널 함수를 사용하게 된다. SVM의 대표적인 선형 커널은 linear이 있으며, 비선형 커널은 polynomial, radial basis function (RBF), sigmoid 등이 있다(Kang et al., 2013; Youn, 2020). 커널을 사용하기 위해서는 정규화 매개변수 C와 커널 폭을 정의하는 매개변수 gamma를 설정해야 한다. SVM 기법을 사용하기 위해서는 커널 및 변수를 정의하는 것이 매우 중요하다. 본 연구에서는 원격 탐사 자료 분석 상용소프트웨어인 ENVI를 기반으로 알고리즘을 적용하였다.

3) 연구 방법

본 연구를 수행하기 위한 연구 과정은 Fig. 2와 같다. 먼저, 2020~2022년 상반기까지 산불 정보를 수집하였다. 매년 산림청에서 국내 산불 면적을 조사, 정리하여 발행한 산불통계 연보는 차년도에 발행되므로 2020년과 2021년의 산불 발생일자는 산불통계 연보를 기반으로 하였다(Korea Forest Service, 2020; 2021). 반면, 2022년은NASA에서 제공하는 FIRMS에서 DMZ의 산불 발생 정보를 확인하여 연구에 이용하였다.

OGCSBN_2022_v38n5_1_545_f0002.png 이미지

Fig. 2. The Flowchart of Data Processing.

앞서 획득한 2020~2022년 산불 발생 정보를 기준으로 Sentinel-2A/B의 영상을 수집하였다. Sentinel-2A/B의 영상은 대기 보정을 완료한 L2A (Level-2A) 영상을 산불 발생일자 전후로 찾아 수집하였다. 광학 위성영상은 촬영 당시 날씨의 영향을 많이 받으며 구름이 연구 지역을 뒤덮고 있는 경우 탐지가 불가능하므로 cloud cover 지수가 20% 내외인 자료를 우선으로 선정하였으며, cloud cover 지수가 높은 자료 중 산불 피해 지역을 확인할 수 있는 자료를 추가로 선정하였다.

수집한 자료는 Sentinel-2 multi spectral instrument(MSI)로, 총 13개의 밴드 영상을 받을 수 있다. 이때 각각의 밴드 영상은 공간 해상도가 상이하므로 다양한 밴드 조합(band composition)을 통한 분석이 불가능하다. 따라서 각 밴드 별 공간 해상도를 일치시키기 위해 리샘플링(resampling)을 진행하였다. 10 m의 해상도인 영상을 기준으로 모든 밴드의 크기를 10 m의 해상도로 리샘플링하였고, 이후 지표 피복 분류의 정확도를 높이기 위하여 리샘플링한 영상에서 산불 피해 지역을 추출하여 영상의 크기 조정을 진행하였다.

본 연구에서 수행하는 지표 피복 분류 결과의 검증을 위하여 대표 지역을 선정하여 SVM 모델의 커널 및 세팅 값, 지표 피복 분류 시 사용할 밴드 값을 테스트하고 결과 값의 오차 행렬을 이용하여 정확도를 계산하였다. 또한 분류 시 사용할 밴드 조합을 이용하여 산림청에서 발행한 산불통계 연보를 기반으로 2020~2021년 DMZ 산불 발생 지역에 대한 분류를 수행하고, 연보에 기록된 산불 피해 면적과 비교하여 연구 방법의 정확도를 평가하였다. 여기서 산불 통계 연보에 제시된 산불 발생위치는 좌표로 제시되어 있지 않고 행정구역을 바탕으로 제시되어 있어, 국토교통부에서 제시한 행정구역도를 GIS DB로 구축하였다. 이를 기반으로 산불 발생 위치를 추정하여 분류를 진행하였다. 이후, 테스트 결과를 통해 선정한 SVM 모델의 커널, 세팅 값 및 밴드 조합을 활용하여 DMZ 토지 피복 분류를 진행한 후, 월별 산불 피해 면적을 산출하여 위성영상을 이용한 DMZ 산불 피해 분석 가능성 및 데이터를 제시하고자 하였다.

4) 오차 분석 방법

오차 행렬은 머신 러닝에서 훈련을 통한 예측 성능을 측정하기 위해 실제 값과 예측값을 비교하기 위한 방법이다(Table 2). 머신러닝을 통해 분류 모델을 학습하는 것의 목적은 주어진 데이터를 사용자의 사용 의도에 적합하게 잘 분류하기 위한 것이다. 따라서 학습한 분류 모델이 주어진 데이터를 얼마나 정확하고 정밀하며, 실용적인 분류를 했는지 평가해야 한다. 이러한 분류 모델의 평가 방식으로 오차 행렬이 있다. 본 연구와 같은 지표 피복 분류 결과를 오차 행렬을 이용하여 평가할 때 감독 분류에서 사용하지 않은 독립적인 훈련 자료를 이용하여 감독분류에 의한 결과를 평가한다. 토지 피복도를 기반으로 한 실측값 대비 감독분류를 거쳐 예측된 값을 오차 행렬로 정리하여 예측 정확도를 평가하며, 예측정확도는 오차 행렬을 통해 산출된 일치도 계수(kappa coefficient)와 전체 정확도(overall accuracy)의 두 가지 값으로 표현할 수 있다(Song et al., 2018).

Table 2. Confusion Matrix

OGCSBN_2022_v38n5_1_545_t0002.png 이미지

이러한 오차 행렬은 true positive (TP), false negative (FN), false positives (FP), true negatives (TN) 총 4개의 값으로 표현된다. TP는 관심 범주를 정확하게 분류한 값 즉, 1인 값을 1이라 하는 경우이며, FN은 관심 범주에 속하는 값을 관심 범주가 아닌 것으로 잘못 분류한 것 즉, 1인 값을 0이라 하는 경우를 False라 한다. FP는 관심 범주에 속하는 값을 관심 범주라고 잘못 분류한 것, 즉 0인 값을 1이라 하는 경우이다. 마지막으로 TN은 관심 범주가 아닌 것을 정확하게 분류한 것으로 0인 값을 0이라 하는 경우를 의미한다. 이러한 4가지 정보를 바탕으로 정확도를 평가할 수 있다.

정확도는 1을 1로, 0을 0으로 정확하게 분류해낸 것을 의미한다. 즉, 정확도는 실제 데이터와 예측 데이터를 비교했을 때 얼마나 같은지를 판단하는 지표이다. 이러한 정확도는 식(1)로 표현할 수 있으며, 얼마나 올바르게 예측했는가에 대한 비율만으로 결정되어 직관적으로 모델 예측 성능을 나타낸다고 볼 수 있다. 따라서 정확도 값이 높을수록 예측 정확도가 높다고 할 수 있다.

\(\begin{aligned}Accuracy = \frac{TP+TN}{TP+TN+FP+FN}\end{aligned}\)       (1)

정확도는 전체 정확도, 생산자 정확도(producer accuracy), 사용자 정확도(user accuracy)와 같이 세 가지 정확도로 나타낼 수 있다. 전체 정확도는 오차 행렬에서 바르게 분류된 화소의 총합을 전체 검증 자료로 쓰인 화소로 나눈 정확도이며 식(2)로 나타낼 수 있다. 생산자 정확도는 분석가의 입장에서 특정 지역을 분류 기법이 얼마나 정확히 분류해 내는가 하는 관점에서 본 정확도이며 식(3)으로 나타낼 수 있다. 사용자 정확도는 사용자의 입장에서 생성된 자료가 전체적으로 실제 값과 얼마나 일치하는가를 나타내는 정확도이며 식(4)로 나타낼 수 있다(Jo et al., 2012; Kwak, 2015).

\(\begin{aligned}Overall \; Accuracy=\frac{\sum_{i=1}^{r} X_{i i}}{N}\\\end{aligned}\)       (2)

\(\begin{aligned}Producer \; Accuracy=\frac{X_{i i}}{X_{+i}}\\\end{aligned}\)       (3)

\(\begin{aligned}User\; Accuracy=\frac{X_{ii}}{X_{i+}}\end{aligned}\)       (4)

식(2), 식(3), 식(4)에서 Xii는 행(i)과 열(i)에서의 관측 수, Xi+, X+i는 행(i)과 열(i)에 대한 합계, N은 총 관측 수를 의미한다.

예측 정확도는 오차 행렬을 통해 산출된 일치도 계수와 전체 정확도의 두 가지 값으로 표현할 수 있다. 일치도 계수의 경우 0.8~1.0이면 분류가 최고로 잘 되었음, 0.6~0.8은 분류가 매우 잘 되었음, 0.4~0.6은 분류가 잘 되었음, 0.2~0.4는 분류가 합당한 수준임을 나타내며, 0~0.2는 분류가 불완전함, 0이하는 분류가 제대로 되지 않았음을 의미한다(Song et al., 2018).

또한, 성능 평가 지표로 intersection over union (IOU), precision, recall이 있다. IOU는 물체 검출을 평가할 수 있는 지표이다. 물체 검출은 실제 영역과 예측 영역을 비교하였을 때, 얼마나 정확하게 검출하였는지 판단하며 0~1사이의 값으로 결정되며, IOU 값이 클수록 예측이 잘 되었다고 평가하며 식(5)와 같다.

\(\begin{aligned}I O U=\frac{\text { Area of overlap }}{\text { Area of union }}=\frac{A_{P} \cap A_{g t}}{A_{P} \cup A_{g t}}\\\end{aligned}\)       (5)

여기서, AP는 예측 영역의 면적, Agt는 실제 영역의 면적을 나타낸다.

precision은 예측한 결과의 positive 결과가 얼마나 정확한지 계산하여 정밀도를 결정함으로써 과탐지에 대한 정보를 제공한다.

\(\begin{aligned}precision =\frac{TP}{TP+FP}\end{aligned}\)       (6)

recall은 예측한 결과가 얼마나 positive 값들을 잘 찾는지 측정함으로써 미탐지에 대한 정보를 제공한다.

\(\begin{aligned}recall = \frac{TP}{TP+FN}\end{aligned}\)       (7)

precision과 recall 역시 0~1사이의 값으로 결정되며, 반비례의 경향을 보인다. 이는 recall 값의 증가하면 오검출이 증가하며, 오검출 감소를 위해 조건을 강화하면 검출률이 떨어진다. 따라서 어느 한 값만으로 성능을 평가하는 것은 성능 평가의 신뢰도를 보장하기 어려우므로, 두 결과를 종합하여 알고리즘의 성능을 평가한다.

4. 연구결과

1) 산불 피해 면적 분류 정확도 검증

SVM의 감독분류 기법을 이용한 DMZ 지표 피복 분류 결과의 신뢰성을 보장하기 위해서는 적합한 밴드 조합과 커널을 선택이 필수적이다. 따라서 분류 결과의 오차 행렬을 이용하여 오차 분석을 수행함으로써 정확도를 검증하여 최적의 밴드 조합과 커널을 선정하였다.

Sentinel-2 위성 영상을 사용하여 산불 발생지역을 확인하고 분류하기 위하여 SWIR-NIR-G 위색 조합(False Color Composition)을 밴드 조합 1(밴드 12, 밴드 8, 밴드 4)로 설정하였다(Roteta and Oliva, 2020). 또한 R-NIR-G 위색 조합은 산불로 고사한 산림과 건강한 산림이 뚜렷한 분류를 나타낼 수 있어 밴드 조합 2(밴드 4, 밴드 8, 밴드 3)로 설정하였다(Park et al., 2019). 공간 해상도의 일관성을 유지하기 위하여 60 m에 해당하는 밴드 1, 밴드 9, 밴드 10을 제외한 나머지 밴드를 토지 피복 분류에 사용한 조합을 밴드 조합 3(밴드 2, 밴드 3 밴드 4, 밴드 5, 밴드 6, 밴드 7, 밴드 8, 밴드 8A, 밴드 11, 밴드 12)으로 설정하였다(Lee, 2021).

DMZ 산불 피해 지역을 관측하기 위한 최적의 조합을 찾기 위하여 SVM내에 다양한 커널과 밴드 조합에 따른 감독 분류를 진행하고 오차 행렬을 통해 정확도를 평가하였으며, SVM 모델 내에 존재하는 linear, polynomial, RBF, sigmoid 4가지 커널과 밴드 조합 1~3을 사용하여 지표 피복 분류를 수행하였다.

테스트 연구지역의 각 커널과 밴드 조합에 대한 결과값에 대하여 전체 정확도, 일치도 계수, IOU, precision, recall을 통해 정확도를 평가하고 산불 피해 면적 탐지를 위한 최적의 커널 및 밴드 조합을 확인하였다. 밴드조합별로 정확도와 일치도 계수를 비교하였을 때 각 밴드 조합 3개에 대하여 SVM커널 4개를 적용하여 비교하였다. 전체 정확도의 경우 밴드 조합 2와 sigmoid 커널을 적용하였을 때 최저값 95.7789%, 밴드 조합 3과 RBF 커널을 적용하였을 때 97.4910%로 최적값을 도출하였다. 일치도 계수는 밴드 조합 2와 sigmoid 커널을 적용하였을 때 최저값 0.9235, 밴드 조합 3과 RBF 커널을 적용하였을 때 0.9546으로 최적값을 도출하였다. IOU는 밴드 조합 2와 RBF 및 sigmoid 커널을 조합했을 때 최저값 0.9577, 밴드 조합 3과 RBF 커널을 적용하였을 때 0.9749로 최적값을 도출하였다. precision은 밴드 조합 1과 sigmoid 커널 조합에서 최적값 0.6551, 밴드 조합 3과 RBF 커널을 적용하였을 때 0.8635로 최적값을 도출하였다. Recall은 밴드 조합 1과 sigmoid 커널 조합에서 최저값 0.6282, 밴드 조합 3과 RBF 커널을 적용하였을 때 0.7661로 최적값을 도출하였다. 따라서 본 연구는 정확도 평가 지수의 모든 결과가 최적값을 나타낸 밴드 조합 3과 RBF 커널을 적용하였다(Table 3). 본 연구에서는 전체 정확도, 일치도 계수, IOU, precision, recall 결과가 가장 좋은 RBF, 밴드 조합 3 조합을 이용한 SVM모델을 선정하였고, 2020년부터 2022년 상반기까지 DMZ 산불 피해 지역 분류를 수행하였다.

Table 3. Table of error matrix results for the SVM model in the study area

OGCSBN_2022_v38n5_1_545_t0003.png 이미지

2) SVM 모델 기반의 산불 피해 면적 도출

2020~2021년에 발생한 DMZ 산불 정보는 산림청에서 제시한 산불 통계 연보에 제시된 DMZ의 산불 피해면적과 Sentinel-2 영상을 이용한 지표 피복 분류 결과를 비교하여 정확도 평가를 수행하였다. 우리나라에서는 보통 30 ha 이상의 피해 규모를 대형 산불로 분류하는데, 30 ha (0.3 km2)라고 하더라도 전 지구적으로 산불 탐지 정보를 제공하는 MODIS 위성의 산불 탐지 산출물에서 1개 화소 면적(1 km2)의 30%에 불과하여 초대형 산불 이외에는 항상 아화소(sub-pixel) 문제가 존재한다(Kim and Lee, 2020). 따라서 산불 통계 연보에 제시된 산불 면적 중, 30 ha 이상의 산불 발생 대상지를 조사하고, 지표 피복 분류를 통한 면적 정확도를 평가하고자 하였다. 이때, 산불 통계 연보에 제시된 산불 발생 지역의 경우, 발생 지역의 좌표가 아닌, 행정구역명으로 제시되기 때문에 이를 확인하기 위하여 국토교통부에서 제공하는 행정구역도를 바탕으로 산불 전후 기간의 영상을 비교하여 산불 발생 위치를 파악하였다(Table 4).

Table 4. Information of wildfires in the 2020 and 2021 DMZ using the wildfire statistical annual report

OGCSBN_2022_v38n5_1_545_t0004.png 이미지

본 연구는 site 1~4에 대하여 머신러닝 기법 기반의 SVM 모델을 통해 분류된 산불 피해 면적의 정확도를 산림청에서 발행한 산불 통계 연보에 제시된 면적과 비교하였다. 이때 SVM모델은 RBF를 이용하였으며, 변수는 gamma 0.333, penalty parameter 100, pyramid Levels 0의 값으로 사용하였고, 밴드 조합 3의 조합을 사용하여 지표 피복을 분류하였다(Table 5). 또한, 분류 시 R-G-B 영상인 true color 영상을 참고하여 훈련 표본을 설정하고 분류를 수행하였다(Fig. 3).

Table 5. SVM RBF parameter

OGCSBN_2022_v38n5_1_545_t0006.png 이미지

OGCSBN_2022_v38n5_1_545_f0003.png 이미지

Fig. 3. Classification results of land coverage with wildfire in 2020 and 2021. (a) Site 1, (b) Site 2, (c) Site 3, (d) Site 4.

위성 영상 전처리 과정에서 영상의 픽셀 1개당 크기를 10 m 단위로 리샘플링하여 분류를 진행하였으므로 픽셀 1개당 나타내는 면적은 100 m2 (0.01 ha)이다. 따라서 Site 1의 경우, 2020 산불 통계 연보에 제시된 산불 피해 면적은 2,516 ha이며, 위성 영상을 통해 분류된 산불피해 면적은 1984.69 ha로 산불 통계 연보에 공표된 면적보다 약 22.3% 적게 추산되어 77.7%의 정확도를 나타내었다. Site 2의 경우 2020 산불 통계 연보에 제시된 산불 피해 면적은 454 ha이며, 위성 영상을 통해 분류된 산불 피해 면적은 537.90 ha로 산불 통계 연보에 공표된 면적보다 약 18.3% 많게 추산되어, 81.7%의 정확도를 나타내었다. Site 3의 경우 2021 산불 통계 연보에 제시된 산불 피해 면적은 32.00 ha이며, 위성 영상을 통해 분류된 산불 피해 면적은 25.64 ha로 산불 통계 연보에 공표된 면적보다 약 19.9% 적게 추산되었으며, 80.1%의 정확도를 나타내었다. 마지막으로 Site 4의 경우, 2021 산불 통계 연보에 제시된 산불 피해 면적은 166 ha이며, 위성 영상을 통해 분류된 산불 피해 면적은 128.81 ha로 산불 통계 연보에 공표된 면적보다 약 22.4% 적게 추산되어 77.6%의 정확도를 나타내었다(Table 6). 따라서 4지역의 산불 피해 면적에 대해 위성 영상으로 산출한 면적과 산림청에서 발행한 산불 통계 연보에 제시된 면적을 비교한 결과 약 20%의 오차를 나타내는 것을 확인할 수 있었다. 이러한 오차는 DMZ의 특성상 통제구역이기 때문에 측량과 같은 직접적인 관측이 불가하다. 따라서 진화 시 육로 출입이 불가능하고, 헬기를 이용하므로, 육안으로 관측 가능한 대략적인 산불 면적을 추산하고, 군에서 제공 받은 자료와 종합적으로 고려하여 산불 피해 면적을 예측하므로, 정확한 측정 방법을 파악하기 어렵다.

Table 6. Comparison of accuracy between wildfire damage area data in the 2020 and 2021 DMZ and the calculated damage data using Sentinel-2 satellite imagery

OGCSBN_2022_v38n5_1_545_t0005.png 이미지

2022년 산불 피해 지역은 NASA FIRMS을 통해 8개의 산불 발생 위치를 파악하였다(Table 7). 2022년 산불피해 지역은 산불통계연보가 발간되기 이전이므로 피해 면적에 대한 정보가 전무하다. 따라서 감독분류를 이용한 지표 피복 분류 시 Google Earth와 Sentinel-2 동시기 영상의 true color 영상을 참고하여 훈련 표본을 설정한 뒤 분류를 진행하였다. 분류 결과, 2022년 상반기의 DMZ 지역에서 발생한 산불 피해 분류 면적은 총 7818.94 ha로 산출되었다(Fig. 4, Table 8).

Table 7. Information of DMZ wildfires in 2022 (January to June) acquired through NASA FIRMS

OGCSBN_2022_v38n5_1_545_t0007.png 이미지

Table 8. Classification results of damage areas by DMZ wildfires in the first half of 2022

OGCSBN_2022_v38n5_1_545_t0008.png 이미지

OGCSBN_2022_v38n5_1_545_f0004.png 이미지

Fig. 4. Classification results of land coverage with wildfire in 2022. (a) Site 5, (b) Site 6, (c) Site 7, (d) Site 8, (e) Site 9, (f) Site 10, (g) Site 11, (h) Site 12.

5. 결론 및 논의

본 연구에서는 2022년 상반기 DMZ 산불 피해 지역을 Sentinel-2 위성 영상과 머신러닝 기법 기반의 SVM 모델을 이용하여 분석하고자 하였다. 먼저 위성 영상 기반의 지표 피복 분류를 이용한 산불 피해 지역을 산출하기 위하여 사용할 SVM 모델의 커널 변수와, 밴드 조합에 대하여 테스트를 진행하였다. 테스트 결과의 오차 행렬을 통해 나오는 전체 정확도, 일치도 계수, IOU, precision, recall을 이용하여 커널 및 밴드 조합을 분석하였다. 테스트 결과, 연구지역에서 SVM 모델의 커널은 RBF, 밴드 조합은 밴드 2, 밴드 3, 밴드 4, 밴드 5, 밴드 6, 밴드 7, 밴드 8, 밴드 8A, 밴드 11, 밴드 12를 사용한 밴드 조합 3을 사용했을 때, 전체 정확도 97.4910%, 일치도 계수 0.9546, IOU는 0.9749, precision은 0.8635, recall은 0.7661로 가장 높은 분류 정확도를 나타냈다. 따라서 본 연구에서는 RBF 커널, 밴드 조합 3을 기반으로 지표 분류를 수행하였다.

2020~2021년 DMZ의 산불 발생 정보는 산림청에서 발행한 산불 통계 연보를 기반으로 하였으며, 2022년 상반기는 NASA FIRMS를 이용하여 총 8곳의 DMZ에서 발생한 산불 정보를 획득하였다. 수집한 산불 발생 정보를 기반으로 Sentinel-2 위성 영상을 수집하였다. 2020~2021년은 산불 통계 연보를 기반으로 Site 1~4를 선정하여 SVM 모델을 이용하여 산출한 산불 면적과 산불 통계 연보에서 제시한 산불 면적에 대한 일치도를 확인하였다. 연구 결과, 4곳의 산불 피해 면적에 대하여 77.7%, 81.7%, 80.1%, 77.6%의 정확도를 나타내어 약 80%의 정확도를 나타내는 것을 확인하였다. 2022년 1~6월은 NASA FIRMS를 기반으로 site 5~12를 선정하여 지표 피복 분류를 진행하였다. 그 결과 DMZ의 산불 피해 지역의 총면적은 7818.94 ha로 산출되었다.

본 연구의 산불 피해 면적 산출 과정에서 약 20%의 오차가 나타났으며, 다양한 오차 요소에 의한 것으로 판단된다. 첫 번째 오차 요소는 Sentinel-2 위성 영상을 사용하여 산불 피해 면적을 산출하는 과정에서 산불 발생 일자와 Sentinel-2 영상 촬영 일자가 2주~4주 이상 차이가 나는 경우가 있었으며, 이 기간 내 식생 분포의 변화등으로 인해 산불 발생 면적을 정확하게 추정하는 데 어려움이 있다고 판단된다. Sentinel-2 영상은 2대의 위성을 고려했을 경우 적도는 4~5일, 중위도는 2~3일 주기로 촬영이 가능하지만, 위성영상의 구름과 그림자 지역은 위성 영상을 분석하여 정보를 획득하는 데 있어서 오류를 발생시키기 때문에 구름의 영향을 최소화하기 위해 구름이 없거나 적은 영상 위주로 Sentinel-2 영상을 취득하여 지표 피복 분류를 진행하였으며, 이로 인해 시간 오차(temporal error)가 크게 나타난 경우가 발생하였다. 두 번째 오차의 요소는 DMZ의 특성상 민간인의 출입이 불가하여 군사기관에서만 정보를 관할할 수 있어 직접적인 현장 관측이 불가능하기 때문에 제공되는 산불 피해 면적 자료 자체에 오차가 포함되어 있을 수 있다. 세 번째 오차의 요소는 머신러닝을 이용한 분류 정확도의 문제이며 하나의 머신러닝 알고리즘을 바탕으로 감독 분류를 진행하는 것이 아니라, 다양한 감독 분류 모델을 사용, 모델별 정확도를 평가하고 이를 바탕으로 최적의 감독분류 모델을 선정한다면 오차의 요소를 줄일 수 있을 것이다.

따라서 추후 연구에서는 위의 오차 요소를 줄이기 위해 촬영 주기가 짧은 고해상도 위성영상을 이용하고, CNN, Vision Transformer 등의 영상 분석에 적합한 인공지능 기법을 적용한다면 더욱더 나은 결과를 도출할 수 있을 것이다.

사사

이 연구는 해양수산부의 재원으로 극지연구소의 지원을 받아 수행되었으며(과제번호: PE22900), 2022년 정부(교육부)의 재원으로 한국연구재단의 지원을 받아 수행된 이공분야기초연구사업(NRF-2021R1A6A3A13039778)과 2021년도 강원대학교 통일교육 선도대학 지정·육성사업의 지원을 받아 수행한 연구임. 이에 감사드립니다.

References

  1. Choi, J.W., Y.G. Byun, Y.I. Kim, and K.Y. Yu, 2006. Support vector machine classification of hyperspectral image using spectral similarity kernel, Journal of Korean Society for Geospatial Information Science, 14(4): 71-77 (in Korean with English abstract).
  2. Dietterich, T.G., 2000. An experimental comparison of three methods for constructing ensembles of decision trees: bagging, boosting, and randomization, Machine Learning, 40(2): 139-157. https://doi.org/10.1023/A:1007607513941
  3. Hsu, C.-W., C.-C. Chang, and C.-J. Lin, 2003. A practical guide to support vector classification, National Taiwan University, Taipei, Taiwan.
  4. In, C.G., 2013. A Study on the Systematic Management Measures of Natural Resources in the Demilitarizes Zone - Based on the Demilitarizes Zone in Gyeonggi-Do, Dankook University, Yongin, Korea (in Korean with English abstract).
  5. Jo, M.H., S.J. Kim, D.Y. Kim, and K.S. Choi, 2012. Comparative analysis of classification accuracy for calculating cropland areas by using satellite images, Journal of the Korean Society of Agricultural Engineers, 54(2): 47-53 (in Korean with English abstract). https://doi.org/10.5389/ksae.2012.54.2.047
  6. Jang, S.S., 2018. Classification of Tree Species Using Sentinel-2 Satellite Image, The University of Seoul, Seoul, Korea (in Korean with English abstract).
  7. Kang, N.Y., S.Y. Go, and G.S. Cho, 2013. A comparative study on suitable SVM kernel function of land cover classification using KOMPSAT-2 imagery, Journal of Korean Society for Geospatial Information Science, 21(2): 19-25 (in Korean with English abstract). https://doi.org/10.7319/kogsis.2013.21.2.019
  8. Kim, Y., G. Kwak, K.D. Lee, S.I. Na, C.W. Park, and N.W. PARK, 2018. Performance evaluation of machine learning and deep learning algorithms in crop classification: impact of hyper-parameters and training sample size, Korean Journal of Remote Sensing, 34(5): 811-827 (in Korean with English abstract). https://doi.org/10.7780/kjrs.2018.34.5.9
  9. Kim, N.R. and Y.W. Lee, 2020. Active fire detection using Landsat 8 OLI images: a case of 2019 Australia fires, Korean Journal of Remote Sensing, 36(5-1): 775-784 (in Korean with English abstract). https://doi.org/10.7780/kjrs.2020.36.5.1.10
  10. Kim, T.H. and J.M. Choi, 2020. The method of linking fire survey data with satellite image-based fire data, Korean Journal of Remote Sensing, 36(5-3): 1125-1137 (in Korean with English abstract). https://doi.org/10.7780/kjrs.2020.36.5.3.10
  11. Korea Forest Service, 2020. 2020 Annual Report on Wildfire Statistics, https://www.forest.go.kr/kfsweb/cop/bbs/selectBoardArticle.do?bbsId=BBSMSTR_1008&mn=NKFS_06_09_05&nttId=3156244, Accessed on Oct. 14, 2022.
  12. Korea Forest Service, 2021. 2021 Annual Report on Wildfire Statistics, https://www.forest.go.kr/kfsweb/cop/bbs/selectBoardArticle.do?bbsId=BBSMSTR_1008&mn=NKFS_06_09_05&nttId=3169550, Accessed on Oct. 14, 2022.
  13. Kwak, J.H., 2015. Comparative analysis of Difference of Normalized Difference Vegetation Index between Landsat 7 ETM+ and Landsat 8 OLI Sensors, Kumoh National Institute of Technology, Gumi, Korea (in Korean with English abstract).
  14. Kwon, S.K., E.H. Kim, J.B. Lim, and A.R. Yang, 2021. The analysis of changes in forest status and deforestation of North Korea's DMZ using rapideye satellite imagery and google earth, Journal of the Korean Association of Geographic Information Studies, 24(4): 113-126 (in Korean with English abstract). https://doi.org/10.11108/kagis.2021.24.4.113
  15. Lee, Y.K., 2021. Optimization of Machine Learning Algorithms for Land use and Land cover Classification using Remotely-sensed Data, Kangwon National University, Chuncheon, Korea.
  16. Melgani, F. and L. Bruzzone, 2004. Classification of hyperspectral remote sensing images with support vector machines, IEEE Transactions on Geoscience and Remote Sensing, 42(8): 1778-1790. https://doi.org/10.1109/tgrs.2004.831865
  17. Maulik, U. and D. Chakraborty, 2017. Remote sensing image classification: a survey of support-vectormachine-based advanced techniques, IEEE Geoscience and Remote Sensing Magazine, 5(1): 33-52. https://doi.org/10.1109/mgrs.2016.2641240
  18. Park, S.W., S.J. Lee, C.Y. Chung, S.R. Chung, I.C. Shin, W.C. Jung, H.S. Mo, S.I. Kim, and Y.W. Lee, 2019. Satellite-based forest withering index for detection of fire burn area: its development and application to 2019 Kangwon wildfires, Korean Journal of Remote Sensing, 35(2): 343-346 (in Korean with English abstract). https://doi.org/10.7780/kjrs.2019.35.2.13
  19. Roteta, E. and P. Oliva, 2020. Optimization of a random forest classifier for burned area detection in chile using Sentinel-2 data, Proc. of 2020 IEEE Latin American GRSS & ISPRS Remote Sensing Conference (LAGIRS), Santiago, Chile, Mar. 22-26, pp. 568-573. https://doi.org/10.1109/lagirs48042.2020.9165585
  20. Song, J.Y., J.C. Jeong, and S.H. Lee, 2018. Development of a classification method for forest vegetation on the stand level, using KOMPSAT-3A imagery and land coverage map, Korean Journal of Environment and Ecology, 32(6): 686-697 (in Korean with English abstract). https://doi.org/10.13047/KJEE.2018.32.6.686
  21. Schmidhuber, J., 2015. Deep learning in neural networks: an overview, Neural Networks, 61: 85-117. https://doi.org/10.1016/j.neunet.2014.09.003
  22. Youn, H.J., 2020. Building Sentinel-2 Forest Fire Grade Classification Model using SVM Machine Learning Algorithm, Namseoul University, Cheonan, Korea.