DOI QR코드

DOI QR Code

KOMPSAT-3A Urban Classification Using Machine Learning Algorithm - Focusing on Yang-jae in Seoul -

기계학습 기법에 따른 KOMPSAT-3A 시가화 영상 분류 - 서울시 양재 지역을 중심으로 -

  • Youn, Hyoungjin (Master Student, Department of Geoinformatics Engineering, Namseoul University) ;
  • Jeong, Jongchul (Professor, Department of Geoinformatics Engineering, Namseoul University)
  • 윤형진 (남서울대학교 공간정보공학과 석사과정생) ;
  • 정종철 (남서울대학교 공간정보공학과 정교수)
  • Received : 2020.08.31
  • Accepted : 2020.11.23
  • Published : 2020.12.31

Abstract

Urban land cover classification is role in urban planning and management. So, it's important to improve classification accuracy on urban location. In this paper, machine learning model, Support Vector Machine (SVM) and Artificial Neural Network (ANN) are proposed for urban land cover classification based on high resolution satellite imagery (KOMPSAT-3A). Satellite image was trained based on 25 m rectangle grid to create training data, and training models used for classifying test area. During the validation process, we presented confusion matrix for each result with 250 Ground Truth Points (GTP). Of the four SVM kernels and the two activation functions ANN, the SVM Polynomial kernel model had the highest accuracy of 86%. In the process of comparing the SVM and ANN using GTP, the SVM model was more effective than the ANN model for KOMPSAT-3A classification. Among the four classes (building, road, vegetation, and bare-soil), building class showed the lowest classification accuracy due to the shadow caused by the high rise building.

시가화 지역 토지피복분류는 도시계획 및 관리에 활용된다. 따라서, 시가화 지역에 대한 분류 정확도 향상 연구는 중요하다고 할 수 있다. 본 연구에서는 고해상도 위성영상인 KOMPSAT-3A을 기계학습 중 Support Vector Machine(SVM)과 Artificial Neural Network(ANN)을 기반으로 시가화지역 분류를 진행하였다. 훈련 데이터 구축과정에서 25 m 격자를 기반으로 훈련 지역을 구분하여 영상을 학습하였으며, 학습된 모델을 활용하여 테스트 지역을 분류하였다. 검증과정에서 250개의 GTP를 활용하여 오차 행렬을 통한 결과를 제시하였다. SVM 4가지 기법과 ANN 2가지 기법 중 SVM Polynomial Model이 가장 높은 정확도인 86%를 나타냈다. Ground Truth Points(GTP)를 활용하여 두 개의 모델을 비교하는 과정에서, SVM 모델은 전체적으로 ANN 모델보다 효과적으로 KOMPSAT-3A 영상을 분류하였다. 건물, 도로, 식생, 나대지 4가지 클래스 분류 중 건물이 가장 낮은 분류정확도를 보여주었으며, 이는 고층건물에 따른 건물 그림자에 의한 오분류가 주요 원인으로 나타났다.

Keywords

요약

시가화 지역 토지피복분류는 도시계획 및 관리에 활용된다. 따라서, 시가화 지역에 대한 분류 정확도 향상 연구는 중요하다고 할 수 있다. 본 연구에서는 고해상도 위성영상인 KOMPSAT-3A을 기계학습 중 Support Vector Machine(SVM)과 Artificial Neural Network(ANN)을 기반으로 시가화지역 분류를 진행하였다. 훈련 데이터 구축과정에서 25 m 격자를 기반으로 훈련 지역을 구분하여 영상을 학습하였으며, 학습된 모델을 활용하여 테스트 지역을 분류하였다. 검증과정에서 250개의GTP를 활용하여 오차 행렬을 통한 결과를 제시하였다. SVM 4가지 기법과 ANN 2가지 기법 중 SVM Polynomial Model이 가장 높은 정확도인 86%를 나타냈다. Ground Truth Points(GTP)를 활용하여 두 개의 모델을 비교하는 과정에서, SVM 모델은 전체적으로 ANN 모델보다 효과적으로 KOMPSAT-3A 영상을 분류하였다. 건물, 도로, 식생, 나대지 4가지 클래스 분류 중 건물이 가장 낮은 분류 정확도를 보여주었으며, 이는 고층건물에 따른 건물 그림자에 의한 오분류가 주요 원인으로 나타났다.

1. 서론

원격탐사 분야에서는 위성영상 기술 향상으로 인해 고해상도(VHR, Very High-Spatial)자료 취득이 가능해졌으며, 국내 또한 KOMPSAT-2, 3과 같은 1 m 이내의 해 상도 영상 취득이 가능해졌다. 이러한 고해상도 영상을 기반으로 토지피복분류 등의 영상 분류 과정에서 보다 세밀한 분석이 가능해졌으며(Karwariya and Shashikant, 2012), 분류 결과는 다양한 분야에서 활용이 가능하다. 환경부에서 제공하고 있는 토지피복지도 중 세 분류 항목은 수치지형도와 함께 KOMPSAT-2 영상을 참조하여 제작되고 있으며, 이렇게 제작된 공간정보데이터는 변화탐지, 공간분석 등과 같은 국토 연구에서 활용되고 있다(Chen et al., 2013).

영상을 활용한 토지피복분류 방법은 크게 감독분류와 무감독분류로 구분된다. 감독분류의 경우 훈련지역(ROI, Region of Interest)을 선정하고, 이를 기반으로 영상을 분류한다. 훈련지역을 선정하는 과정에서 분석자의 전문성 및 사전지식이 요구된다. 무감독분류의 경우 클래스에 속하는 패턴들을 미리 알 수 없기 때문에 각 데이터 전체에 대한 군집화를 기반으로 분석자의 매개 변수 지정을 통해 분류되는 방식이 일반적이다. 무감독분류 중 K-means Clustering, Iso Data와 같은 기법은 영상 밴드의 군집화를 통해 영상을 분류하는 대표적인 기법이며, 이러한 무감독분류 기법은 매개변수에 영향을 받기 때문에, 매개 변수 선정에 따른 분류 결과 편차가 크게 존재한다 (Jeon and Kim, 2003; Oyekola and Adewuyi, 2018). 따라서 무감독분류를 통한 토지피복분류에서는 결과에 대한 추가적인 훈련 자료를 제시해야 할 필요성이 존재한다(Choi et al., 2014). 이처럼 영상을 분류하기 위해서는 다양한 분류 기법을 통해 실험을 해야 할 필요성이 존재한다(Ma et al., 2017; Elaalem et al., 2013; Rodriguez et al., 2012).

이와 관련하여 영상을 분석하는 방법 중 기계학습을 접합시키는 연구가 트렌드로 자리잡고 있다(Du et al., 2015; Zhang et al., 2018). 기계학습을 위성영상에 접합시키는 경우 영상 데이터를 학습하기 위한 훈련데이터를 제작하고 이를 기반으로 모델을 제작하게 된다. 결과 모델은 추후 취득되는 영상자료에 대한 효과적인 분류 방향을 제시할 수 있으며, 추가학습을 통해 보다 향상된 모델을 제시할 수 있다는 장점이 있다. 기계학습은 지도학습과 비지도학습으로 구분되는데 지도학습은 정답이 존재하는 데이터를 훈련한 모델을 기반으로 추가적으로 제시되는 새로운 데이터를 분류하는 방향의 학습법이며, 비지도학습은 정답을 주지 않고 데이터 자체의 훈련을 통해 해당 데이터 간의 상관성을 통해 정답을 도출하는 방향의 학습법이다 (Chon and Noh, 2020). 따라서 기계학습을 위성영상과 접목하는 과정에서 영상에 따른 다양한 커널과 매개 변수, 그리고 적합한 훈련 데이터 구축(Ma et al., 2015) 실험을 통해 최적의 기법을 적용하는 것이 중요하다(Mountrakis et al., 2011). 이에 대한 실험으로 영상을 통해 토지피복을 분류하는 과정에서 기계학습을 접합시킨 연구는 Support Vector Machine (SVM)(Kang et al., 2013; Jeong and Youn, 2020; Kang and Park, 2020), 신경망(Neural Network)기반의 CNN(Choi et al., 2020; Yang and Lee, 2020), DeepLab(Choi et al., 2020) 등과 같이 다양하게 진행되었다. 이처럼 기계학습과 위성영상을 접합시켜 분석을 하는 연구가 다수 존재하였지만, 복합적으로 토지가 구분되어 있는 지역을 대상으로 기계학습 기법을 비교하는 방향의 연구는 상대적으로 부족하였다. 따라서 본 연구에서는 고해상도 KOMPSAT-3A 영상 중 고층건물 등 발달된 시가화 지역을 대상으로 기계학습 SVM과 ANN(Artificial Neural Network)을 활용하여 토지피복분류를 진행하고자 하였다.

2. 연구 자료 및 방법

1) 연구 대상지 및 취득 데이터

본 연구는 Fig. 1과 같이 높은 고층건물과 대형 도로가 포함된 서울시 양재 지역을 연구 대상지로 선정하였다. 연구 지역의 경우 고층건물로 인해 토지피복분류 과정에서 그림자에 대한 영향이 많이 발생하는 지역이며, 이와 더불어 산림 지역과 나대지 지역이 공존하고 있는 지역으로 해당 지역을 학습하고 분류하는 연구 과정에서 생성된 모델은 향후 다른 지역에 대한 모델 적용 과정에서 용이하다고 판단되기 때문에 해당 지역을 연구 대상지로 선정하였다. 본 연구에서는 단시기 영상을 기준으로 그림자 지역을 최소화하기 위해 영역을 지정할 필요성이 존재하였고, 이와 같은 과정에서 Fig. 1과 같은 훈련 지역과 예측 지역을 구분하고 해당 지역에 대한 학습 모델을 제작하고자 하였다. 연구 대상지의 경우 Fig. 1의 (C), (D)와 같은 세 분류 토지피복지도 공간정보를 제공하고 있다.

OGCSBN_2020_v36n6_2_1567_f0001.png 이미지

Fig. 1. Study area, (A) train area, (B) Test area, (C) small category of training area, (D) small category of test area.

토지피복지도를 기준으로 연구 대상에서 가장 넓은 면적을 차지하고 있는 클래스는 교통지역(도로 등)으로 나타나고 있으며, 운동장과 밭과 같은 분류는 1% 이하의 면적 비율을 나타낸다. 본 연구는 이러한 연구 대상지를 학습하기 위해 4가지 클래스로 구분하였다. 시가화 지역은 건물을 나타내는 클래스와 도로를 나타내는 클래스, 총 2가지로 구분하여 ‘건물’과 ‘도로’로 구분하였다. 또한 운동장, 나대지와 같은 지역을 ‘나대지’로 통합하여 분류하였으며, 토지피복지도에서 나타나는 산림 및 초지를 하나의 클래스인 ‘식생’으로 통합하였다. Fig. 2는 본 연구의 훈련 지역과 테스트 지역을 대상으로 토지피복지도 기준 영상의 토지피복면적 비율을 나타낸다.

OGCSBN_2020_v36n6_2_1567_f0002.png 이미지

Fig. 2. Area ratio of train and test land cover, (A) train area, (B) test area.

연구에 사용된 위성영상의 경우 Table 1과 같이 KOMPSAT-3A 영상으로 2016년 1월 8일 겨울 시기의 영상을 활용하였다. 영상 기반 토지피복분류는 계절적 특성에 따라 여름철의 경우 논·밭과 같은 농업 지역과 나지 지역의 차이가 뚜렷하고, 겨울철 영상의 경우 식생의 분류, 특히 침엽수와 활엽수림 등을 구분하는데 효과적이며 이를 활용하는 연구가 진행된 바 있다(Song et al., 2018). 본 연구는 겨울철 영상이 식생 분류 뿐 아니라 전반적인 토지피복분류를 진행하였을 경우에 대한 활용가능성을 확인하고자 하였다. KOMPSAT-3A의 경우 Blue-NIR의 밴드의 해상도는 2.2 m이나 Panchromatic 밴드는 0.5 m이며, 본 연구에서는 고해상도 영상의 장점을 살리기 위해 4개의 밴드를 Panchromatic 기반의 pan-sharpening을 통해 0.5 m의 해상도로 변환하여 사용하였다. 또한 본 연구에서는 고도 데이터인 DTM과 DSM을 활용하고자 하였다. 고도 데이터의 경우 Jang et al. (2020)이 도로망 추출을 위해 사용한 연구 결과에서 높은 정확도의 변화 탐지 결과를 도출한 바 있으며, 본 연구에서도 이러한 고도 데이터를 활용하여 토지피복분류의 학습 변수에 추가하였다. DSM과 DTM은 스테레오 형식으로 촬영되는 KOMPSAT-3A의 특성을 활용 하여 Ground Control Point(GCP)와 Rational Polynomial Coefficient(RPC) 보정을 통한 전처리 과정 후 이를 접합 하여 높이 값 보간 및 격자 생성 과정을 통해 제작된 해당 시기의 자료를 활용하였다(Jang et al., 2019; Oh and Han, 2020). 수집된 4개의 KOMPSAT-3A 영상 밴드와 2개의 고도 데이터는 Layer Stacking을 통해 하나의 다중밴드 영상으로 변환하여 Table 2와 같은 구성으로 변환하여 학습하였다.

Table 1. Data source and list of K3A image and spatial information

OGCSBN_2020_v36n6_2_1567_t0001.png 이미지

Table 2. Training image band list

OGCSBN_2020_v36n6_2_1567_t0002.png 이미지

2) 활용 알고리즘

(1) Support Vector Machine

SVM(Support Vector Machine)은 기계학습에 대표적으로 사용되는 알고리즘으로 1995년 Vapnik이 제시한 통계학습이론에 기반되었으며, 회귀분석 문제에 효과적으로 적용 가능하다 (Vapnik, 1995). SVM은 다차원 내에 데이터가 존재할 경우 이를 분류하는 경계 중 가장 큰 폭을 가지는, 즉 가장 큰 margin을 남기는 선형 분류 모델을 제작하는 것이다. SVM의 장점은 kernel을 이용하여 클래스 간의 비선형 분리가 가능하기 때문에 다양한 과학 분야에서 사용 가능하며(Foody and Mathur, 2004), 이러한 장점은 위성영상을 활용한 감독 분류에도 활용되고 있다(Anthony et al., 2007). 본 연구에서는 대표적인 SVM의 4가지 커널 Linear, Polynomial, RBF(Radial Basis Function), Sigmoid모델을 활용하였다(Fig. 3)

OGCSBN_2020_v36n6_2_1567_f0003.png 이미지

Fig. 3. Graph of SVM kernel, (A) linear, (B) polynomial, (C) RBF, (D) sigmoid.

(2) Artificial Neural Network(ANN)

인공 신경망(Artificial Neural Network: ANN)은 인간의 뇌 구조와 같이 신경망 구조 형식으로 입력, 학습, 출력하는 알고리즘이다(Fig. 4). 해당 알고리즘은 활성화 함수가 중요하게 적용되는데 이는 입력 받은 데이터를 다음 층으로 출력하는 것에 대한 결정을 판단하기 때문이다. 인공신경 모델에서 뉴런은 층으로 구성되어 있으며 층에는 여러 개의 노드로 구성되어 있다. 하나의 노드는 1개 이상의 노드와 연결되어 있으며, 데이터를 입력받는 과정에서 연결 강도의 가중치 합을 구하게 되고 활성화 함수를 통해 가중치 값의 크기에 따라 출력하게 된다. 본 연구에서는 여러 가지 활성화 함수 중 Sigmoid함수와 Identity함수를 활용하였다.

OGCSBN_2020_v36n6_2_1567_f0004.png 이미지

Fig. 4. Structure of ANN, (A) sigmoid, (B) identity.

3) 데이터 구축 및 학습

학습을 위한 데이터 분류 클래스는 총 4가지로 구분되었으며, 클래스 종류는 건물, 도로, 나지, 식생으로 분류하였다. 이를 학습시키기 위한 영상 밴드는 Fig. 5와 같이 위성영상 KOMPSAT-3A의 4가지 밴드 값과 고도 데이터 2가지 총 6가지의 밴드를 학습 데이터로 활용하였다. 연구에서의 분류 군은 건물, 도로, 식생, 나지 총 4가지로 구분되며, 학습을 위한 영상은 단일 영상을 기준으로 25 m의 격자 형식으로 구분하여 육안 판독 및 토지피복지도 참조를 통해 학습 데이터를 구축하였다. 학습 과정에서는 오픈소스 기반 QGIS를 배경으로 진행하였다. QGIS는 플러그인을 통한 높은 확장성을 가질 수 있으며, 본 연구에서는 QGIS 공간 분석 확장 플러그인 Orfeo Tool Box(OTB)를 활용하였다. OTB는 QGIS와 연동하여 공간 분석 및 기계학습을 제공하는 툴박스로 본 연구에서는 6.6.1 버전을 기반으로 영상을 학습하였다.

OGCSBN_2020_v36n6_2_1567_f0005.png 이미지

Fig. 5. Variables for train model, (A) Blue, (B) Green, (C) Red, (D) NIR, (E) DTM, (F) DSM.

본 연구의 연구 흐름은 Fig. 6과 같다. 본 연구의 목적은 KOMPSAT-3A 토지피복분류 과정에서 최적의 토지피복분류 결과를 나타내는 알고리즘을 선정하는 것이며 각각의 훈련 결과 모델을 통한 분류 결과를 검증하기 위해 테스트 지역에 해당하는 250개의 Ground Truth Points(GTPs)를 활용하였다. GTPs는 육안 판독을 기반으로 제작하였으며, 그림자가 짙은 영상 지역은 정확한 영상판독에 어려움이 존재하기 때문에 그림자가 없는 지역을 중심으로 랜덤으로 생성하였다. 생성된 GTPs를 활용하여 SVM기법과 ANN 기법을 비교하는 연구를 진행하였다. 연구과정에서 비교한 SVM결과 4개와 ANN 결과 2개에 대한 분류 결과를 제시하였으며, 검증 과정에서 오차 행렬 및 kappa지수를 통해 각 모델을 평가하였다.

OGCSBN_2020_v36n6_2_1567_f0006.png 이미지

Fig. 6. Flow chart for classify land cover using machine learning. 

3. 연구 결과

1) 영상 학습 데이터 구축

본 연구는 단시기 영상을 기반으로 훈련 지역과 테스트 지역의 구분을 통해 결과를 제시하였으며, 학습을 위한 연구지역 선정 및 이를 테스트 하기 위한 지역 선정을 진행할 필요성이 존재하였다. 따라서 Fig. 7과 같이 훈련 지역에 대한 학습 데이터를 구축하였다.

OGCSBN_2020_v36n6_2_1567_f0007.png 이미지

Fig. 7. Example of training data, (A) building, (B) road, (C) vegetation, (D) baresoil.

학습 데이터 구축은 훈련 대상 지역을 25 m기반의 격자를 기반으로 훈련 영역을 제시하였으며, 생성된 폴리곤 내에 약 80% 이상의 단일 클래스로 구성되어 있는 영역만을 지정하였다. 훈련 과정에서 다양한 토지 속성을 포함하고 있는 영역을 지정하였을 경우 모델의 정확도가 하락 수 있기 때문에 격자 내에 다양한 토지분류가 중복으로 적용된 경우에는 이를 제거하는 형식으로 훈련 데이터를 제작하였다. 최종적으로 생성된 훈련 데이터는 훈련 지역 기준 건물 326개, 도로 145개, 식생 420개, 나지 30개로 총 921개의 데이터를 학습 데이터로 활용하였다. 해당 데이터를 기반으로 학습을 하는 과정에서 SVM은 Linear선형 커널과 더불어 Polynomial, RBF, Sigmoid함수를 사용하였으며, ANN의 경우 활성함수를 Identity, Sigmoid 두 개를 활용하였다. 이때 ANN의 경우 학습 데이터를 1,000번 반복 학습을 통해 모델을 제작하였다.

2) 기계학습 모델 분류 결과

SVM과 ANN 두개의 기법을 활용하여 제작된 모델을 기반으로 본 연구에서 지정한 테스트 지역을 분류한 결과는 Fig. 8과 같다.

OGCSBN_2020_v36n6_2_1567_f0008.png 이미지

Fig. 8. Results of K-means clustering, SVM (A) Linear, (B) Polynomial, (C) RBF, (D) Sigmoid, and ANN (E) Sigmoid, (F) Identity.

SVM의 4가지 기법은 Fig. 8의 A~D와 같은 결과를 나타내는데, 4가지 커널 중 Sigmoid의 경우만 다른 양상의 분류 결과가 나타난다. 분류 과정에서 시가화 지역 주 변에 포함된 도로 데이터를 추출하는 과정에서 Sigmoid 는 도로 분류를 나대지로 오분류하는 경우가 굉장히 높았으며, 나머지 3개의 SVM 커널은 이와 반대로 도로로 분류하는 결과를 나타냈다. ANN의 활성함수 2개에 대한 분류결과 또한 각각의 활성함수에 따라 차이가 나는 결과를 도출하였는데 ANN 기반의 Sigmoid함수는 나지 지역을 분류하는 과정에서 SVM 결과와 비슷한 분류를 나타냈지만, Identity기반의 함수 분류 결과에서는 나대지인 공사현장에 대해서 제대로 학습하지 못하는 결과를 보여주었다. 따라서 해당 지역에 대한 보다 자세한 분류 결과를 확인하기 위해서 Fig. 9와 같은 테스트 지역의 250개의 GTPs를 제작하였다.

OGCSBN_2020_v36n6_2_1567_f0009.png 이미지

Fig. 9. 250 Ground truth for validation.

랜덤으로 연구 지역에 생성한 250개의 데이터는 건물 148개, 도로 26개, 식생 42, 나지 34개로 구성되어 있으며, Table 3은 GTP와 SVM 4가지 커널 ANN 2가지 커널에 대한 결과를 분류한 오차 행렬을 나타낸다.

Table 3. SVM, ANN confusion matrix with GTPs

OGCSBN_2020_v36n6_2_1567_t0003.png 이미지

SVM 모델에서 250개의 GTP 기반 가장 높은 정확도를 보여주는 분류 모델은 SVM Polynomial 모델로 86.0%의 분류 정확도를 나타냈다. 이때의 kappa 또한 0.7842로 상대적으로 유의미한 분류 결과를 확인할 수 있다. Polynomial 커널 기반의 분류 결과를 포함하여 Linear, RBF커널의 분류 정확도는 80% 이상의 정확도가 도출되었으며 kappa 또한 0.7 이상의 값을 나타내어 GTP와의 정확도 검증 결과에서 유의미한 결과를 도출했다고 판단할 수 있다. 하지만 SVM Sigmoid의 경우 44.8%의 정확도를 보여주며, 오차 행렬을 통해 건물이 주로 나지 지역으로 오분류로 나타났다. 식생과 나지 지역의 경우 각각 식생은 주로 도로와 나지 지역으로, 나지 지역은 주로 건물로 오분류가 발생하였음을 확인할 수 있다. 테스트 지역의 나지 지역으로 구분되는 지역은 학교 운동장과 같은 밝은 계열의 나지 지역과 공사 현장과 같은 어두운 계열의 나지 지역으로 구분할 수 있는데 다른 3개의 커널에 비해 Sigmoid 분석을 실시하였을 경우에는 해당 어두운 나지 지역과 건물에 대한 분류과정에서 오분류가 발생한 것으로 판단된다. ANN분류 기법 중 두 개의 활성 함수를 통한 분류결과는 오차 행렬을 통해 분석하였을 때, Sigmoid의 경우 전체 정확도 79.6%, kappa 0.6894로 유의미한 결과를 도출하였지만, Identity의 경우 전체 정확도 56.0%, kappa0.4122로 Sigmoid에 비해 상대적으로 낮은 분류 정확도를 나타냈다. Identity 활성 함수 기반 분류결과는 SVM과 비교할 경우 식생을 상대적으로 정확하게 추출하는 모습을 보였으나, 나지 지역을 분류하는 과정에서 나지 지역으로 전체적으로 식생으로 분류하며 해당 모델의 식생의 영향력이 상대적으로 크게 적용되는 것을 확인할 수 있다. Table 4은 각각 분류 클래스를 기법 별로 비교하기 위한 생산자, 사용자 정확도를 정리한 표이다.

Table 4. Producer and user accuracy for each classes GTPs confusion matrix result

OGCSBN_2020_v36n6_2_1567_t0004.png 이미지

생산자 정확도 측면에서 모든 클래스에 따른 높은 정확도를 나타내는 경우는 SVM Polynomial로 나타난다. 사용자 정확도 측면에서는 도로에서 ANN Sigmoid가 52.78%로 가장 높은 정확도로 나타났으나, 그 외의 분류 클래스에서는 SVM Polynomial이 가장 높은 정확도를 나타났다.

4. 결론

본 연구는 토지피복분류 과정에서 기계 학습을 접합시켜 KOMPSAT-3A 시가화 지역을 분류하는 알고리즘을 비교하는 연구를 진행하였다. 위성영상은 다중 분광밴드의 특징과 더불어 넓은 범위를 한 번에 분석, 활용할 수 있는 장점이 존재하며, 이러한 분광 값과 고도 데이터를 통해 제작된 영상을 기계학습으로 학습시켜 다음과 같은 결론을 도출할 수 있었다. 영상을 학습시키는 다양한 방법이 존재하며, 본 연구는 SVM과 ANN을 통해 영상의 토지피복분류를 실시하였다. 생성된 SVM Polynomial모델이 가장 높은 86.0%의 정확도로 나타났다. 생성된 모델은 인간의 육안으로 판단이 힘든 분류지역에 대한 기준점을 제시할 수 있다고 판단되며 더 나아가 보다 다양한 클래스를 학습시켜 공간 데이터를 구축하는 방향에서 효율적으로 활용될 수 있다고 판단된다.

위성영상을 분류하여 토지피복결과를 제작하는 과정에서 그림자 지역에 대한 분류가 완벽하게 진행되지 못한 부분이 본 연구에서의 한계점으로 나타났다. 그림자 지역의 경우 KOMPSAT-3A의 분광스펙트럼 내에서 분류가 힘들며, 이는 보정 등의 과정을 통해 영상을 처리한 후 적용한다면 보다 효율적인 분류가 가능하다 (Park et al., 2017).기계학습을 활용한 모델 생성의 경우 이를 활용하여 다시기 영상을 분류할 수 있으며 본 연구를 기반으로 보다 적합한 알고리즘과 학습 변수를 조합할 경우보다 효과적인 위성영상 토지피복분류가 가능할 수 있다고 판단된다. 연구 대상지인 양재는 시가화 지역이 밀집되어 있는 장소이며 고층 건물로 인한 그림자가 존재하는 지역이다. 해당 지역에서 본 연구에서는 건물분류 및 도로분류에서 생산자 정확도와 사용자 정확도의 차이가 크게 나타나는 것을 확인할 수 있으며 이에 대해서는 비슷한 토지 특성 지역을 대상으로 추가적인 학습을 통해 분석할 필요성이 존재한다. 하지만 식생을 분류하는 과정에서는 생산자 정확도와 사용자 정확도 모두 우수한 결과를 나타냈으며 이를 기반으로 세밀한 식생분류 분석을 진행할 경우 효과적일 수 있다고 판단된다.

사사

이 논문은 국토교통부 위성정보 활용센터 설립 운영사업인 ‘국토위성정보 수집 및 활용기술개발’(과제 번호:20SIUE-B148326-01)의 연구비지원에 의해 수행되었습니다.

References

  1. Anthony, G., H. Gregg, and M. Tshilidzi, 2007. Image Classification Using SVMs: One-against-One Vs One-against-All, Proc. of the 28th Asian Conference on Remote Sensing 2007, Kuala Lumpur, MY, Nov. 12-16, vol. 1, pp. 801-806.
  2. Chen, J., M. Lu, X. Chen, J. Chen, and L. Chen, 2013. A spectral gradient difference based approach for land cover change detection, ISPRS Journal of Photogrammetry and Remote Sensing, 85: 1-12. https://doi.org/10.1016/j.isprsjprs.2013.07.009
  3. Choi, J.W., S.T. Noh, and S.K. Choi, 2014. Unsupervised Classification of Landsat-8 OLI Satellite Imagery Based on Iterative Spectral Mixture Model, Journal of Korean Society for Geospatial Information Science, 22(4): 53-61 (in Korean with English abstract). https://doi.org/10.7319/kogsis.2014.22.4.053
  4. Choi, S.K., S.K. Lee, Y.B. Kang, S.K. Seong, D.Y. Choi, and G.H. Kim, 2020. Applicability of Image Classification Using Deep Learning in Small Area: Case of Agricultural Lands Using UAV Image, Journal of the Korean Society of Surveying, Geodesy, Photogrammetry and Cartography, 38(1): 23-33 (in Korean with English abstract). https://doi.org/10.7848/KSGPC.2020.38.1.23
  5. Choi, Y.J., M.S. Kim, Y.W. Kim, and S.H. Han, 2020. A Study of CNN-based Super-Resolution Method for Remote Sensing Image, Korea Journal of Remote Sensing, 36(3): 449-460 (in Korean with English abstract). https://doi.org/10.7780/kjrs.2020.36.3.5
  6. Chon, H.M. and J.K. Noh, 2020. Comparison Study of the Performance of CNN Models with Multi-view Image Set on the Classification of Ship Hull Blocks, Journal of the Society of Naval Architects of Korea, 57(3):140-151 (in Korean with English abstract). https://doi.org/10.3744/SNAK.2020.57.3.140
  7. Du, P., A. Samat, B. Waske, S. Liu, and Z. Li, 2015. Random Forest and Rotation Forest for fully polarized SAR image classification using polarimetric and spatial features, ISPRS Journal of Photogrammetry and Remote Sensing, 105: 38-53. https://doi.org/10.1016/j.isprsjprs.2015.03.002
  8. Elaalem, M.M., Y.D. Ezlit, A. Elfghi, and F. Abushnaf, 2013. Performance of Supervised Classification for Mapping Land Cover and Land Use in Jeffara Plain of Libya, Proc. of 2013 International Conference on Food and Agricultural Sciences, Melaka, MAS, Oct. 5-6, vol. 55, pp. 33-37.
  9. Foody, G.M. and A. Mathur, 2004. A relative evaluation of multiclass image classification by support vector machines, IEEE Transactions on Geoscience and Remote Sensing, 42(6): 1335-1343. https://doi.org/10.1109/TGRS.2004.827257
  10. Jang Y.J., J.H. Oh, and C.N. Lee, 2020. Urban Building Change Detection Using nDSM and Road Extraction, Journal of the Korean Society of Surveying, Geodesy, Photogrammetry and Cartography, 38(3): 237-246 (in Korean with English abstract). https://doi.org/10.7848/KSGPC.2020.38.3.237
  11. Jang, Y.J., K.Y. Oh, K.J. Lee, and J.H. Oh, 2019. A Study on Urban Change Detection Using D-DSM from Stereo Satellite Data, Journal of the Korean Society of Surveying, Geodesy, Photogrammetry and Cartography, 37(5): 389-395 (in Korean with English abstract). https://doi.org/10.7848/ksgpc.2019.37.5.389
  12. Jeon, Y.J. and J.I. Kim, 2003. Supervised Classification Systems for High Resolution Satellite Images, Journal of KIISE: Computing Practices and Letters, 9(3): 301-310 (in Korean with English abstract).
  13. Jeong, J.C. and H. J. Youn, 2020. Region of Interest (ROI) Selection of Land Cover Using SVM Cross Validation, Journal of Cadastre & Land Informati X, 50(1): 75-85 (in Korean with English abstract).
  14. Kang, N.Y., S.Y. Go, and G.S. Cho, 2013. A Comparative Study on Suitable SVM Kernel Function of Land Cover Classification Using KOMPSAT-2 Imagery, Journal of Korean Society for Geospatial Information Science, 21(2): 19-25 (in Korean with English abstract). https://doi.org/10.7319/kogsis.2013.21.2.019
  15. Karwariya S. and T. Shashikant, 2012. Landuse/Land-cover Mapping of Achanakmar Amarkantak Biosphere Reserve, India Using Unsupervised Classification Technique, International Journal of Computational Engineering Research, 2(5): 1302-1305.
  16. Ma, L., L. Cheng, M. Li, Y. Liu, and X. Ma, 2015. Training set size, scale, and features in Geographic Object-Based Image Analysis of very high resolution unmanned aerial vehicle imagery, ISPRS Journal of Photogrammetry and Remote Sensing, 102: 14-27. https://doi.org/10.1016/j.isprsjprs.2014.12.026
  17. Ma, L., M. Li, X. Ma, L. Cheng, P. Du, and Y. Liu, 2017. A review of supervised object-based landcover image classification, ISPRS Journal of Photogrammetry and Remote Sensing, 130: 277-293. https://doi.org/10.1016/j.isprsjprs.2017.06.001
  18. Mountrakis, G., J.H. Im, and C. Oaesar, 2011. Support vector machines in remote sensing: A review, ISPRS Journal of Photogrammetry and Remote Sensing, 66: 247-259. https://doi.org/10.1016/j.isprsjprs.2010.11.001
  19. Oh, J.H. and Y.K. Han, 2020. A Double Epipolar Resampling Approach to Reliable Conjugate Point Extraction for Accurate Kompsat-3/3A Stereo Data Processing, Remote Sensing, 12: 2940. https://doi.org/10.3390/rs12182940
  20. Oyekola, M.A. and G.K. Adewuyi, 2018. Unsupervised Classification in Land Cover Types Using Remote Sensing and GIS Techniques, International Journal of Science and Engineering Investigations, 7(72): 11-18.
  21. Park, S.H., G.S. Lee, and H.S. Jung, 2017. Shadow Detection and Correction Method for Urban Area using KOMPSAT-3A Image, Korean Journal of Remote Sensing, 33(6): 1197-1213 (in Korean with English abstract). https://doi.org/10.7780/kjrs.2017.33.6.3.4
  22. Park, Y.B. and H.L. Park, 2020. Evaluation of the usability of Sentinel-2A SWIR bands for facility cultivation detection, Korean Society of Surveying, Geodesy, Photogrammetry, and Cartography, 7: 145-148 (in Korean with English abstract).
  23. Rodriguez, G.V.F., B. Ghimire, J. Rogan, O.M. Chica, and S.J.P. Rigol, 2012. An assessment of the effectiveness of a random forest classifier for land-cover classification, ISPRS Journal of Photogrammetry and Remote Sensing, 67: 93-104. https://doi.org/10.1016/j.isprsjprs.2011.11.002
  24. Song, J.Y., S.H. Lee, and J.C. Jeong, 2018. Development of a Classification Method for Forest Vegetation on the Stand Level, Using KOMPSAT-3A Imagery and Land Coverage Map, Korean Journal of Environment and Ecology, 32(6): 686-697 (in Korean with English abstract). https://doi.org/10.13047/KJEE.2018.32.6.686
  25. Vapnik, V., 1979. Estimation of Dependences Based on Empirical Data, Nauka, Moscow, RUS.
  26. Yang, S.B. and S.J. Lee, 2020. Improved CNN Algorithm for Object Detection in Large Images, Journal of the Korea Society of Computer and Information, 25(1): 45-53 (in Korean with English abstract). https://doi.org/10.9708/JKSCI.2020.25.01.045
  27. Zhang, P., Y. Ke, Z. Zhang, M. Wang, P. Li, and S. Zhang, 2018. Urban Land Use and Land Cover Classification Using Novel Deep Learning Models Based on High Spatial Resolution Satellite Imagery, Sensors, 18(11): 3717. https://doi.org/10.3390/s18113717