DOI QR코드

DOI QR Code

Classification of Natural and Artificial Forests from KOMPSAT-3/3A/5 Images Using Artificial Neural Network

인공신경망을 이용한 KOMPSAT-3/3A/5 영상으로부터 자연림과 인공림의 분류

  • 이용석 (서울시립대학교 공간정보공학과) ;
  • 박숭환 (서울시립대학교 공간정보공학과) ;
  • 정형섭 (서울시립대학교 공간정보공학과) ;
  • 백원경 (서울시립대학교 공간정보공학과)
  • Received : 2018.12.11
  • Accepted : 2018.12.14
  • Published : 2018.12.31

Abstract

Natural forests are un-manned forests where the artificial forces of people are not applied to the formation of forests. On the other hand, artificial forests are managed by people for their own purposes such as producing wood, preventing natural disasters, and protecting wind. The artificial forests enable us to enhance economical benefits of producing more wood per unit area because it is well-maintained with the purpose of the production of wood. The distinction surveys have been performed due to different management methods according to forests. The distinction survey between natural forests and artificial forests is traditionally performed via airborne remote sensing or in-situ surveys. In this study, we suggest a classification method of forest types using satellite imagery to reduce the time and cost of in-situ surveying. A classification map of natural forest and artificial forest were generated using KOMPSAT-3, 3A, 5 data by employing artificial neural network (ANN). And in order to validate the accuracy of classification, we utilized reference data from 1/5,000 stock map. As a result of the study on the classification of natural forest and plantation forest using artificial neural network, the overall accuracy of classification of learning result is 77.03% when compared with 1/5,000 stock map. It was confirmed that the acquisition time of the image and other factors such as needleleaf trees and broadleaf trees affect the distinction between artificial and natural forests using artificial neural networks.

자연림은 산림의 조성 과 보육 등에 인공적인 사람의 힘이 가해지지 않은 자연 상태의 산림이다. 반면 인공림은 사람이 조성 및 보육관리 하는 숲으로 목재생산, 자연재해 예방, 방풍 등의 목적을 가지는 산림이다. 인공림은 목재생산 등 인간이 목적을 가지고 관리하여 단위 면적당 더 많은 목재를 생산할 수 있는 경제적 장점도 가지고 있다. 자연림과 인공림의 구분은 산림 형태의 관리 방법과 목정이 상이하여 산림조사에서 기본적으로 조사하는 요소이며, 자연림과 인공림의 구분은 항공사진 판독과 현지조사 등의 절차를 통해 이루어진다. 본 연구에서는 자연림과 인공림의 분류에 KOMPSAT-3, 3A, 5 위성 영상데이터에 인공신경망(Artificial Neural Network: ANN)을 적용하여 자연림과 인공림의 분류도를 만들고, 산림청의 1/5,000임상도의 자연림과 인공림 분류도와 비교하여 평가하였다. 인공신경망을 이용한 산림의 자연림과 인공림 구분의 연구를 진행한 결과, 1/5,000 임상도와 비교했을 때, 학습결과 분류 전체 정확도는 77.03%이다. 영상의 획득 시기와 산림의 침엽수와 활엽수 등 기타요인이 인공신경망을 이용한 산림의 인공림과 자연림의 구분에 많은 영향을 미치는 것을 확인하였다.

Keywords

1. 서론

산림 복구와 산림 통계를 목적으로 국내의 경우 1970년대 처음으로 산림조사가 이루어졌으며, 국외와 마찬가지로 산림의 가치와 환경의 변화에 따라 산림 조사의 목적이 변화되고 있다. 자원으로서의 가치와 산림이 환경문제에 끼치는 것에 대한 관심이 높아짐에 따라 건전한 산림생태계를 유지하고, 지구환경을 보전 및 보호하며 지속가능한 발전을 위한 목적의 형태로 변화되어왔다(Kim et al., 2011; Kim et al., 2015; Park and Kang, 2015). 자연림은 대다수 활엽수림이 차지하고 있으며, 인공림은 줄기가 곧게 서고 가지가 적어 임분당 수확량이 높은 침엽수를 많이 심는다.

산림조사는 항공사진을 이용한 분석과 사람의 현장 조사를 통해 이루어진다. 산림청은 현재 항공사진을 이용하여 인공림, 자연림, 수종의 구분 등을 수행하며, 항공사진으로 알기 어려운 부분에 대해서는 현장조사가 이루어진다. 국토의 산림 면적이 70% 이상인 우리나라에서의 산림조사는 많은 비용과 시간이 소요된다.

원격탐사는 사람의 접근이 불가능한 지역에 대한 광범위한 탐사에 효과적이며, 시계열적 관측 및 분석이 가능하다. 식생의 분광반사특성은 가시광선 녹색영역에서 반사율이 높고 적색영역에서 반사율이 낮아 녹색으로 보인다. red edge 파장대역에서 반사율의 반응이 커지기 때문에 식생조사를 하는데 효과적이라고 알려져 있다. 침엽수보다 활엽수의 반사율이 높아서 비교적 침엽수와 활엽수의 구분은 쉬운 편이며, 수종 간 미묘한 반사특성 차이로 높은 정확도의 분류 결과를 얻기에는 아직 어려운 단계로 동일 식생이라도 계절 등의 영향에 따라 분광반사특성이 다르게 나타났다(Kwon, 2018). SlideServe.(2014)은 영급에 따른 식생지수(NDVI)의 값에 변화가 있으며, NDVI는 영급과 양의 상관과계로 일정 영급 이상부터는 크게 영향을 받지 않는다고 설명하였다. Markus et al.(2016)은 수종 별로 파장대역에 따른 반사도 차이를 확인하였으며, 각 파장대역에서 활엽수가 칩엽수에 비해 반사도가 높게 나탔다고 설명하였다. Herrmann et al.(2011)은 NDVI와 Red Edge Band는 식생 분류에 유용하다 밝혔다. Murai et al.(1974)은 활엽수의 수분 저장력이 침엽수에 비해 높고 수종에 따라 물 저장 정도에 차이가 있다고 하였다. 영상에서는 그림자의 분포에 의해 영상의 질감이 결정되는데, 수령과 수종이 일정한 단층구조의 인공림의 경우 목본들 사이에 그림자가 일정하여 질감이 부드러우며, 수령과 수종이 다양한 다층구조 자연림의 경우 질감이 거칠다(Hay et al., 1996; Hwang, 2018).

최근 빅데이터(Big data)의 급부상으로 학습에 이용될 데이터가 풍부해진 배경에 맞춰 기계학습을 심화시킨 딥러닝(Deep learning)이 주목받고 있다. 기계학습은 결정 트리(decision tree), 인공신경망(neural network), 포트 벡터 신(support vector machine) 등의 알고리즘이 있으며 훈련 데이터(training data)의 유무에 따라 지도학습(supervised learning)과 비지도 학습(unsupervised learning)으로 나뉜다(Kim, 2011). 지도학습은 정답을 아는 상태로 학습하는 방식을 의미하며, 주어진 데이터의 유추결과가 연속적인 것에 대해 회귀분석(regression)이라 정의하고, 데이터의 결과를 이산적 분류하는 것을 분류(classification)라 한다.

비지도 학습은 결과를 제공받지 않고 알고리즘 스스로 패턴이나 규칙을 만들어 결과를 제공한다. 지도학습은 학습 및 결과 추정과 예측에 조점을 맞추었다면, 비지도 학습은 결과 값을 제공받지 않기 때문에 결과에 대한 검증이 주관적인 판단이 개입된다. 지도 학습처럼 패턴을 이용한 새로운 데이터 결과의 도출에는 사용되지 않는 편이다. 산림의 조사에 광범위한 지역 탐사에 효과적인 인공위성의 영상자료와 방대한 자료를 분석하는데 탁월한 인공신경망(Artificial Neural Network: ANN)은 1943년 McCulloch와 Pitts의 논문에서 최초로 제안되었다. ANN은 신경세포들의 신호전달 체계에서 영감을 얻어 개발된 통계학적 학습 알고리즘으로 사람의 신경구조를 복잡한 스위치들이 연결된 네트워크로 표현할 수 있다고 제안 하였다(Warren et al., 1943; Solaris, 2017). Kang et al.(2000)은 최대우도법보다 정확한 식생도를 인공신경망기법을 통해 작성이 가능해졌고, 인공지능적인 요소를 가미하여 분류하기 애매한 화소값에 대해서도 정확한 작업을 가능하게 하여 신경망 이론의 연구결과가 일반적인 분류기법보다 분류정확도가 높다고 제시하였다. ANN의 장점은 입력데이터로부터 학습 후원하는 근사값의 함수를 만들 수 있는 것이다. ANN은 예측되는 데이터의 근본적인 이해가 중요하며 크게 세 가지로 나눌 수 있다. 지나치게 복잡한 모델은 학습과정에서 Overfitting 결과가 발생할 수 있으며, 복잡한 데이터의 예측은 많은 연구와 시간의 투자가 필요하다. 적절한 알고리즘의 선택은 ANN의 분석결과는 높은 예측값을 가지게 된다. 따라서, ANN을 사용한다면 많은 비용이 발생하는 항공사진촬영과 사람이 직접 조사하는 비용에 비해 상당히 효과적이라고 볼 수 있겠다.

Kwon(2018)은 국내의 경우 자연림과 인공림의 분류의 경우 수종(침엽수/활엽수)의 영향을 많이 받고, 5월의 영상에서 분광적 차이가 자연림과 인공림 분류에 적절하다고 분석하였다. 이에 본 연구는 우리나라 위성인 KOMPSAT-3, 3A, 5의 위성에서 촬영된 다양한 영상을 활용하였다. 산림청의 1/5,000 임상도의 자연림, 인공림, 침엽수, 활엽수의 정보와 KOMPSAT-3, 3A,IR(Infra-red)의 위성영상을 국토지리정보원의 DEM(5 m급)을 이용하여 지형보정 후 IR맵 제작, Multispectral 영상에 대하여 정규식생지수(NrmalizedDifference Vegetation Index)와 정규 수분지수(Normalized Difference Water Index)의 지수맵과 지수 텍스쳐맵(Texture Map)을 제작하였다. KOMPSAT-5 위성 레이더 영상은 텍스쳐맵을 제작 후 SRTM(약 30 m급)을 이용하여 지형보정을 수행하였다. 제작된 데이터들을 ANN에 적용하여 학습시키고, ANN 학습을 통한 확률도를 제작하고, 확률도로부터 임계값을 설정하여 자연림, 인공림 분류도를 제작한다. 침엽수와 활엽수의 분광적 차이가 확실하고 식생분석이 어려운 계절인 초봄(4월), 가을(10월), 겨울(2월)의 광학, IR, 레이더영상 까지 활용한 최종 분류도와 산림청의 1/5,000 임상도를 비교 분석하고자 한다.

2. 연구 지역 및 사용 데이터

본 연구의 연구지역은 산악지형이 많은 우리나라의 강원도 삼척시 일원으로 많은 산림이 골고루 분포되어있다. ANN연구를 위해 수집된 각 영상의 범위를 고려하여 연구영역을 설정하였다. 연구영역은 자연림, 인공림, 침엽수, 활엽수의 구분이 임상도에 고루 분포되고 있다. 연구영역은 산림의 계절적 분광차이가 있는 지역과 없는 지역 같이 존재하여 산림의 구분에 영향이 있는 지역으로 선정하였다. Fig. 1은 연구지역이며 좌측 한반도에서 붉은 색으로 표시된 영역이 삼척시 지역에 해당한다. 우측 정사영상은 본 연구에서 사용한 KOMPSAT-3의 정사영상이며, 빨간색 점선박스가 실제 ANN 연구지역이다. 본 연구에서는 2017년 10월 31일 가을시기에 촬영되어 제작된 KOMPSAT-3 Fig. 2(a)의 Multispectral 정사 영상은 GSD(Ground Sample Distance)가 2.8 m 급이며, 태양 방위각과 고도각은 각 36.13°, 160.13°이다. Fig. 3(b), (c)의 KOMPSAT-3A Multispectral,IR 정사영상은 2018년 2월 16일 겨울시기에 촬영되었으며, GSD는 각 2.2 m, 33m이다. 태양 방위각과 고도각은 각 36.53°, 150.09°이다(Table 1). Fig. 3(a), (b)의 KOMPSAT-5 위성 레이더영상은 Fig. 3(a)의 Ascending영상의 제원은 2018년 2월 13일에 촬영, Incidence angle 47.90°, Azimuth spacing 1.99 m, ground range spacing 1.93 m, Fig. 3(b)의 Descending영상의 제원은 2017년 4월 7일에 촬영, Incidence angle 45.46°, Azimuth spacing 1.85 m, ground range spacing 1.95 m이다(Table 2). 촬영모드는 모두 Stripmap 이다. KOMPSAT-3, 3A위성 정사영상의 지형보정을 위해 국토지리정보원에서 제작된 5 m급의 DEM을 사용하였다(Fig. 4(a)). 임상도정보는 산림청의 산림공간서비스를 통하여 1/5,000 임도를 제공 받았으며,Fig. 4(b)는 산림청의 1/5,000 임상도를 통해 연구 지역에 인공림과 자연림에 대한 분포도이다. Fig.4(c)는 임상도정보 중 침엽수와 활엽수에 대한 분포도이다. 영상, 임상도, DEM 등 모든 영상 연구자료는 지형보정 등을 수행 후 동일한 픽셀을 계산하기 위해 같은 사이즈(가로 800 m × 세로 800 m)로 컷팅하였으며, GSD를 2.2 m로 resampling 하였다. 좌표계는 GRS80(동부원점)을 이용하였다.

Table 1. Parameters of KOMPSAT-3 and -3A images used in this study

OGCSBN_2018_v34n6_3_1399_t0001.png 이미지

Table 2. Parameters of KOMPSAT-5 image used in this study

OGCSBN_2018_v34n6_3_1399_t0002.png 이미지

OGCSBN_2018_v34n6_3_1399_f0001.png 이미지

Fig. 1. Study Area, the RGB map of Samcheok, Korea; Red dotted box indicates the study area.

OGCSBN_2018_v34n6_3_1399_f0002.png 이미지

Fig. 2. Real color image from (a) KOMPSAT-3, (b) KOMPSAT-3A, (c) KOMPSAT-3A Infra-red band.

OGCSBN_2018_v34n6_3_1399_f0003.png 이미지

Fig. 3. Normalized texture maps from ascending(a) and descending(b) KOMPSAT-5 Acquisitions.

OGCSBN_2018_v34n6_3_1399_f0011.png 이미지

Fig. 4. (a) Digital elevation model(5m) from National geographic information institute (NGII), (b) reference data from 1/5,000 stock map which shows the spatial distribution of natural and artificial forests, (c) the spatial distribution of Needleleaf and Broadleaf Tree from 1/5,000 stock map.

3. 연구 방법

Fig. 5는 본 연구의 전체적인 연구흐름을 나타낸다. 대기 효과는 위성 영상에서 공간적으로 저주파 형태로 나타난다. 일반적으로 이러한 특성을 바탕으로 광학 영상자료를 활용할 때에 대기효과에 대한 보정을 수행한다. 하지만 본 연구 지역의 경우 산악지역으로 구성된 매우 좁은 영역이기 때문에 대기 효과에 의한 변이가 공간적으로 유사하다. 따라서 대기보정의 유무가 최종 처리 결과에 큰 영향을 주지 않을 것이라 판단했다.

OGCSBN_2018_v34n6_3_1399_f0004.png 이미지

Fig. 5. Overall data process.

이 때문에 대기효과에 대한 보정을 수행하지 않았다. 한편 본 연구지역은 산악지형으로 지역적인 지형효과가 심하게 발생했다. 악지역에서 발생한 지형 오차의 경우 학습 과정 및 분류결과에 오차를 야기할 수 있다. 따라서 본 연구에서는 지형효과에 대한 보정을 수행했다. 인공위성 영상 자료는 지형이 편평하지 않아 태양입사각의 영향을 받기 때문에 지형보정처리를 거친다. 산악지역특성상 태양입사각에 영향으로 태양 경사면과 그늘 경사면이 생긴다. 태양 경사면은 일반적으로 낮은 반사도를 가지게 된다. Manqi et al.(2013)은 지형보정처리 효과가 분류정확도를 향상 시켰음을 제시한바 있다. 태양입사각의 영향 최소화하여 ANN 분류 정확도를 향상시키기 위해 지형보정처리를 수행하였다. 지형보정 처리는 가장 널리 이용되는 지형보정 모델 중 Statisticalempirical 모델을 선택하여 KOMPSAT-3, 3A 영상을 지형보정을 수행하였고, 보정식은 식 (1)과 같다(Teillet et al., 1982; Kwon et al., 2017).

 \(\rho_{h}=\rho-\{a \cos i+b\}+\bar{\rho}\)      (1)

Fig. 6은 지형보정효과를 육안으로 보기 위한 그림이다. Fig. 6(a), (b)는 KOMPSAT-3 Multispectral 영상의 지형보정적용 전·후 이며 사면에 의한 영향이 저감된 것을 확인할 수 있다. Fig. 6(c), (d)는 KOMPSAT-3A의 Multispectral 영상의 지형보정적용 전·후는 KOMPSAT-3의 영상보다 육안으로 지형보정효과가 크게 드러나지 않았다. KOMPSAST-3A 지형보정효과가 적은 이유는 영상의 구름 등 대기의 영향으로 예측된다. 지형보정이 완료되면 밴드별 SUN LIT, SUN Shading slop의 히스토그램의 변화를 확인 할 수 있다. 지형보정이 완료된 영상으로부터 NDVI, NDWI, Texture map를 제작하였다. Fig. 7은 KOMPSAT-3의 지형보정 전·후 RED, GREEN, BLUE, NIR 밴드(Band)의 히스토그램(Histogram)을 나타낸다. Fig. 8은 KOMPSAT-3A의 지형보정 전·후 RED, GREEN, BLUE, NIR 밴드(Band)의 히스토그램을 나타낸다. 각 밴드별 SUN LIT, SUN Shading slop의 히스토그램이 정확하게 일치할수록 지형보정효과가 높다고 볼 수 있다. 지형보정이 완료된 영상은 Fig. 9(a), (b)와 같이 각 위성영상 별 RED 밴드와 NIR 밴드의 조합으로 식생의 적색광과 근적외선의 반사율에 차이가 큰 특징을 이용하는 NDVI 지수맵을 작성하고 값이 1에 가까울수록 식생의 밀도가 높게 나타난다. Fig. 9(c), (d)와 같이 Green 밴드와 NIR 밴드의 차이를 이용하여 식생의 캐노피 수분함량에 따른 분광 특성을 이용한 NDWI 지수맵을 제작하였다.

OGCSBN_2018_v34n6_3_1399_f0005.png 이미지

Fig. 6. Topographic corrected images; KOMPSAT-3 images of (a) before correction and b) after correction, KOMPSAT-3A images of (c) before correction and (d) after correction.

OGCSBN_2018_v34n6_3_1399_f0006.png 이미지

Fig. 7. KOMPSAT-3 digital number distribution of before (a, c, e, g) and after (b, d, f, h) topographic correction; red band (a, b); green band (c, d); blue band (e, f); and Near-infrared band (g, h).

OGCSBN_2018_v34n6_3_1399_f0007.png 이미지

Fig. 8. KOMPSAT-3A digital number distribution of before (a, c, e, g) and after (b, d, f, h) topographic correction; red band (a, b); green band (c, d); blue band (e, f); and Near-infrared band (g, h).

OGCSBN_2018_v34n6_3_1399_f0008.png 이미지

Fig. 9. NDVI maps of KOMPSAT-3 (a), KOMPSAT-3A (b), NDWI maps of KOMPSAT-3 (c) and KOMPSAT-3A (d); Texture map of KOMPSAT-5 (e); texture maps of KOMPSAT-3 NDVI map (f) and KOMPSAT-3A NDVI map (g), texture maps of KOMPSAT-3 NDWI map (h) and KOMPSAT-3A NDWI map (i); and Infrared map of KOMPSAT-3A (j).

다음으로 제작한 데이터는 질감(texture) 데이터이다. 제작된 지수맵은 식생지역을 판별하는데 입력 자료로 사용될 수 있으나, 보다 세분화된 산림정보 추출을 위해서는 산림의 특성을 구분할 수 있는 영상자료 기반의 정보가 요구된다.

산림의 밀도 표현 지수는 지표의 거칠기 정보를 나타내는 텍스쳐맵 제작을 통해 수행될 수 있다. 위성 레이더영상은 두 영상의 융합을 위해서 먼저 상·하향 궤도 영상을 서로 차분하여 차분영상을 생성하였다. 차분영상의 값 분포의 평균과 표준편자를 계산하여 차분 영상의 값 분포가 신뢰구간 99%를 넘어가는 경우 지형에 의한 효과 혹은 노이즈에 의한 효과로 고려하고 작은 화소값을 선택하였다. 또한 화소 값의 차이가 99% 신뢰구간을 넘어가지 않는 경우 상·하향 궤도 영상의 평균값을 적용함으로써 오차를 저감하였다. Fig. 9(e)와 같이 최종 Adaptive Fusion을 통해 KOMPSAT-5 위성 레이더 영상의 텍스쳐맵을 제작. Fig. 9(f), (g)와 같이 KOMPSAT-. 3A의 NDVI, Fig. 9(h), (i)와 같이 KOMPSAT-3. 3A의 NDWI 지수맵의 각 텍스쳐맵을 제작하였다.

자연림과 인공림의 분류에 사용된 딥러닝(Deep Learning) 기법 중 ANN이다.

기계학습은 학습을 위한 많은 데이터와 참값이 요구되며, 학습 데이터가 많으면 해당 분석 알고리즘을 반복적으로 처리하는 능력을 갖게된다. ANN은 병렬처리 측면에서 인공신경망을 기술한 이후 최근까지 다양한 분양에서 활발하게 연구되고 있는 방법이다. Fig. 10은 ANN의 모식도로, 본 연구에서는 학습을 위해 멀티레이어 퍼셉트론 알고리즘(MultiLayer Perceptrons Algorithms; MLP)을 활용하였으며, 기존의 퍼셉트론이 선형 분류의 한계에 의해 해결할 수 없었던 문제를, MLP 알고리즘은 중간 레이어(Hidden Layer)를 추가함으로써 여러개의 선형 분류 판별선을 그리는 효과로 문제를 해결할 수 있었다(McClelland et al., 1986). MLP 알고리즘은 Input Layer, Hidden Layer, Output Layer로 구성되어 있으며, 각 시냅스(synapse)간 연결강도를 조정하며 최종적으로 예측 및 추정을 수행한다.

OGCSBN_2018_v34n6_3_1399_f0009.png 이미지

Fig. 10. A schematic diagram of an artificial neural network using multiple perceptrons

MLP 알고리즘은 학습을 위해 오차 역전파 학습기법을 사용하고 있다. 오차 역전파 기법은 전방향 네트워크(feed-forward network)로 입력신호가 은닉층으로 전달되어, 최종적으로 출력되는 것이다. 출력값과 참값을 비교하며 오차를 구하고, 오차를 줄여나가는 방향으로 오차를 전파하여 가중치를 수정한다. 연결강도를 조정하기 위한 활성화 함수(activation function)가 사용되는데, 본 연구에서는 일반적으로 사용되는 단극성 시그모이드 함수(Logistic)가 사용되었고, 그 식은 식 (2)와 같다. 결과값을 함수에 따라 0부터 1 사이의 값으로 조정하고, 이는 0 또는 1의 확률로 결과를 나타낸다(Kwon, 2018; Hwang, 2018).

\( \begin{aligned} \sigma(z)=& \frac{1}{1+\exp (-z)} & \frac{\partial \sigma}{\partial z}(z)= \\ & \sigma(z)(1-\sigma(z)) \end{aligned} \)       (2)

자연림과 인공림 구분을 위한 ANN 도구로 대량의 데이터 마이닝(Data Mining)도구로 널리 사용되고 있는 오픈 소프트웨어 WEKA(Waikato Environment for Knowledge Analysis)를 사용하였(Witten et al., 2005). WEKA의 많은 알고리즘 중에서 ANN을 위한 MultiLayer Perceptrons 알고리즘을 사용해서 데이터 마이닝을 수행하였다. ANN의 입력자료로 KOMPSAT-3, 3A의 영상으로 제작한 NDVI, NDWI, NDVI Texture, NDWI Texture, IR, KOMPSAT-5 Texture map 까지 총 10개의 맵을 제작하였다. WEKA를 통한 데이터 마이닝을 위해 NDVI, NDWI, Textur map, IR map, 임상도를 ASCII(American Standard Code for Information Interchange)타입으로 변환 하였다. 임상도를 참조하여 각 영상에서 비산림지역을 제외한 픽셀값을 취득하여 영상 당 총 462,493개의 픽셀값을 자연림과 인공림 분석에 사용하였다.

WEKA Input layer로 KOMPSAT-3의 NDVI, NDWI, NDVI Texture, NDWI Texture, KOMPSAT-3A의 NDVI, NDWI, NDVI Texture, NDWI Texture, IR, KOMPSAT-5 Texture mpa의 픽셀값과 임상도의 자연림은 0, 인공림은 1로 인식하도록 구분하여, WEKA에 대한 입력 레이어(Input layer)로 하여 자연림과 인공림 분류에 관한 학습 및 분류를 수행하였다.

4. 연구 결과

WEKA를 통해 자연림과 인공림 구분 학습으로 이루어진 각 픽셀에 대한 확률데이터를 래스터화하기전 원하지 않는 정보인 노이즈(noise)를 가지고 있기 때문에 이를 감소시키기 위해 3×3 크기의 중앙값 필터(median filter)를 적용하였다. 노이즈를 제거한 통계데이터를 자연림과 인공림에 대한 확률도로 제작하였다(Fig. 11). 확률도의 히스토그램에서 0.78의 확률값을 임계값으로 설정하고 인공림<0.78≦자연림으로 분류하여 분류도를 작성하였다. Fig. 12(c)는 최종 ANN의 결과로 작성된 분류도 결과이다. 정확도를 분석하기 위해 Fig. 12(a)의 임상도 자연림과 인공림 구분도와 Fig. 12(b)의 임상도의 침엽수와 활엽수 구분도를 분류도와 비교하여 수행하였다.

OGCSBN_2018_v34n6_3_1399_f0010.png 이미지

Fig. 11. Probability map of artificial forest viaANN approach.

OGCSBN_2018_v34n6_3_1399_f0012.png 이미지

Fig. 12. (a)Reference data of Forest type from 1/5000 stock Map, (b)tree type map from 1/5000 stock Map, (c) Forest type Classification Map using ANN.

침엽수와 활엽수의 정보를 추가한 이유는 활엽수는 자연림에 많이 포함되어있고 인공림에는 거의 조성이 없었다. 또한 침엽수는 인공림의 조성에 많이 이용되기 때문이다. 인공림과 자연림의 구분에서 침엽수와 활엽수의 정보를활용함으로써 추가적인 분석확률을 추정하기 위함이다.

Table 3과 같이 ANN 분류에 관한 오차행렬(Error Matrix)를 작성하여 분석을 하였다. 먼저 총 픽셀수는 466,264개이며, ANN이 인공림구분으로 침엽수인 인공림을 27,016개, 활엽수인 인공림을 277개로 맞게 구분하였고, ANN이 자연림구분으로 침엽수인 자연림을 276,314개, 활엽수인 자연림을 55,572개로 맞게 구분하였다.

Table 3. Error matrix of classification

OGCSBN_2018_v34n6_3_1399_t0003.png 이미지

이를 통해 계산된 전체정확도(overall accuracy), 즉 오차행렬의 대각선 픽셀수의 합을 총 픽셀수로 나눈 77.03%이다. 생산자 정확도(producer accuracy)는 오차 행렬의 대각선 픽셀수를 임상도의 항목당 계로 나눈 것이다. 침엽수에 대한 인공림의 생산자 정확도는 74.01%이며 자연림의 생산자 정확도는 82.63%이다. 활엽수에 대한 인공림의 생산자 정확도는 64.12%이며 자연림의 생산자 정확도는 58.53%이다. 사용자 정확도(User accuracy)는 오차행렬의 대각선 픽셀수를 ANN을 이용해 분류된 각 항목 당 계로 나눈 것이다. 인공림의 사용자 정확도는 21.88%이며, 자연림의 사용자 정확도는 97.18%이다.

ANN의 분류결과에 영향의 요인으로는 첫째, 인공림의 정확도의 분석은 최종 사용자 정확도는 21.88%로 낮게 나타난다. 산림통계연보(2018)에 따르면, 인공림의 91%가 소나무, 잣나무 등 침엽수림이다. 즉 높은 확률로 대부분의 인공림은 침엽수림이며, 활엽수림은 자연림이라고 볼 수 있다. 이는 침엽수림인 인공림과 자연림의 트레이닝 결과가 구분될 확률이 낮아질 가능성을 의미한다. 둘째, 영상의 촬영시점이 계절적으로 KOMPSAT-3 영상은 10월에 촬영된 가을시기였기에 육안확인 결과 많은 양의 나뭇잎이 확인되었고, KOMPSAT-3A의 영상은 2월에 촬영된 겨울시기였기 때문에 활엽수 등의 나뭇잎이 많이 떨어진 상태였다.

KOMPSAT-5 위성 레이더영상 역시 ascending, descending 영상이 각 2월과 4월에 1년의 차이로 촬영되었기 때문에 나뭇잎이 많은 시기에 촬영된 영상이 아니라는 점을 감안해야한다. NDVI, NDWI, Texture map이 식생의 촬영시기에 영향을 크게 받는 맵이기 때문에 ANN의 분류 확률에 영향을 주었을 것이다.

ANN의 최종 산림 구분도를 육안으로도 확인한 결과 자연림과 인공림의 경계부분에서 ANN의 산림 구분 확률이 낮다고 예측이 되었다. 인공림의 조성된 시기가 오래 되었을수록 자연림에 가까워져서 구분이 어려웠을 것으로 판단된다.

오차행렬에 대한 최종 결과로 인공림과 자연림의 구분에서 침엽수림의 나무의 정보나 토양 등 추가 교육 자료와 균일한 시기의 촬영영상을 사용한다면 더 높은 분류결과를 얻을 것으로 예상된다.

5. 결론

넓은 지역을 탐사하는데 효과적인 원격탐사는 인간의 접근이 용이하지 않은 산림의 분석과 조사에 유용한 접근 방법이다. 광범위한 데이터를 분류하는데 탁월한 인공신경망을 결합하여 연구, 분석하는 것은 상당히 유용하다고 할 수 있다.

산림에 대한 원격탐사와 머신러닝 기법을 이용한 분석은 대다수 산림과 비산림의 구분에 대한 연구가 많았으며, 아직까지 머신러닝을 이용한 산림 연구형태의 다양한 사례는 많지 않았다.

산림은 조성시기, 목적 등 다양한 사례로 자연림과 인공림으로 구분되며, 침엽과 활엽수의 산림형태가 가지는 분광적, 생물학적 특징을 고려하여 위성영상과 인공신경망에 인한 학습 및 분류는 많은 시간과 인력이 필요하지 않기 때문에 효과적인 연구방법으로 고안하였다.

원격탐사 자료로 우리나라 위성인 KOMPSAT-3, 3A, R, G, B, NIR band와 IR영상 그리고 X-band KOMPSAT-5 영상을 식생분석에 사용함으로써 다양한 band의 활용을 고려해 보았다.

본 연구에서는 지형보정을 수행한 KOMPSAT-3, 3A 위성영상으로부터 NDVI, NDWI, NDVI Texture, NDWI Texture, IR map을 제작하였다. KOMPSAT-5 위성 레이더의 영상의 Texture map를 제작하였다. 임상도의 자연림과 인공림 경계 래스터로 제작하였고, 제작된 모든 데이터를 하나의 데이터로 오픈소스 WEKA를 이용한 인공신경망의 학습 자료로 사용하였다. 학습결과로 얻은 확률도에 임계값 0.78을 설정하여 인공림과 자연림 구분도를 제작하였다. 제작된 구분도의 오차행렬(Error Matrix)을 분석한 결과 침엽수에 대한 인공림의 생산자 정확도는 74.01%, 자연림의 생산자 정확도는 82.63%이다. 활엽수에 대한 인공림의 생산자 정확도는 64.12%, 자연림의 생산자 정확도는 58.53%이다. 인공림의 사용자 정확도는 21.88%, 자연림의 사용자 정확도는 97.18%이다. 전체 정확도는 77.03%였다.

우리나라의 경우 계절의 변화가 침엽수와 활엽수에 많은 영향을 주게 되는데, 늦봄부터 초가을까지 침엽수와 활엽수를 육안으로도 확인할 수 있는 시기다. 늦가을 낙엽이 떨어지는 시기부터 새잎이 자라는 봄까지 침엽수와 활엽수의 육안 구분은 가능하지만 분광적 차이가 있는 자연림과 인공림의 구분은 어렵다.

인공림이 조성되고 오랜 시간이 지나면 자연림과 큰 차이가 없는 천이과정을 거치되면 인공림과 자연림의 지수맵으로 구분이 어렵게 된다. 인공신경망의 분류 확률이 계절적인 특성에 따라 상당수의 산림이 다르게 분류되었을 것으로 예측된다. 인공림과 자연림에 ANN의 분류결과 연구 자료인 영상의 촬영시기가 각 계절 특성이 크게 다른 점과 영상별 원본 해상도, 자연림과 인공림의 다양한 형태와 구조가 많은 지역적 특성 등으로 인공신경망으로 자연림과 인공림만의 특성을 구분하기 어려웠을 것으로 판단된다. 또한 자연림과 인공림이 만나는 경계부분에서의 ANN분류 확률도 게 나오는 것을 육안으로 확인하였다. 이러한 단점을 극복하기 위해 좀 더 많은 학습 자료를 필요로 하는데 오차행렬을 통해 인공림과 자연림의 인공신경망을 이용한 분류 시 침엽수와 활엽수의 정보가 중요하게 작용할 것이라는 예측이 되었다. 본 연구에서 다양한 시기의 영상자료를 확보하여 활용하지 못했다는 점과 다양한 기계학습 기법을 이용하지 못한 아쉬운 점이 남아있으며, 산림의 자연림과 인공림의 군락나무의 특성, 토양의 재질 등 많은 정보를 포함하여 기계학습의 학습데이터로 분석을 수행한다면 광범위한 원격탐사의 산림 연구, 조 분야에서 더욱 발전이 가능할 것으로 기대된다.

사사

이 연구는 한국항공우주연구원의 아리랑위성 시리즈 영상자료를 이용한 확률기반 타겟인지 기술개발과 한국환경산업기술원의 자연보전정책 대응기술개발 사업(2016000210001)의 지원을 받아 수행되었습니다.

References

  1. Hay, G. J., K. O. Niemann, and G.F. McLean, 1996. An object-specific image-texture analysis of Hresolution forest imagery, Remote Sensing of Environment, 55(2): 108-122. https://doi.org/10.1016/0034-4257(95)00189-1
  2. Herrmann, I., A. Pimstein, A. Karnieli, Y. Cohen, V. Alchanatis, and D. J. Bonfil, 2010. LAI assessment of wheat and potato crops by $VEN{\mu}S$ and Sentinel-2 bands, Remote Sensing of Environment, 115: 2141-2151.
  3. Huang, C., K. Song, S. Kim, J. R. G. Townshend, R. Davis, J. G. Masek, and S. N. Goward, 2008. Use of a dark object concept and support vector machines to automate forest cover change analysis, Remote Sensing of Environment, 112(3): 970-985. https://doi.org/10.1016/j.rse.2007.07.023
  4. Hwang, J. I., 2018. Ship detection from single and dual polarized X-band SAR images using machine learning techniques, Seoul National University, Seoul, Korea (in Korean with English abstract).
  5. Kang, H. Y., I. J. Kang, H. Choi, and S. C. Lee, 2000. The Estatimate of Image Classification Accuracy Using Artificial Neural Networks, Journal of The Korean Society Of Civil Engineers, 2000(4): 585-588.
  6. KIM, D. S., 2017. Oil spill detection from dual-polarized SAR images using artificial neural network, Seoul National University, Seoul, Korea (in Korean with English abstract).
  7. Kim, D. S., H. S. Jung, and W. K. Baek, 2016. Comparative Analysis among Radar Image Filters for Flood Mapping, Journal of the Korean Society of Surveying, Geodesy, Photogrammetry, and Cartography, 34(1): 43-52 (in Korean with English abstract). https://doi.org/10.7848/ksgpc.2016.34.1.43
  8. Kim, E. S., C. M. Kim, K. M. Kim, J. H. Ryu, J. S. Lim, and J. C. Kim, 2015. The Change of Korean National Forest Inventory System (1971-2010), Korea Forest Institute, Seoul, Korea (in Korean).
  9. Kim, S. H., J. C. Kim, J. H. Ryu, J. S. Kim, S. A. Seo, H. K. Cho, B. O. Yoo, W. B. Sim, J. H. Seong, B. B. Park, J. S. Lim, I. B. Jeong, and J. W. Shin, 2011. Guide Book for the Sixth Korean National Forest Inventory and Fieldwork for Forest Health and Vitality, Korea Forest Institute, Seoul, Korea (in Korean).
  10. Kwon, S. K., 2018. Classification of Natural Forest/Artificial Forest from Sentinel-2 Images Using Artificial Neural Network, Seoul National University, Seoul, Korea (in Korean with English abstract).
  11. Kwon, S. K., H. S. Jung, W. K. Baek, and D. S. Kim, 2017. Classification of Forest Vertical Structrue in South Korea from Aerial Orthophoto and Lidar Data Using an Artificial Neural Network, Applied Science, 7(10): 1046. https://doi.org/10.3390/app7101046
  12. Lee, S. G., H. J. Lee, C. W. Sung, C. H. Park, W. S. Cho, and Y. S. Kim, 2010. A Topographical Classifier Development Support System Cooperating with Data Mining Tool WEKA from Airborne LiDAR Data, Journal of the Korean Society of Surveying, Geodesy, Photogrammetry, and Cartography, 28(1): 133-142 (in Korean with English abstract).
  13. Manqi, L., J. H. Im, and C. Beier, 2013. Machine learning approaches for forest classification and change analysis using multi-temporal Landsat TM images over Huntington Wildlife Forest, GIScience & Remote Sensing, 50(4): 361-384. https://doi.org/10.1080/15481603.2013.819161
  14. Markus, I., F. Vuolo, and C. Atzberger, 2016. First Experience with Sentinel-2 Data for Crop and Tree Species Classifications in Central Europe, Remote Sensing, 8(3).
  15. McClelland, J. L., D. E. Rumelhart, and G. E. Hinton, 1986. Parallel distributed processing: explorations in the microstructure of cognition. Volume 1. Foundations, United States.
  16. McCulloch, W. S, and W. Pitts, 1943. A logical calculus of the ideas immanent in nervous activity, The Bulletin of Mathematical Biophysics, 5(4): 115-113. https://doi.org/10.1007/BF02478259
  17. Murai, H. and Y. Iwasaki, 1975. Studies on function of water and soil conservation based on forest land part 1 influence of difference in forest condition upon water runoff infiltration and soil erosion, Bulletin for the Forestry and Forest Products Research Institute, 274: 23-84.
  18. Park, S. G. and H. M. Kang, 2015. Characteristics of Vegetation Structure in Chamaecyparis Obtusa Stands1, Korean Journal of Environment and Ecology, 29(6): 907-916 (in Korean with English abstract). https://doi.org/10.13047/KJEE.2015.29.6.907
  19. SlideServe, 2014. Comparison of Grade and Vegetation Index of Evergreen Forest in Gangwon Province Using Forest Geographic Information System and Landsat Satellite Image, https://www.slideserve.com/latham/landsat, Accessed on Dec. 14, 2018.
  20. Solaris, 2017. History of Deep Learning - From Perceptron to GAN (Generative Adversarial Networks) - 1/2, http://solarisailab.com/archives/1206, Accessed on Dec. 4, 2018.
  21. Teillet, P. M., B. Guindon, and D. G. Goodenough, 1982. On the Slope-Aspect Correction of Multispectral Scanner Data, Canadian Journal of Remote Sensing, 8(2): 84-106. https://doi.org/10.1080/07038992.1982.10855028
  22. Witten, I. h. and E. Frank, 2005. Data Mining: Practial Machine Learning Tools and Technique (2E), Elsevier, Atlanta, GA, USA.

Cited by

  1. 최근 다목적실용위성 시리즈 활용 현황 vol.36, pp.6, 2018, https://doi.org/10.7780/kjrs.2020.36.6.2.1
  2. 심층신경망을 이용한 KOMPSAT-3/3A/5 영상으로부터 자연림과 인공림의 분류 vol.37, pp.6, 2021, https://doi.org/10.7780/kjrs.2021.37.6.3.5