DOI QR코드

DOI QR Code

Classification of Industrial Parks and Quarries Using U-Net from KOMPSAT-3/3A Imagery

KOMPSAT-3/3A 영상으로부터 U-Net을 이용한 산업단지와 채석장 분류

  • Che-Won Park (Department of Geoinformatics, University of Seoul) ;
  • Hyung-Sup Jung (Department of Geoinformatics, University of Seoul) ;
  • Won-Jin Lee (Environmental Satellite Center, National Institute of Environmental Research) ;
  • Kwang-Jae Lee (National Satellite Operation & Application Center, Korea Aerospace Research Institute) ;
  • Kwan-Young Oh (National Satellite Operation & Application Center, Korea Aerospace Research Institute) ;
  • Jae-Young Chang (National Satellite Operation & Application Center, Korea Aerospace Research Institute) ;
  • Moung-Jin Lee (Center for Environmental Data Strategy, Korea Environment Institute)
  • 박채원 (서울시립대학교 공간정보공학과) ;
  • 정형섭 (서울시립대학교 공간정보공학과) ;
  • 이원진 (국립환경과학원 환경위성센터) ;
  • 이광재 (한국항공우주연구원 국가위성정보활용지원센터) ;
  • 오관영 (한국항공우주연구원 국가위성정보활용지원센터) ;
  • 장재영 (한국항공우주연구원 국가위성정보활용지원센터) ;
  • 이명진 (한국환경연구원 환경데이터전략센터)
  • Received : 2023.11.24
  • Accepted : 2023.12.05
  • Published : 2023.12.31

Abstract

South Korea is a country that emits a large amount of pollutants as a result of population growth and industrial development and is also severely affected by transboundary air pollution due to its geographical location. As pollutants from both domestic and foreign sources contribute to air pollution in Korea, the location of air pollutant emission sources is crucial for understanding the movement and distribution of pollutants in the atmosphere and establishing national-level air pollution management and response strategies. Based on this background, this study aims to effectively acquire spatial information on domestic and international air pollutant emission sources, which is essential for analyzing air pollution status, by utilizing high-resolution optical satellite images and deep learning-based image segmentation models. In particular, industrial parks and quarries, which have been evaluated as contributing significantly to transboundary air pollution, were selected as the main research subjects, and images of these areas from multi-purpose satellites 3 and 3A were collected, preprocessed, and converted into input and label data for model training. As a result of training the U-Net model using this data, the overall accuracy of 0.8484 and mean Intersection over Union (mIoU) of 0.6490 were achieved, and the predicted maps showed significant results in extracting object boundaries more accurately than the label data created by course annotations.

대한민국은 인구 증가와 산업 발전의 결과로 많은 양의 오염물질을 배출하는 국가이자, 지리적 위치로 인해 월경성 대기오염의 심각한 영향을 받는 국가이다. 국내외에서 발생하는 오염물질이 대한민국의 대기오염에 큰 피해를 야기하는 상황에서, 대기 오염물질 배출원의 위치 정보는 대기 중 오염물질의 이동 및 분포를 파악하고, 국가 차원의 대기오염 관리 및 대응 전략을 수립하는 데 매우 중요하다. 본 연구는 이러한 배경을 바탕으로, 고해상도 광학위성 영상과 딥러닝 기반의 영상 분할 모델을 활용하여 대기오염 현황을 분석하는 데 필수적인 국내외 대기오염물질 배출원의 공간 정보를 효과적으로 획득하는 것을 목표로 수행되었다. 특히, 월경성 대기오염에 크게 기여하는 것으로 평가된 산업단지와 채석장을 주요 연구 대상으로 선정하였으며, 이들 영역에 대한 다목적실용위성 3호 및 3A호의 영상들을 수집하여 전처리한 후, 모델 학습을 위한 입력 및 라벨 데이터로 변환하였다. 해당 데이터를 활용하여 U-Net 모델을 학습시킨 결과, 전체 정확도는 0.8484, mean Intersection over Union (mIoU)은 0.6490을 달성하였다. 모델의 예측 결과 맵은 코스 어노테이션(Course Annotation) 방식으로 제작된 라벨 데이터보다 객체의 경계를 더욱 정확하게 추출하는 것으로 나타나, 데이터 처리 및 모델 학습 방법론의 유효성을 입증하였다.

Keywords

1. 서론

대기오염은 대기 중에 존재하는 오염물질의 농도가 자연 환경의 자정 능력을 넘어선 상태를 일컫는다. 산업혁명 이후 세계는 급속한 사회경제적인 발전을 이루었지만, 동시에 막대한 화석연료 소비 및 무분별한 도시 개발은 다량의 오염물질을 대기로 분출하여 심각한 수준의 대기오염을 경험하고 있다. 대기 중에 떠다니는 유해 물질은 호흡, 음식물 섭취, 신체 접촉 등의 다양한 경로를 통해 인간의 건강을 위협하기 때문에, 전 세계적으로 대기오염 실태를 파악하고 대기질을 개선하기 위한 사회·제도적인 노력이 계속되고 있다.

동북아시아는 인구 증가와 산업 발전으로 인해 인위적인 오염물질이 대량 발생하는 주요 지역 중 하나이다(Kim et al., 1997). 이 지역에서도 동쪽 끝단에 위치한 대한민국은 편서풍의 영향으로 인해 타국에서 발생한 오염물질이 지속적으로 유입되고 있으며, 이는 국가의 대기오염물질 농도에 크게 기여하고 있다(Eom and Oh, 2019). 선행연구에 따르면, 대한민국의 대기오염물질 농도에서 국외 요인이 차지하는 비율은 40%에서 70% 사이로 추정되고 있다(Bae et al., 2020; Bae and Kim, 2022; Han et al., 2018; Kumar et al., 2021). 따라서 정확한 대기오염 현황 파악을 위해 국내 지역에 국한된 기존의 대기오염물질 배출원 관리 체계를 주변 국가로 확대할 필요가 있다.

대기오염물질 배출원의 위치 정보는 대기 중 오염물질의 이동 및 분포를 이해하는 데 핵심적인 자료로 활용될 수 있다. 대한민국과 같이 대기오염물질의 상당 부분이 해외로부터 유입되는 경우, 해외 배출원의 정확한 위치 파악은 대기오염의 발원지를 식별하고, 그 이동 경로를 추정하는 데 필수적이다. 이러한 정보는 대기오염 관리 및 완화 전략 수립에 중요한 기여를 할 수 있다. 그러나, 물리적 거리와 보안 문제 등으로 인해 국외 대기 오염 배출원 정보의 획득은 여전히 어려운 과제로 남아있다.

위성 원격탐사는 위성을 통해 특정 대상이나 지역에 대한 직접적인 접촉 없이 원격으로 유의미한 정보를 수집하는 방법으로, 특히 접근이 어렵거나 불가능한 지역에서의 데이터 수집에 매우 유용하다. 최근 고해상도 위성 영상의 상용화는 이러한 데이터 수집의 정밀도를 크게 향상시켜, 대상물의 인식 및 분류 정확도를 높이는데 기여하고 있다(Byeon et al., 2021; Wu et al., 2019; Ulmas and Liiv, 2020).

이미지 처리 분야에서 높은 성능을 입증하며 급속도로 발전하고 있는 딥러닝 기술은 원격탐사 분야의 다양한 연구 주제들과 결합되어 높은 정확도 및 효율성을 달성한 사례가 다수 존재한다. 위성 영상으로부터 대기오염물질 배출원을 직접적으로 분류한 사례는 드물지만, 토지 피복이나 도시기능지역 분할 연구에서 산업단지와 같은 배출원 객체를 효과적으로 구분한 선행연구들이 존재한다(Zhang et al., 2018; Pan et al., 2020). 이러한 연구 성과를 바탕으로, 딥러닝 기술과 위성 원격탐사 자료를 함께 사용한다면 대기오염 배출원을 보다 효과적으로 식별하는 것이 가능할 것으로 예상된다.

한편 대기오염 배출원은 크게 고정 오염원과 이동 오염원으로 구분할 수 있다. 이동 오염원은 자동차, 선박, 기차 등 이동성을 가지고 대기오염물질을 배출하는 오염원이다. 일반적으로 낮은 배출구를 통해 오염물질을 방출하기 때문에 오염물질의 확산 정도가 제한적이며, 따라서 월경성 대기오염에 미치는 영향이 상대적으로 미미하다. 또한 이동 오염원은 그 위치가 지속적으로 변화하기 때문에, 이로부터 획득된 데이터의 활용에는 한계가 있다. 반면, 굴뚝과 같이 고정된 높은 배출구를 통해 오염물질을 배출하는 고정 오염원은 오염물질의 확산 범위가 훨씬 넓으며, 주변 지역의 대기질에 상당한 영향을 미친다(Abou Rafee et al., 2017). 이로 인해 고정 오염원은 월경성 대기오염 관리에 있어 핵심적인 대상으로 간주된다.

따라서 본 연구에서는 월경성 대기오염의 주된 원인이 되는 고정 오염원의 위치 데이터를 효율적으로 획득하는 것을 목표로 진행되었다. 또한 고정 오염원 중에서도 굴뚝과 같은 배출 시설을 통해 오염물질을 지속적으로 배출하는 산업단지와 여과 시설이 없어 분진을 직접 대기 중으로 방출하는 채석장을 주요 연구 대상으로 선정하였다. 이를 위해 대한민국과 태국 지역의 고해상도 광학 영상을 수집하여 대기오염물질 배출원 분류를 위한 인공지능(AI) 학습 데이터셋을 구축하였으며, 이미지 분할에 널리 사용되는 딥러닝 모델인 U-Net을 활용하여 모델 학습 및 성능 평가를 수행하였다.

2. 연구 지역 및 데이터

2.1. 연구 지역

서론에서 언급된 바와 같이, 대한민국의 대기오염물질 농도에 있어 국외 요인이 차지하는 비율이 40%에서 70% 사이로 추정되고 있다는 사실은 국내 요인 또한 상당한 정도로 국가 대기오염에 기여하고 있음을 시사한다. 이러한 배경을 고려하여 본 연구는 대한민국과 그 주변 국가 중 하나를 연구 대상 지역으로 선정하였다. Fig. 1은 본 연구의 대상 지역으로 선정된 대한민국과 태국의 지리적 위치를 나타낸다. 태국은 동남아시아에 위치한 개발도상국으로, 최근 급속한 산업화와 생물성 연소로 인한 대기오염 문제가 심화되고 있다. 2023년 1월 기준으로 태국에서는 130만 명 이상의 인구가 대기오염과 관련된 질병을 경험하고 있으며(Yoon, 2023), 아직 이 문제에 대한 효과적인 대응책이 마련되지 않은 상태이다. Vadrevu et al. (2021)에 따르면, 동남아시아에서 발생한 대기오염물질은 국경을 넘어 주변 국가에도 영향을 미치고 있으며, 이는 한국에도 영향을 줄 가능성을 시사한다. 한편, 태국은 중국의 지속적인 투자를 받아온 국가로써 태국에 설립된 산업단지에는 상당 수의 중국 기업들이 진출해 있으므로(Oh et al., 2017), 두 국가의 산업단지는 유사한 형태나 구조를 가지고 있을 가능성이 있다. 이러한 관점에서 볼 때, 태국 지역의 대기오염물질 배출원에 관한 연구는 대한민국의 대기오염 관리 전략 수립과 더불어, 향후 중국 대기오염에 관한 연구의 기초를 마련하여 중요한 역할을 할 것으로 기대된다.

OGCSBN_2023_v39n6_3_1679_f0001.png 이미지

Fig. 1. Study areas: South Korea and Thailand.

2.2. 연구 데이터

연구 데이터 선정 과정에서는 지속적인 데이터 획득 가능성과 데이터의 해상도 및 품질을 주요 고려 사항으로 삼았다. 다목적실용위성은 대한민국 한국항공우주연구원의 주도로 개발 및 발사된 지구 관측용 실용위성이다. 특히, 현재 운용 중인 3호와 3A호 위성은 1 m 이하의 고해상도 광학 위성 영상을 제공하며(Table 1), 이는 영상에서 대상물을 식별 및 구별하는 데 있어 매우 유용하다(Baek et al., 2021; Lee et al., 2020; Lee et al., 2021; Chae et al., 2022).

Table 1. Data specification

OGCSBN_2023_v39n6_3_1679_t0001.png 이미지

본 연구에서는 대한민국과 태국 내 대기오염물질 배출원을 탐지하기 위해 다목적실용위성 3호 및 3A호를 통해 취득된 고해상도 광학 위성 영상을 활용하였다. 2021년부터 2022년 사이에 촬영된 영상 중에서도 운량이 10% 미만인 고품질 데이터를 선별적으로 사용하였다. 태국 지역 데이터의 경우, 오픈 스트리트 맵에서 제공하는 산업단지와 채석장 위치 데이터와 다목적실용위성의 촬영 도곽을 중첩하여 선별된 지역에 대한 데이터를 집중적으로 수집하였다. 본 연구에서 수집한 대한민국 영역의 위성 영상은 총 104장이며, 이 중 67장은 3호 위성을 통해 나머지 37장은 3A호 위성을 통해 촬영되었다. 태국 지역에 대해서는 총 132장의 영상을 수집하였으며, 이 중 3호 위성 영상이 86장, 3A호 위성 영상이 46장이다.

3. 연구 방법

Fig. 2는 산업단지 및 채석장 분류를 위한 전체적인 연구 절차를 나타낸다. 대한민국과 태국 지역에서 산업 단지 및 채석장이 위치한 영역에 대해 다목적실용위성 3호와 3A호 RGB 영상을 수집하였다. 수집된 두 종류의 위성 센서 영상이 동일한 공간 해상도로 갖도록 전처리를 수행하고 딥러닝 모델 학습을 위한 입력 데이터 크기로 변환하였다. 입력 데이터에 존재하는 산업단지 및 채석장의 경계에 대한 어노테이션(Annotation)을 수행하여 딥러닝 모델 학습을 위한 라벨 데이터를 구축하였다. 구축된 학습 데이터셋으로부터 위성 영상 분할 연구에 효과적인 U-Net 모델을 사용하여 모델 학습을 진행하고, 이를 통해 학습된 모델의 성능을 평가하였다.

OGCSBN_2023_v39n6_3_1679_f0002.png 이미지

Fig. 2. Data flow.

3.1. 데이터 전처리

본 연구에서 수집한 대한민국과 태국의 다목적실용위성 3호 및 3A호 영상은 팬 샤프닝(Pansharpening) 기법을 적용하여 고해상도 RGB 영상으로 변환하였다. 팬샤프닝은 고해상도의 흑백(Panchromatic) 영상과 저해상도의 컬러 영상을 결합하여 단일 고해상도 컬러 영상을 생성하는 영상 융합 기술이다. 이 기법을 적용함으로써, 다목적실용위성 3호와 3A호 영상은 각각 0.7 m와 0.55 m의 공간 해상도를 갖는 고해상도 영상으로 변환되었다. 변환된 다목적실용위성 3호 및 3A호 영상은 모두 고해상도 영상이지만, 이들은 서로 다른 공간 해상도를 가지고 있다. 이로 인해 영상 내 동일한 물체가 다른 스케일로 표현되어 이를 동일한 딥러닝 모델의 입력 자료로 활용하는 데는 일정한 한계가 존재한다. 이러한 한계를 극복하고 다양한 위성 영상으로부터 풍부한 모델 입력 자료를 제작하기 위해 리샘플링(Resampling)을 적용하였다. 그 결과, 다목적실용위성 3호 및 3A호 영상 모두 1 m의 동일한 공간 해상도로 조정되었다.

3.2. 학습 데이터 제작

본 연구에서 구축된 학습 데이터는 Park et al. (2023)이 구축한 산업단지 및 채석장 분류 데이터셋의 제작 방식을 따른다.

3.2.1. 입력 데이터

원본 위성 영상에는 산업단지와 채석장이 아닌 비 대상지 픽셀이 과도하게 포함되어 있다. 또한, 원본 영상은 크기가 매우 크기 때문에 딥러닝 모델의 학습 과정을 비효율적으로 만들 가능성이 있다. 이를 해결하기 위해, 원본 위성 영상을 512 × 512 픽셀 크기의 작은 패치로 분할하여 딥러닝 모델의 입력 자료로 활용하였다. 이러한 접근 방식은 모델 학습의 효율성을 증가시키고, 관련된 데이터만을 집중적으로 처리할 수 있게 한다.

한편 원본 영상을 512 × 512 픽셀의 패치로 분할하는 과정에서 각 영상 패치의 픽셀 값 범위에 큰 차이가 발생할 수 있다. 이는 딥러닝 학습 과정에서 입력 데이터의 값 분포가 서로 달라져 모델의 성능 저하를 야기할 수 있다(Ambarwari et al., 2020; Jo, 2019). 따라서 모든 영상 패치에 99% 최대-최소 정규화(min-max normalization)를 적용하여 픽셀 값의 범위를 0과 1 사이로 조정하였다. 식(1)은 99% 최대-최소 정규화를 위한 수식에 해당한다.

\(\begin{aligned}x_{\text {new }}=\frac{x-\min \left(x_{0.99}\right)}{\max \left(x_{0.99}\right)-\min \left(x_{0.99}\right)}\end{aligned}\)       (1)

3.2.2. 라벨 데이터

위성 영상 내 산업단지와 채석장 영역을 어노테이션하여 대기오염물질 배출원 분류를 위한 라벨 데이터를 생성하였다. 라벨 데이터는 딥러닝 모델 학습에 있어서 정답지 역할을 하며, 모델 학습 과정 및 성능에 중대한 영향을 미친다. 따라서 연구의 정확성과 신뢰성을 최대한 보장하기 위해, 일관된 어노테이션 기준을 설정하여 라벨링하였다. 모든 라벨 데이터는 Coarse Annotation 방식을 적용하여, 대략적인 경계를 정의하는 방법으로 제작되었다. Coarse Annotation 방식은 빠른 라벨링과 대규모 데이터셋 처리에 유리하지만 경계를 대략적으로 정의하는 특성상, 제작된 라벨 데이터와 실제 대기 오염물질 배출원 경계 간의 불일치로 인해 모델의 성능이 다소 저하될 수 있다.

Fig. 3은 본 연구에서 생성된 입력 데이터와 라벨 데이터의 예시를 나타낸다. 산업단지 라벨링 시에는 경계선을 기준으로 내부 영역을 구획하는 방식을 채택하였다. 이 과정에서 4차선 이상의 도로, 외곽의 가로수, 초지 등은 라벨링에서 제외하고, 주차장은 포함시켰다. 채석장 라벨링은 주변 구조물을 기준으로 일반 나지와 구분하여 진행하였다. 채석장 내에 있는 모든 구조물을 라벨링에 포함시켰으나, 시멘트 공장과 같은 고정 오염원은 산업단지로 분류하였다.

OGCSBN_2023_v39n6_3_1679_f0003.png 이미지

Fig. 3. Example of inputs and generated label data. (a) Input image data. (b) Label data.

3.3. 데이터 확장기법

본 연구에서 제작된 512 × 512 픽셀 크기의 영상 데이터 및 라벨 데이터셋을 7:3의 비율로 나누어 70%는 모델 학습을 위한 훈련데이터로 사용하고 나머지 30%는 모델 성능 평가를 위한 테스트 데이터로 활용하였다.

분할된 훈련 데이터셋에는 다양한 불균형 요소들이 존재한다. 주요 불균형 요소 중 하나는 대한민국과 태국이라는 두 지역 간의 지리적 차이에서 비롯된다. 따라서 각 지역의 데이터가 훈련 데이터에 균형 있게 포함되도록 조정하는 것은 모델의 일반화 능력 강화와 지역적 특성에 따른 오류 최소화를 위해 중요하다. 이와 더불어, 연구의 주요 분류 대상인 산업단지와 채석장 클래스 간의 불균형은 모델 학습과 성능에 직접적인 영향을 미칠 수 있어 반드시 해결해야 한다(Baek et al., 2021).

데이터 확장기법은 훈련 데이터에 다양한 인위적인 변형을 적용함으로써, 학습 모델의 일반화 능력을 향상시키고 과적합을 방지하는 데 중요한 역할을 한다(Baek et al., 2022). 이러한 기법은 영상 분할과 같은 딥러닝 분야에서 데이터의 불균형 문제를 해결하고 모델의 성능을 향상시키기 위한 목적으로 효과적으로 사용되어 왔다(Baek et al., 2022; Lee et al., 2023; Yu and Jung, 2023). 이에 따라 본 연구에서는 대표적인 데이터 확장기법 중 하나인 오버샘플링(Oversampling)을 적용하여 촬영 지역 및 클래스에 따른 데이터 불균형 문제를 훈련 데이터의 수량을 통해 효과적으로 해결하였다. 이를 위해 모든 패치 데이터를 촬영 지역별로 구분한 후, 이들을 산업단지 및 채석장의 존재 여부에 따라 다시 네 가지 범주로 세분화하였다: i) 산업단지만 포함된 자료, ii) 채석장만 포함된 자료, iii) 산업단지와 채석장이 함께 포함된 자료, iv) 비대상지로만 구성된 자료. 각 범주에서 데이터의 균형을 맞추기 위해 일정 양의 데이터를 오버샘플링하여 균형 잡힌 훈련 데이터셋을 구성하였다. 재구성된 균형잡힌 훈련 데이터셋에 랜덤 이동, 회전, 변환, 컷-아웃 기법과 같은 데이터 확장 기법을 적용하여 데이터가 갖는 특징 다양성을 증대시켰다.

3.4. U-Net

본 연구에서는 산업단지와 채석장을 효과적으로 분류하기 위해, 컴퓨터 비전 분야의 핵심 기술 중 하나인 의미론적 분할(Semantic segmentation)을 적용하였다. 의미론적 분할은 입력된 이미지 내에서 의미 있는 객체를 기반으로 픽셀을 분류하는 알고리즘으로, 이를 통해 각 픽셀이 어떤 객체에 속하는지를 정확하게 식별할 수 있다(Guo et al., 2018; Alsabhan et al., 2022). U-Net은 의미론적 분할 연구에서 널리 사용되는 대표적인 알고리즘으로, 특히 위성 영상 처리 분야에서 높은 유연성 및 우수한 성능으로 주목받고 있다.

U-Net 알고리즘은 원래 생물의학 분야에서 이미지 분할을 목적으로 개발되었으며, 그 구조가 U자 형태를 띠고 있어 이러한 이름이 붙었다(Ronneberger et al., 2015). U-Net은 의미론적 분할에 최적화된 인코더-디코더(Encoder-Decoder) 구조를 갖추고 있다. 인코딩 단계에서는 Convolution 연산과 Max-pooling을 이용해 이미지의 핵심 특징들을 추출하고, 이후 디코딩 과정에서 Up-sampling과 Concatenate 기법을 통해 이미지 내 세부 객체의 위치를 더욱 정밀하게 파악하는 국소화(Localization)를 수행한다.

본 연구에서 적용된 U-Net 모델의 구조는 Ronneberger et al. (2015)에 의해 처음 제안된 전통적인 U-Net 구조와 몇 가지 주요한 변경 사항이 있다. Fig. 4는 본 연구에서 사용한 수정된 U-Net 모델 구조를 시각적으로 나타낸다. 첫 번째 변경 사항은 Convolution 연산의 반복 횟수 증가이다. 전통적인 U-Net 모델에서는 2회의 연속된 Convolution 연산을 수행하지만, 본 연구의 모델은 3회의 연속된 Convolution 연산을 적용하여 보다 복잡하고 추상적인 특징까지도 학습할 수 있도록 설계되었다. 이러한 구조 변경은 Course Annotation 방식을 적용하여 데이터와 라벨의 경계가 완벽하게 일치하지 않는 문제를 보완하기 위한 것이다. 두 번째 변경 사항은 전통적인 U-Net 모델에 비해 필터의 수를 절반으로 감소시킨 것이다. 이는 증가된 Convolution 연산으로 인한 계산 효율성 감소 및 과적합 위험을 완화하기 위해 적용하였다.

OGCSBN_2023_v39n6_3_1679_f0004.png 이미지

Fig. 4. U-Net structure used in the study.

3.5. 모델 검증 및 성능 평가

산업단지 및 채석장 분류 모델의 검증 및 성능 평가를 위해 본 연구에서는 Precision (정밀도), Recall (재현율), F1-score, Accuracy (정확도) 그리고 Intersection over Union (IoU)과 같은 다양한 성능 지표를 사용하였다. 이러한 평가 지표들을 이해하기 위해서는 먼저 오차행렬(Confusion matrix)에 대한 이해가 필요하다. 오차행렬은 모델의 성능을 평가하기 위해 사용되며, 모델의 예측값과 실제 참값 사이의 관계를 True Positive (TP), True Negative (TN), False Positive (FP), False Negative (FN)의 네 가지 유형으로 구분하여 나타낸다.

Precision은 모델이 True로 예측한 픽셀 중 실제로 True인 픽셀의 비율을 의미하며, 식(2)와 같이 계산된다. 이는 모델이 얼마나 정확하게 양성 픽셀을 예측하는 지를 나타낸다.

\(\begin{aligned}\text {Precision}=\frac{T P}{T P+F P}\end{aligned}\)       (2)

Recall은 실제 True인 픽셀 중 모델이 True로 올바르게 예측한 픽셀의 비율을 의미한다. 이는 식(3)과 같이 계산되며, 모델이 양성 픽셀을 얼마나 잘 포착하는 지를 측정한다.

\(\begin{aligned}\text {Recall}=\frac{T P}{T P+F N}\end{aligned}\)       (3)

F1-score는 Precision과 Recall의 조화 평균으로, 두 지표를 동시에 고려하여 모델의 성능을 종합적으로 평가하기에 적합한 지표로서 식(4)와 같이 계산된다.

\(\begin{aligned}\text {F1-score}= 2{\times}\frac{Precisio {\times} Recall}{Precision + Recall}\end{aligned}\)       (4)

의미론적 분할 문제에서 Accuracy는 일반적으로 Pixel Accuracy를 의미한다. 이는 전체 픽셀에서 모델이 정확하게 분류한 픽셀의 비율을 나타내는 지표로서 식(5)와 같이 계산된다. 이는 전체 이미지의 정확도를 평가하기에 유용하지만, 클래스 간 불균형이 심할 경우 모델의 성능을 과대평가할 위험이 있다. 따라서 Accuracy는 다른 성능 평가 지표들과 함께 고려되어야 하며, 올바른 결과 해석을 위한 주위가 필요하다.

\(\begin{aligned}Accuracy=\frac{T P + T N}{T P+T N +F P + F N}\end{aligned}\)       (5)

마지막으로 IoU는 모델에 의해 예측된 클래스 영역과 실제 클래스 영역이 겹치는 정도를 정량적으로 측정함으로써 모델의 정밀도를 평가한다. 이는 식(5)에서 TN을 고려하지 않은 수정된 식(6)을 통해 계산 가능하다. IoU는 각 클래스 별로 계산되며, 모델의 종합적인 성능 평가를 위해서는 각 클래스에 대한 IoU 값의 평균을 나타내는 mean Intersection over Union (mIoU)의 적용이 일반적이다.

\(\begin{aligned}IoU=\frac{T P}{T P+F P + F N}\end{aligned}\)       (6)

4. 연구 결과 및 토의

본 연구에서는 산업단지와 채석장 분류를 위한 딥러닝 모델 개발을 목적으로 효과적인 학습 데이터셋을 구축하였다. 데이터 불균형 문제를 해결하기 위해 오버샘플링 기법을 적용하였으며, 이를 통해 다양한 국가와 클래스 요소를 고려한 균형된 훈련 데이터 7,000 셋을 구성하였다(Table 2). 또한 모델의 성능을 객관적으로 평가하기 위해 구축된 훈련 데이터와 완전히 독립된 테스트 데이터 1,352 셋을 구성하였다.

Table 2. Balanced training data composition ratio

OGCSBN_2023_v39n6_3_1679_t0002.png 이미지

Table 3은 본 연구에서 구축된 균형 데이터셋으로부터 학습된 산업단지 및 채석장 분류 모델의 성능을 나타낸다. 모델의 전체 Pixel Accuracy는 0.8484로 높은 수준에서 도출되었다. 그러나 Pixel Accuracy는 데이터셋 내 비대상지 영역이 상당 부분을 차지하는 경우 과대 평가될 수 있는 경향이 있다. 본 연구에서 사용된 테스트 데이터셋 내에서 비대상지 영역은 전체 픽셀의 약 70%를 차지한다. 해당 비율이 높은 수치로 인식될 수 있으나, 비대상지 영역은 산업단지와 채석장 패치 모두에 포함되는 점을 고려하면, 이 수치는 과도하게 높은 것으로 판단되지 않는다. 더욱이, 산업단지와 채석장에 대한 F1-score와 도출된 Pixel Accuracy 간에 큰 차이가 없는 점을 고려할 때, 이러한 결과는 신뢰할 수 있는 수준으로 해석된다.

Table 3. Performance indicators

OGCSBN_2023_v39n6_3_1679_t0003.png 이미지

본 연구에서 산업단지와 채석장 분류 모델의 성능을 나타내는 중요한 지표인 mIoU는 예측 영역과 실제 영역 간의 일치도를 측정한다. 완벽한 경계 일치 시 mIoU는 1.0이 되지만, 의미론적 분할 문제에서는 픽셀 기준으로 완벽한 경계 일치를 달성하기 어렵다. 따라서 일반적으로 0.7~0.8의 mIoU는 높은 정확도로 간주된다(Kang et al., 2021; Wieland et al, 2023). 본 연구에서 도출된 mIoU 값은 0.6490로 비교적 낮은 편이지만, 라벨 데이터 제작 시 적용된 Course Annotation 방식으로 인해 산업단지와 채석장의 경계가 대략적으로 정의되었음을 고려해야 한다. 따라서 0.6490라는 mIoU 값을 낮은 성능을 나타내는 절대적인 지표로 해석하는 것은 적절하지 않다. 이는 예측 결과에 대한 정성적인 분석과 함께 종합적으로 평가되어야 하며, 단순한 수치적 평가를 넘어 깊이 있는 해석이 요구된다.

Fig. 5는 산업단지 클래스에 대한 모델의 예측 결과를 시각적으로 나타낸다. (a)는 입력 영상 자료, (b)는 구축된 라벨 데이터 그리고 (c)는 모델의 예측 결과를 보여준다. Fig. 5의 두 예시를 분석한 결과, 본 연구에서 사용된 모델은 산업단지의 위치를 효과적으로 탐지하였다. 그러나 모델의 예측 경계는 Fine Annotation 방법을 사용하는 일반적인 이미지 분할 연구 결과에 비해 상대적으로 불안정한 양상을 나타냈다. 이러한 결과의 주요 원인은 Course Annotation 방법을 적용하여 제작된 라벨 데이터에 있다고 추정된다. 산업단지에 대한 라벨 데이터는 Course Annotation을 사용하여 실제 경계보다 좁게 구획되었으며, 일부 비건물 요소까지도 포함하고 있다. 이로부터 학습된 모델은 산업단지 경계 예측에 있어서 건물과 비건물 요소를 불규칙적으로 포함하는 경향을 보였으며, 이는 모델 정확도에도 상당한 영향을 미쳤을 것으로 분석된다.

OGCSBN_2023_v39n6_3_1679_f0005.png 이미지

Fig. 5. Example of industrial park prediction results. (a) Input image data. (b) Label data. (c) Predicted results.

한편 채석장 클래스는 모든 모델 성능 지표에서 산업 단지에 비해 상대적으로 높은 정확도를 달성했다. 이는 두 클래스 모두 Course Annotation 방식으로 라벨 데이터를 제작했음에도 불구하고, 채석장의 구조가 산업단지에 비해 상대적으로 단순하여 경계 구획이 보다 일관성 있게 수행되었기 때문으로 추정된다. Fig. 6은 채석장에 대한 입력 자료, 라벨 데이터, 그리고 모델의 예측 결과를 보여준다. 채석장의 경계를 어노테이션하는 과정에서, Fig. 6의 (b1, 2)와 같이 채석장 중심부에 존재하는 구조물이나 초지 등을 경계 내부에 포함하여 구획하였다. 그러나 모델은 이러한 객체들을 채석장이 아닌 비대상지 클래스로 정확하게 예측해냈으며, 라벨 데이터보다 실제 참 값과 유사한 예측 결과(Figs. 6-c1, 2)를 도출하였다. 이는 채석장에 대한 모델의 실제 성능이 Table 3에 나타난 결과보다 더 높을 수 있음을 시사하여 유의미한 결과로 여겨진다.

OGCSBN_2023_v39n6_3_1679_f0006.png 이미지

Fig. 6. Example of quarry prediction results. (a) Input image data. (b) Label data. (c) Predicted results.

본 연구에서는 산업단지와 채석장의 분류를 위하여 대한민국과 태국의 위성 영상 자료를 함께 사용하였다. 이에 따라 두 지역의 영상이 갖는 고유한 지역적 특성이 모델의 예측 결과에 미치는 영향을 분석하기 위해 국가별 모델 정확도를 평가하였다. Table 4는 대한민국과 태국 데이터에 대한 산업단지 및 채석장 분류 정확도에 해당한다. 해당 결과에서 산업단지에 대한 분류 정확도는 대한민국과 태국 데이터에서 거의 동일한 수준으로 나타났으나, 채석장에 대한 분류 정확도는 태국 데이터가 대한민국 데이터에 비해 상대적으로 높은 것으로 나타났다.

Table 4. Performance indicators by country

OGCSBN_2023_v39n6_3_1679_t0004.png 이미지

이러한 국가별 채석장 분류 정확도의 차이는, 대한민국과 태국 채석장의 고유 특성에서 기인한 것으로 추정된다. Fig. 7의 (a1)은 대한민국 채석장의 대표적인 사례를 보여준다. 대한민국 채석장은 중심부가 회색을 띄는 반면, 주변부로 갈수록 나지와 유사한 색상을 가지고 있어 경계의 명확한 정의가 어렵다. 객체의 경계가 불명확한 경우, 일관성 있는 라벨링 작업이 어려워지며, 이는 궁극적으로 모델의 예측 정확도에 부정적인 영향을 미칠 수 있다. 이와 대조적으로 태국의 채석장은 Fig. 7의 (a2)에 보이는 바와 같이 채석장과 주변 지역의 경계가 더 명확히 구분되는 경향이 있다. 이러한 특성 차이로 인해 태국 채석장의 분류 정확도가 대한민국에 비해 상대적으로 높게 나타난 것으로 보인다. 그럼에도 불구하고 이러한 차이는 경미한 수준으로, 보다 정밀한 어노테이션 작업을 통해 개선될 수 있을 것으로 예상된다.

Fig. 7. Example of quarry prediction results by country. (a) Input image data. (b) Label data. (c) Predicted results. (a1-c1) South Korea. (a2-c2) Thailand.

OGCSBN_2023_v39n6_3_1679_t0005.png 이미지

5. 결론

본 연구는 대한민국과 태국 지역 내 산업단지 및 채석장 분류를 목적으로 AI 학습용 데이터셋을 구축하고, 의미론적 분할에 뛰어난 성능을 보인 U-Net 모델을 통해 학습을 진행하였다. 모델 성능 평가를 위해 다양한 지표를 사용한 결과, 전체 정확도는 0.8484라는 높은 수치를 달성했으며, 산업단지와 채석장 클래스에 대한 F1-score는 각각 0.7505와 0.8216으로 나타났다. Course Annotation 방식으로 제작된 라벨 데이터의 특성을 고려해 볼 때, 이 수치들은 의미론적 분할 모델에서 상당히 높은 수준으로 평가될 수 있으며, 향후 새로운 입력 자료에 대해서도 효과적인 분류가 가능할 것으로 기대된다.

본 연구의 결과는 대기오염 배출원의 탐지 및 분류에 대한 효과적인 방법론을 제시하며, 이러한 접근법의 국제적 적용 가능성을 시사한다. 본 연구의 방법론을 중국을 비롯한 다양한 주변 국가에 적용할 경우, 대기오염 관리와 감시의 효율성을 크게 향상시킬 수 있을 것으로 기대된다. 이는 대기오염 문제에 대한 국제적 차원의 대응을 강화하고, 보다 효과적인 대기오염 관리 및 감시 전략 수립에 기여할 것으로 예상된다.

본 연구는 학습 데이터의 불균형 요소를 고려함에 있어 클래스별 패치 데이터의 수량을 기준으로 설정하였으나, 해당 접근법은 클래스의 픽셀 비율을 고려한 방법에 비해 본질적인 해결책을 제공하지 못한다는 한계점이 있다. 이에 따라 향후 연구에서는 데이터 불균형 문제를 더욱 깊이 있게 다루기 위해 픽셀 기반 분석 방법과 이를 효과적으로 해결하기 위한 데이터 확장 기법의 적용을 적극적으로 탐구할 예정이다.

또한 본 연구에서 적용한 U-Net 모델은 데이터 처리의 효율성을 높이기 위해 전통적인 U-Net에 일부 변경을 가한 구조이지만, 이는 2015년에 처음 제안된 U-Net 구조와 근본적인 차이가 없다. 최근 영상 분할 문제에 대한 고성능의 딥러닝 모델들이 다수 등장함에 따라, 향후 연구에서는 이러한 최신 모델들을 활용하여 산업단지 및 채석장 탐지의 정확도를 더욱 향상시킬 수 있을 것으로 기대된다.

사사

본 연구는 대한민국 정부의 재원으로 민군협력진흥원에서 수행하는 민군겸용기술개발사업(과제명: SAR 영상기반 정밀 지상기준점 생성 시스템 개발 사업(’22–’26))의 연구비 지원으로 수행되었습니다(No. 22-CMEO-02).

본 연구는 국토교통부의 「스마트시티 혁신인재육성사업(’19–’23)」으로 지원되었습니다.

Conflict of Interest

No potential conflict of interest relevant to this article was reported.

References

  1. Abou Rafee, S. A., Martins, L. D., Kawashima, A. B., Almeida, D. S., Morais, M. V., Souza, R. V. et al., 2017. Contributions of mobile, stationary and biogenic sources to air pollution in the Amazon rainforest: A numerical study with the WRF-Chem model. Atmospheric Chemistry and Physics, 17(12), 7977-7995. https://doi.org/10.5194/acp-17-7977-2017
  2. Alsabhan, W., Alotaiby, T., and Dudin, B., 2022. Detecting buildings and nonbuildings from satellite images using U-Net. Computational Intelligence and Neuroscience, 2022, Article ID 4831223. https://doi.org/10.1155/2022/4831223
  3. Ambarwari, A., Adrian, Q. J., and Herdiyeni, Y., 2020. Analysis of the effect of data scaling on the performance of the machine learning algorithm for plant identification. Journal RESTI (Rekayasa Sistem Dan Teknologi Informasi), 4(1), 117-122. https://doi.org/10.29207/resti.v4i1.1517
  4. Bae, M., Kim, B. U., Kim, H. C., and Kim, S., 2020. A multiscale tiered approach to quantify contributions: A case study of PM2.5 in South Korea during 2010-2017. Atmosphere, 11(2), 141. https://doi.org/10.3390/atmos11020141
  5. Bae, M., and Kim, S., 2022. Adjustment of foreign emission impacts on provincial PM2.5 concentrations in South Korea based on upwind observations and estimation of domestic emission uncertainty. Journal of Korean Society for Atmospheric Environment, 38(4), 624-636. https://doi.org/10.5572/KOSAE.2022.38.4.624
  6. Baek, W. K., Lee, M. J., and Jung, H. S., 2022. The performance improvement of U-Net model for landcover semantic segmentation through data augmentation. Korean Journal of Remote Sensing, 38(6-2), 1663-1676. https://doi.org/10.7780/kjrs.2022.38.6.2.8
  7. Baek, W. K., Lee, Y. S., Park, S. H., and Jung, H. S., 2021. Classification of natural and artificial forests from KOMPSAT-3/3A/5 images using deep neural network. Korean Journal of Remote Sensing, 37(6-3), 1965-1974. https://doi.org/10.7780/kjrs.2021.37.6.3.5
  8. Byeon, Y., Seo, M., Jin, D., Jung, D., Woo, J., Jeon, W. et al., 2021. Green algae detection in the middle.downstream of Nakdong River using high-resolution satellite data. Korean Journal of Remote Sensing, 37(3), 493-502. https://doi.org/10.7780/kjrs.2021.37.3.10
  9. Chae, H., Rhim, H., Lee, J., and Choi, J., 2022. Exploratory study of the applicability of Kompsat 3/3A satellite pan-sharpened imagery using semantic segmentation model. Korean Journal of Remote Sensing, 38(6-4), 1889-1900. https://doi.org/10.7780/kjrs.2022.38.6.4.3
  10. Eom, Y. S., and Oh, H., 2019. Health risks from particulate matters (PM10) and averting behavior: Evidence from the reduction of outdoor leisure activities. Korean Journal of Economic Studies, 67(2), 39-70. https://doi.org/10.22841/KJES.2019.67.2.002
  11. Guo, Y., Liu, Y., Georgiou, T., and Lew, M. S., 2018. A review of semantic segmentation using deep neural networks. International Journal of Multimedia Information Retrieval, 7, 87-93. https://doi.org/10.1007/s13735-017-0141-z
  12. Han, S., Lee, J. Y., Lee, J., Heo, J., Jung, C. H., Kim, E. S. et al., 2018. Estimation of the source contributions for carbonaceous aerosols at a background site in Korea. Asian Journal of Atmospheric Environment, 12(4), 311-325. https://doi.org/10.5572/ajae.2018.12.4.311
  13. Jo, J. M., 2019. Effectiveness of normalization pre-processing of big data to the machine learning performance. The Journal of the Korea Institute of Electronic Communication Sciences, 14(3), 547-552. https://doi.org/10.13067/JKIECS.2019.14.3.547
  14. Kang, J., Kim, G., Jeong, Y., Kim, S., Youn, Y., Cho, S. et al., 2021. U-Net cloud detection for the SPARCS cloud dataset from Landsat 8 images. Korean Journal of Remote Sensing, 37(5-1), 1149-1161. https://doi.org/10.7780/kjrs.2021.37.5.1.25
  15. Kim, B. G., Cha, J. S., Han, J. S., Park, I. S., Kim, J. S., Na, J. G. et al., 1997. Aircraft measurement of SO2, NOx over Yellow Sea area. Journal of Korean Society for Atmospheric Environment, 13(5), 361-369.
  16. Kumar, N., Park, R. J., Jeong, J. I., Woo, J. H., Kim, Y., Johnson, J. et al., 2021. Contributions of international sources to PM2.5 in South Korea. Atmospheric Environment, 261, 118542. https://doi.org/10.1016/j.atmosenv.2021.118542
  17. Lee, E. R., Baek, W. K., and Jung, H. S., 2023. Mapping tree species using CNN from bi-seasonal high-resolution drone optic and LiDAR data. Remote Sensing, 15(8), 2140. https://doi.org/10.3390/rs15082140
  18. Lee, K. J., Chae, T. B., and Jung, H. S., 2021. Earth observation from KOMPSAT optical, thermal, and radar satellite images. Remote Sensing, 13(1), 139. https://doi.org/10.3390/rs13010139
  19. Lee, Y. S., Lee, S., Baek, W. K., Jung, H. S., Park, S. H., and Lee, M. J., 2020. Mapping forest vertical structure in Jeju Island from optical and radar satellite images using artificial neural network. Remote Sensing, 12(5), 797. https://doi.org/10.3390/rs12050797
  20. Oh, Y. A., Shin, M., Kim, M. L., and Lee, S., 2017. China's economic cooperation with Southeast Asia: Current status and implications (KIEP Research Paper No. Policy References 17-05). Korea Institute for International Economic Policy. https://doi.org/10.2139/ssrn.3063878
  21. Pan, Z., Xu, J., Guo, Y., Hu, Y., and Wang, G., 2020. Deep learning segmentation and classification for urban village using a Worldview satellite image based on U-Net. Remote Sensing, 12(10), 1574. https://doi.org/10.3390/rs12101574
  22. Park, C. W., Jung, H. S., Lee, W. J., Lee, K. J., Oh, K. Y., Chang, J. Y. et al., 2023. GeoAI dataset for industrial park and quarry classification from KOMPSAT-3/3A optical satellite imagery. Geo Data, 5(4), 238-243. https://doi.org/10.22761/GD.2023.0052
  23. Ronneberger, O., Fischer, P., and Brox, T., 2015. U-Net: Convolutional networks for biomedical image segmentation. In: Navab, N., Hornegger, J., Wells, W., Frangi, A. (eds.), Medical image computing and computer-assisted intervention - MICCAI 2015. Springer, pp. 234-241. https://doi.org/10.1007/978-3-319-24574-4_28
  24. Ulmas, P., and Liiv, I., 2020. Segmentation of satellite imagery using U-Net models for land cover classification. arXiv preprint arXiv:2003.02899. https://doi.org/10.48550/arXiv.2003.02899
  25. Vadrevu, K. P., Ohara, T., and Justice, C., 2021. Biomass burning in South and Southeast Asia: Impacts on the biosphere (vol. 2). CRC Press. https://zrr.kr/3SjH
  26. Wieland, M., Martinis, S., Kiefl, R., and Gstaiger, V., 2023. Semantic segmentation of water bodies in very high-resolution satellite and aerial images. Remote Sensing of Environment, 287, 113452. https://doi.org/10.1016/j.rse.2023.113452
  27. Wu, M., Zhang, C., Liu, J., Zhou, L., and Li, X., 2019. Towards accurate high resolution satellite image semantic segmentation. IEEE Access, 7, 55609-55619. https://doi.org/10.1109/ACCESS.2019.2913442
  28. Yoon, J. P., 2023. [Issue trends] Thailand calls on member states to help 'fine dust is on ASEAN's agenda. Available online: https://www.kiep.go.kr/aif/issueDetail.es?brdctsNo=345302&mid=a30200000000&systemcode=03 (accessed on Apr. 7, 2023).
  29. Yu, J. W., and Jung, H. S., 2023. Forest vertical structure mapping using multi-seasonal UAV images and lidar data via modified U-Net approaches. Remote Sensing, 15(11), 2833. https://doi.org/10.3390/rs15112833
  30. Zhang, X., Du, S., Wang, Q., and Zhou, W., 2018. Multiscale geoscene segmentation for extracting urban functional zones from VHR satellite images. Remote Sensing, 10(2), 281. https://doi.org/10.3390/rs10020281