DOI QR코드

DOI QR Code

미세먼지 분석 서비스를 위한 NoSQL 기반 센서 웹 시스템

NoSQL-based Sensor Web System for Fine Particles Analysis Services

  • 김정준 (한국산업기술대학교 컴퓨터공학과) ;
  • 곽광진 (한국산업기술대학교 스마트팩토리융합학과) ;
  • 박정민 (한국산업기술대학교 컴퓨터공학과)
  • 투고 : 2019.02.18
  • 심사 : 2019.04.05
  • 발행 : 2019.04.30

초록

최근 미세먼지로 인한 문제가 대두되고 있다. 마스크 착용 및 기상 경보가 발령하게 되면서 많은 관심을 받고 있으며 미세먼지의 원인과 절감 방안 등에 대한 연구와 정책 등이 활발하게 벌어지고 있으나 연구결과는 다양하게 나타나고 있다. 기상학적으로 미세먼지로 인한 피해가 가장 큰 경우는 기온역전이 함께 발생하는 경우이다. 본 연구에서는 기온역전과 풍향 등을 함께 분석하여 미세먼지를 사전에 경고할 수 있는 시스템을 구상하였다. 이러한 기상정보 시스템은 다양한 센서 정보를 센서 제어 및 데이터 교환 등을 위해 OGC Sensor Web Enablement(SWE)를 따르는 시스템과 NoSQL 스토리지를 사용하여 확장성과 병렬 처리성을 높이는 시스템을 제안한다.

Recently, it has become a social problem due to fine particles. There are more people wearing masks, weather alerts and disaster notices. Research and policy are actively underway. Meteorologically, the biggest damage caused by fine particles is the inversion layer phenomenon. In this study, we designed a system to warn fine Particles by analyzing inversion layer and wind direction. This weather information system proposes a system that can efficiently perform scalability and parallel processing by using OGC sensor web enablement system and NoSQL storage for sensor control and data exchange.

키워드

Ⅰ. 서론

최근 몇 년 동안 미세먼지가 주요 관심사로 대두되었다. 미세먼지가 심한 날에는 마스크를 착용하는 인원이 급증하였으며, 기상 매체 및 스마트폰 재난 알림[1] 등을 통해 이를 알려주는 경우도 많이 늘어나게 되었다.

특히 우리 대학의 경우 시화산업단지 내에 위치하였기 때문에 미세먼지로 인해 시야가 좋지 않거나 하는 경우도 종종 발생하기도 한다.

이러한 미세먼지는 스모그현상과 함께 발생할 시 국민건강에 치명적인 악영향을 줄 수 있음을 시사하는 매체와 문헌도 늘어났다.

미세먼지의 원인으로는 발전소, 황사, 자동차 매연, 공장 매연 등 다양한 요소가 있다고 알려져 왔으며, 대기흐름에 따라 큰 영향을 받는 것으로 알려져 있다. 또한 대기흐름이 정체되는 가장 큰 요인으로 지형적인 영향과 기온역전 현상이 크게 관여한다.

기온역전 현상이 잘 발생하는 지형적인 영향으로는 분지 지형[2,3]이거나 일조량이 많고 일교차가 큰 지역이거나 계절적으로 고기압이 오랜 기간 머무르면서 저기압에 영향을 받지 않는 곳, 푄현상이 있는 지역이 이러한 영향을 받는 대표적인 지역이라고 할 수 있다.

따라서 미세먼지를 예측 및 분석하기 위해서는 단순히 미세먼지와 관련된 데이터만으로는 부족한 예측 분석과 결과가 있을 수 있다고 볼 수 있다. 미세먼지로 인한 피해를 다각적이고 좀 더 정확한 예측 및 분석을 위해서는 기온역전 현상의 조건과 맞추어 이를 예측 분석하여야 한다.

그림 1에서 보는 바와 같이 1월 중순에 심각했던 미세먼지의 경우 이러한 현상이 나타난다. 심각한 미세먼지가 한반도를 덮어 기상경보가 발령되었으며, 지표와 해발 1.5Km의 온도차가 4도 정만을 보였다. 즉 대기가 안정된 상황이었다. 풍향도 6시 경에는 약한 북풍이었으며, 오후 3시경 서풍으로 바뀌면서 미세먼지 수치가 낮아졌지만 밤이 되면서 북풍이 강해지면서 다시 미세먼지 수치가 오르는 것을 알 수 있었다. 이러한 요인으로는 고기압과 기온역전 현상 두 가지가 큰 요인으로 분석될 수 있다.

OTNBBE_2019_v19n2_119_f0001.png 이미지

그림 1. 1월 13일 오전 6시 미세먼지 

Fig. 1. PM10 on 2019.01.13. AM 06:00

본 논문에서는 미세먼지 분석을 위해 다양한 분석을 하기 위해 NoSQL 기반 센서 웹 시스템의 설계를 제시하고자 한다. 2장에서는 센서 웹 시스템, NoSQL에 대한 소개와 이를 통한 연구와 기온역전 조건을 소개한다. 3장에서는 지역적 분석을 통한 방법론을 제안하며, 4장에서는 전체 아키텍처를 제안한다. 5장에서는 제안한 아키텍처를 구현하기 위한 방법 및 추가로 연구되어야 할 부분에 대해 논한다.

Ⅱ. 관련연구

1. 부산지역 겨울철 고농도 미세먼지 발생일의 기상학적 특성

기상현상과 미세먼지간의 관련성을 사전에 조사한 논문으로 기상요소와 미세먼지에 관해 분석하였다[4].

세부적으로 기상요소를 지상기상요소, 종관상태 및 해풍유입, 대기상층, 역궤적을 분석하였다.

지상기상요소는 일상기상통계를 이용하였으며 부산지역의 지난 30년간 겨울철 기온, 습도, 운량, 일조시간, 일사량 등이며, 종관상태 및 해풍유입은 종관상태는 전 세계의 기상데이터를 공유하기 위해 일정시간마다 관측소 데이터를 말한다. 대기상층은 와이오밍대학에서 제공하는 포항의 건구온도와 노점 온도 연직분포를 수집하였으며, 역궤적 분석은 타지역의 오염물질의 이동 경로를 예측하는 분석방법이다.

미세먼지가 발생한 날은 지상기상요소 관측결과 최고기온, 일사량, 일조시간은 높게 나타났고 상대습도와 운량은 낮게 나타났으며 연무와 박무가 나타났다. 종관상태와 해풍의 영향은 미세먼지가 강했던 날들은 고기압의 영향을 많이 받으며, 높은 기온과 습도, 강한 일사, 작은 풍속이 있었으며 해풍의 영향이 크고 기온의 하강 및 습도의 증가 등의 현상이 발생하였다. 육풍은 밤에서 새벽사이에 주로 발생하고 해풍은 낮에 주로 발생하였다. 대기상층분석에서는 미세먼지가 발생한 날에 역전층이 발생하였으며, 관측된 날에 따라 역전층이 800m 또는 1500m 구간 등 다양한 구간에서 발생한 것을 확인되었고 연무와 박무도 함께 관측되었다. 일중 대기경계층고도가 가장 높은 3시 기준으로도 1000m 이하를 나타내어 대기가 안정된 상태임을 알 수 있었다. 역궤적분석에서는 미세먼지수치가 높았던 6번의 경우 모두 중국으로부터 미세먼지가 유입된 것으로 확인되었으며 약 72시간 정도 소요 된 것으로 나타났으나 1500m의 공기괴의 경우 다소 느리게 이동된 경우도 있었다.

2. NoSQL

NoSQL의 구조는 센서 웹 스토리지로 적용하기에 적합한 구조이다. 기존의 RDB(Relational Database)에 비해 자유로운 스키마를 가지고 있어 테이블 형태의 데이터 뿐만 아니라 Key-Value, Document 등으로 표현할 수 있으므로, SensorML이나 O&M과 같은 마크업 언어를 효율적으로 처리하기에 더 적합하다. 또한 분산 확장성에 효율적이기 때문에 이는 로그 데이터와 유사한 형태로 증가하는 센서 데이터를 효율적으로 저장할 수 있다.

또한, 많은 NoSQL이 In-memory 기반 데이터베이스를 체택하여 쓰기와 읽기 속도가 빠르며, 스트리밍 데이터 처리에도 효율적이기 때문에 센서 데이터와 잘 맞는다고 볼 수 있다[5].

3. 대기관측 장비

대기상층의 기온과 기압, 습도 풍향, 풍속을 관측하기 위해서 다양한 방법들이 연구 되어왔다. 풍선이나 기구와 같은 형태로 상공으로 보내 관측하게 하는 라디오존데(RaidoSonde), 레이져나 마이크로웨이브를 활용하여 기상정보를 탐지하는 LIDAR(Light Detection And Ranging), 음파를 이용하여 발신된 신호음이 각 기층에서 반사되어 올 때 기층의 이동에 의한 주파수 변화가 나타나는 것을 Doppler 이론에 의해 수평, 수직 방향의 풍향을 컴퓨터로 계산하는 SODAR(Sonic Detection And Ranging), 고층 철탑에 고도에 따른 기상 센서를 설치하여 바람, 온도, 습도 난류 등을 측정하는 고층기상탑(Meteorological Tower) 등이 있다.

그러나 라디오존데는 고가의 일회용 센서를 지속적으로 소모하게 되며, LIDAR, SODAR 및 고층기상탑은 초기 건설 비용 및 고가의 장비를 필요로 하므로 국가연구시설 또는 대규모 연구 시설에서 사용되고 있는 실정이다.

우리나라의 기상청에서 제공하는 데이터는 서귀포 고산, 광주, 제주 국가태풍센터, 백령도, 북강릉, 속초, 오산, 창원, 포항, 흑산도 10곳이며, 해외에서는 미국 와이오밍대학교[6]와 Natural Earth[7] 등에서 다양한 관측자료를 제공하고 있다.

4. 기온역전(Inversion Layer)

기온역전이란 대류권 내에서 고도가 올라갈수록 더 추워지는 것이 아니라 반대로 지표 근처의 공기가 더 추워지는 현상을 말한다. 기온역전 현상이 발생하면 대류가 정체되게 되며 충분한 수분이 유입되면 안개가 쉽게 생기게 된다.

기온역전의 원인으로는 침강 역전층, 이류 역전층, 복사 역전층, 전선 역전층의 4가지의 원인에 의해 생성되어진다.

침강 역전층(Subsidence Inversion Layer)은 고기압권에서 하강기류가 발생하게 되는데 이 하강 기류는 단열압축되어 따뜻한 공기층을 만들게 된다. 그런데 지표의 공기가 밤 또는 다른 원인으로 차가워지면 기온역전에 의한 대류정체가 발생한다. 이러한 현상의 대표적인 도시로는 겨울철의 베이징과 같은 도시가 있다. 겨울철 베이징은 저기압이 근처에 잘 생겨나지 않게 되므로 오랫동안 고기압권역에 머물게 되며, 이때 복사 역전층이 발생하게 되면 심각한 스모그와 미세먼지로 위협받게 된다.

이류 역전층(Advection Inversion Layer)은 하층의 기온이 상층보다 낮은 경우 발생하는 경우를 말하며, 양방향에서 유입되는 두 가지 기류로 인해 만들어진다. 푄현상과 연관성이 크다고 할 수 있다. 공기가 산을 만나게 되면 상승기류가 생기면서 공기가 차가워지고 산을 내려가면서 기온이 올라가게 된다. 그런데 반대편에 찬 공기가 유입되면 이류층이 만들어지면서 기온역전이 발생하게 된다. 푄현상이 이루어지는 강릉과 같은 도시지역은 이러한 현상을 주목할 필요가 있다.

복사 역전층(Radiation Inversion Layer)은 맑고 구름이 없고 건조하고 바람이 불지 않는 밤에 지표면의 복사냉각이 활발하게 일어나면 지표면 부근의 공기가 냉각되어 위층보다 기온이 낮아 역전층이 생기며 이를 복사역전층이라고 함다. 복사 역전층은 흔하게 밤에서 새벽까지 흔하게 발생하는 현상이다.

전선 역전층(Frontal Inversion Layer)는 고온의 기단이 상단에 저온의 기단이 하부에 존재하여 발생하는 경우로 폐쇄 전선과 유사하다고 볼 수 있다.

Ⅲ. 지역적 분석 방법론

기온 역전의 조건과 분지 지역, 해안 지역, 내륙 산간지역 등에서 미세먼지 수치에 영향을 미칠 수 있는 요인에 대하여 알아보았다. 지역적 특성에 따라 입수하여야 할 정보가 달라져야 하고 분석할 정보가 다르다고 할 수 있다.

전세계적으로 기온역전에 의한 공기질 문제를 호소하는 도시는 다양한 곳에 분포하고 있다.

대표적으로 중국 북경, 성도, 베네쥬엘라 카라카스, 미국 로스앤젤레스, 샌프란시스코, 멕시코 멕시코시티, 몬테레이, 이탈리아 밀라노, 인도 뭄바이, 칠레 산티아고, 브라질 상파울로, 이란 테헤란 등이 심각한 상황으로 알려져 있고 공기가 좋지 않은 도시들의 지형적 영향을 분석하면 다음과 같은 기온역전 원인을 분석할 수 있을 것이다.

표 1에서 보는 바와 같이 대부분 공기오염이 심한 지역은 산맥을 끼고 있거나 분지 지역인 곳이 대부분이다.

표 1. 주요 미세먼지 도시 지역 분석

Table. 1. Fine Particles cities local Analyze 

OTNBBE_2019_v19n2_119_t0001.png 이미지

이러한 도시들은 지역적 특성에 맞게 센싱데이터를 수집하는 것이 기온역전에 대한 분석이 수월하다.

산맥을 끼고 있는 경우 산맥 너머의 풍향과 산사면에서 상승기류가 발생하는 것을 확인하여야 하며, 산꼭대기와 도심지와의 온도를 민감하게 보아야 한다. 이러한 도시로는 강릉을 대표적으로 들 수 있는데 산맥 반대의 산사면은 위도상 서풍이 탁월풍으로 부는 지역이며, 봄철 오오츠크해 방면에서 고기압이 발달하게 되면 기온역전 현상이 발생할 가능성이 높아진다.

우리나라의 경우 산맥으로 영향을 받는 지역은 4가지 지역으로 한정되어 있다. 푄현상의 경우 큰 바람받이 사면이 필요한데 조건에 맞는 지형과 풍향은 태백산맥을 넘어가는 편서풍과 높새바람, 차령산맥을 넘는 남서풍, 한라산을 넘는 남풍이 이에 해당한다. 따라서 영서, 영동, 영남, 제주시 지역만이 이에 해당한다.

분지의 경우 시간에 따른 온도변화가 강조되어야 한다. 분지 옆면의 산사면과 도심지까지의 온위분포를 측정하는 것이 바람직하다고 할 수 있다. 야간에 산에서 급격히 냉각된 기류가 산사면을 타고 도심지로 유입되기 때문에 산사면의 온도변화를 확인하여야 한다. 춘천과 대구와 같은 지역이 이에 해당한다[2].

해안 지역은 해풍의 영향과 해무나 농무와도 연관성을 지어볼 수 있을 것이다. 안개 역시 기온역전과 유관하며, 지표가 복사열을 흡수하는 것을 방해하기 때문에 기온역전 현상이 길어지게 된다. 인천이나 부산 등이 이러한 영향을 받는 도시라고 볼 수 있다[4].

Ⅳ. 시스템 설계

본 연구에서는 기온역전과 미세먼지를 관측하기 위한 센서 웹 가능 시스템을 구현하는 것을 목적으로 하며 전체 시스템 아키텍처는 다음과 같다.

OTNBBE_2019_v19n2_119_f0002.png 이미지

그림 2. System Architecture 

Fig. 2. System Architecture

논문에서 사용될 시스템은 센서와 센서웹 서버와 NoSQL 스토리지를 사용하며 센서는 대체된 자료 및 기상 수집 센서가 포함된다. 센서웹 서버는 크게 2가지 모듈로 구성된다.

센서를 구성 관리하고 데이터의 변환을 담당하는SWE(Sensor Web Enablement)는 OGC의 Sensor Web Enablement[8,9]를 준수하며 표준에 7가지 주요 모듈 SAS를 제외한 나머지 6가지 모듈로 구성된다. SAS(Sensor Alert Service)의 경우 본 연구에서 센싱 데이터 자체를경고하는 것을 목적으로 하지 않기 때문이다.

그림 3에서 보는 바와가 같이 센서 웹(Sensor Web Enablement, SWE)은 3가지 XML 언어와 3가지 서비스 어플리케이션 그리고 웹 알림 기능 총 7가지로 구성되어진다.

OTNBBE_2019_v19n2_119_f0003.png 이미지

그림 3. OGC Sensor Web Enablement 

Fig. 3. OGC Sensor Web Enablement

O&M은 센서에서 관측 및 수집한 정보를 XML 형태로 저장하고 이를 관리하는 기능을 가지며, SensorML은 센서 시스템 및 프로세스의 스키마 정보를 XML 형태로 관리하는 역할을 한다. SOS(Sensor Observation Service)는 클라이언트에서 센서의 수집 정보를 요청하는 역할을 하며, TML(TransducerML)은 스트림데이터를 XML형태로 변환해주는 역항르 한다. SPS(Sensor Planning Service)는 센서의 수집 및 실행을 계획을 담담하며, WNS(Web Notification Service)는 수집된 센서 정보를 웹 프로토콜을 통해 사용자에게 알려주는 역할을 한다.

연구에 필요한 정보는 온도, 풍향, 습도, 미세먼지로 볼 수 있다. 매일 일정 시간마다 데이터를 수집하기 위해서는 다양한 센서를 사용하여야 한다. 기상데이터는 기상청에서 제공하는 레윈존데 기상데이터와 Nature Earth 데이터로 대체하여 수집한다[6,7].

그림 4에서 보는 바와 같이 관측 정보를 O&M으로 변환하여 저장하고 이 정보를 바탕으로 미세먼지와 기온역전의 관련성을 분석한다.

OTNBBE_2019_v19n2_119_f0006.png 이미지

그림 4. 라디오존데 데이터 O&M 변환 

Fig. 4. Convert Radiosonde data to O&M

Analyzer는 크게 4가지 모듈로 구성된다.

Spatial Analyzer는 공간 분석을 목표로 산지, 바다, 호수 등 지역의 특색을 분석하는 역할을 한다. 먼저 산과 바다의 경계를 구분하여 바람맞이 사변이 될 수 있는 지형과 해풍의 영향을 받을 수 있는 요소를 찾아낸다. 둘째 낮은 지표부근에 공기가 정체될 수 있는 분지 또는 저지대를 분석한다.

Surface Analyzer는 온도, 습도, 풍향, 풍속 등의 기상정보를 분석한다. 시간에 따른 온도, 습도, 풍향, 풍속 등의 변화를 분석한다.

Upper Analyzer는 상층 구간의 온도, 풍향, 풍속등을 분석하여 역전층 및 상층 기류 분석을 수행한다. Upper Analyzer를 통해 기온역전의 생성과 해제를 예측한다.

Correlation Analyzer는 수집된 다양한 요소를 바탕으로 상호데이터간의 연관 관계를 분석하고 결과를 도출한다.

NoSQL은 MongoDB를 사용하며, MongoDB는 문서데이터베이스로 JSON 형태의 데이터를 사용하는데 이는 SWE에서 사용되는 O&M, SensorML과 같은 XML언어와 많은 유사점을 가지고 있음으로 효율적으로 사용할 수 있으며, 머신러닝을 활용할 경우 학습데이터를 충분히 확보하기 위한 수평확장성을 가지고 있는 장점을 가지고 있다.

본 연구에서 목표로 하는 가설은 미세먼지와 기온역전의 상관관계이며, 기온역전의 발견 및 해제의 체크이다.

예상대는 시나리오는 다음과 같다.

그림 5에서 보는 바와 같이 온위 데이터만을 가지고 기온역전을 분석하는 것은 올바르지 않다. 고도가 100미터 상승할 때 대략 0.5~0.7도의 온도가 감소하는데 이를 함수적으로 분석하는 것이 분석에 효율적이다. 고도에 대하여 온도관계는 정상적인 대기에서는 기울기가 약 –0.006 의 기울기를 가진다. 따라서 구간별 편미분을 통해 이를 분석하면 기울기 변화에 따른 기온역전 구간을 포착할 수 있다.

OTNBBE_2019_v19n2_119_f0005.png 이미지

그림 5. 시스템 흐름도 

Fig. 5. System Flow Chart

미세먼지는 현재 많은 분석에 사용되는 PM2.5, PM10을 기준으로 측정하며 센서를 통해 관측, 제어가 가능하다.

풍향데이터는 해외의 관측지점들로부터 정보를 획득하고 시간에 따른 분석구역의 지역적 특성과 관련성을 분석한다.

이를 통해 미세먼지의 원인과 기온역전 현상을 미리 발견하고 국지적으로 사전에 경보 할 수 있는 시스템을 만들고자 한다. 또한, OGC에서 제안한 시스템을 충족시키면서 대용량 확장이 가능한 시스템을 목표로 한다.

Ⅳ. 결론

본 논문에서는 미세먼지 수치가 증가하는 큰 원인으로 기온 역전현상에 대하여 이야기 하였고, 기온역전 현상을 찾기 위한 방법론을 고찰하였다. 또한 효율적인 데이터 수집 및 분석을 위한 시스템을 제안하였다.

시스템이 정상적으로 동작하기 위해서는 오랜 기간동안의 데이터 수집과 분석과정을 필요로 하며 이를 위해 다양한 센서 기술 및 분석 기술이 필요하다.

추후 시화공단지역을 중점으로 이를 분석하고자 한다. 시화공단은 간척지로 등고차가 거의 없는 지역이지만 해안가에 위치함에 따라 해풍의 영향을 많이 받는 지역이다. 시스템의 주요기능은 센서 데이터의 수집과 분석으로 분석 결과를 토대로 본 시스템의 가설을 입증한다.

참고문헌

  1. Jeon, I. C., Choi, S. J., Lee, Y. T., & Hong, S. D., "A Development of a System for Earthquake Warning Using Scocial Media," The Journal of The Institute of Internet, Broadcasting and Communication, Vol. 12, No. 5, pp. 169-175, 2012. https://doi.org/10.7236/JIWIT.2012.12.5.169
  2. Nobumitsu T., et al. "Extensive dust outbreaks following the morning inversion breakup in the Taklimakan Desert," Journal of Geophysical Research, Vol. 110, D21. 2005. DOI: https://doi.org/10.1029/2005JD005994
  3. Choi, G. Y, Lee B. R., Kang S. K & Tengunen J., "Intra-annual Variations of the Temperature Inversion Layer Formation in a Mountain Basin of Korea : A case of Punch Bowl in Yanggu, Korea," Journal of The Korean Association of Regional Geograhpers, Vol. 24, No. 3, pp. 496-511, Sept, 2012 DOI: https://doi.org/10.26863/JKARG,2018.08.24.3.496
  4. Jeon, B. I., "Meteorological Relations and Characteristics of Fine Particles at Guducksan in Busan." Journal of Environmental Science International, Vol. 24, No. 7, pp. 883-892, 2015. https://doi.org/10.5322/JESI.2015.24.7.883
  5. "Sensor data storage performance: SQL or NoSQL, physical or virtual. In Cloud computing (CLOUD)," 2012 IEEE 5th international conference on, pp. 431-438, 2012.
  6. http://weather.uwyo.edu, Wyoming Weather Web
  7. http://earth.nullschool.net, Natural Earth
  8. Botts, M., Percivall, G., Reed, C., & Davidson, J., "OGC(R) Sensor Web Enablement: Overview and High level Architecture." Proc. of the 5th International ISCRAM Conference, Washington, USA, May, pp. 175-190, 2008.
  9. Simmon, C., "Observations and Measuremnts - XML Implementation," OpenGIS Implementation Standard, OGC, 2011.