• 제목/요약/키워드: Spatial random forest

검색결과 101건 처리시간 0.028초

인공지능 기법을 활용한 한반도 해역의 수질평가지수 예측모델 개발 (Development of a Water Quality Indicator Prediction Model for the Korean Peninsula Seas using Artificial Intelligence)

  • 김성수;손규희;김도연;허장무;김성은
    • 해양환경안전학회지
    • /
    • 제29권1호
    • /
    • pp.24-35
    • /
    • 2023
  • 급격한 산업화와 도시화로 인해 해양 오염이 심각해지고 있으며, 이러한 해양 오염을 실효적으로 관리하기 위해 수질평가지수(Water Quality Index, WQI)를 마련하여 활용하고 있다. 하지만 수질평가지수는 다소 복잡한 계산과정으로 인한 정보의 손실, 기준값 변동, 실무자의 계산오류, 통계적 오류 등의 불확실성(uncertainty)을 내포하고 있다. 이에 따라 국내·외에서 인공지능 기법을 활용하여 수질평가지수를 예측하기 위한 연구가 활발히 이루어지고 있다. 본 연구에서는 해양환경측정망 자료(2000 ~ 2020년)를 활용하여 우리나라 전 해역 즉, 5개의 생태구에 대한 WQI를 추정할 수 있는 가장 적합한 인공지능기법을 도출하기 위해 총 6가지의 기법(RF, XGBoost, KNN, Ext, SVM, LR)을 실험하였다. 그 결과, Random Forest 기법이 다른 기법에 비해 가장 우수한 성능을 보였다. Random Forest 기법의 WQI 점수 예측값과 실제값의 잔차 분석 결과, 모든 생태구에서 시간적 및 공간적 예측 성능이 우수한 것으로 나타났다. 이를 통해 본 연구에서 개발한 Random Forest 기법은 높은 정확도를 바탕으로 우리나라 전해역에 대한 WQI를 예측 가능할 것으로 사료된다.

중국 소흥안령 활엽수-잣나무 혼효림에서의 산겨릅나무의 공간분포 양상 (Spatial Pattern of Acer tegmentosum in the Mixed Broadleaved-Korean Pine Forest of Xiaoxing'an Mountains, China)

  • 김광택;려여;이지굉;김지홍
    • 한국산림과학회지
    • /
    • 제96권6호
    • /
    • pp.730-736
    • /
    • 2007
  • 생육환경의 이질성은 수목의 개체군 구조와 동태, 군락의 구성 및 종다양성 유지에 중요한 역할을 한다. 이 연구는 미세지형이 활엽수-잣나무 혼효림에서의 산겨릅나무 개체군의 공간분포에 미치는 영향과 공간분포 양상을 검토하기 위하여 9 ha의 영구 표본구에 있는 유묘, 치수, 살아있는 성숙목과 고사목에 대하여 공간분포 특성을 분석하였다. 그 결과 사면경사에 있어서 산겨릅나무는 비교적 완만한 경사를 선호하였다. 사면 방향별 유묘의 밀도는 차이가 없었고, 치수, 살아 있는 성숙목, 고사목의 밀도는 서향, 동남향에서 높게 나타났다. 살아있는 성숙목의 경우, 150 m 이내의 모든 척도에서 집락분포를 하고 있으며, 척도 30 m에서 최고값을 보였고, 고사목은 111 m 이내에서는 집락분포를 하고. 척도 72 m에서 최고값을 보이고 있으며, 111 m보다 큰 척도에서는 무작위분포를 하고 있었다(P < 0.01). 산겨릅나무의 생육단계별 발생 유사성에 있어서 유묘는 치수와 고도의 정의 상관관계, 치수는 살아 있는 성숙목과 고도의 정의 상관관계, 살아 있는 성숙목은 죽은 성숙목과 고도의 정의 상관관계가 있어 (P < 0.01), 생활사 하위 단계의 발생은 상위단계와 고도의 정의 상관관계가 있음을 알 수 있었다.

랜덤포레스트와 Sentinel-2를 이용한 식생 분류의 입력특성 최적화 (Optimization of Input Features for Vegetation Classification Based on Random Forest and Sentinel-2 Image)

  • 이승민;정종철
    • 한국지리정보학회지
    • /
    • 제23권4호
    • /
    • pp.52-67
    • /
    • 2020
  • 최근 북극은 매년 영구 동토층이 녹아 눈으로 덮인 땅이 드러나고 있어 해당 지역 관리를 위한 공간정보가 필요하다. 한국의 국토지리정보원(NGII)은 극지방의 공간정보를 구축하여 극지공간정보 서비스를 제공하고 있으나, 식생 정보는 제공되지 않고 있으므로 식생 공간정보 구축을 위한 추가적인 연구가 필요하다. 본 연구에서는 북극 스발바르제도의 뉘올레순 지역에 대한 식생 분류를 수행하기 위해 다중 시기의 Sentinel-2 영상을 사용하였다. 전처리 단계에서는 다중 시기 Sentinel-2 영상으로부터 10개 밴드와 6가지 정규 지수식을 생성하였다. 영상 분류는 8개 속성에 대한 토지피복분류를 통해 전체 식생 영역을 추출하는 과정과 전체 식생 영역 내에서 다시 세분류를 수행하는 과정으로 이루어졌다. 영상 분류 알고리즘은 OOB(Out-Of-Bag)를 통해 정확도 평가 및 변수 중요도를 산정할 수 있는 랜덤포레스트를 사용하였다. 전체 정확도는 다시기 영상이 사용되었을 경우와 식생 지수가 추가되었을 경우의 이점을 확인하기 위해 사용된 영상 수에 따라 각각 정확도를 산정하였다. 단일시기의 Sentinel-2 영상은 전체 정확도가 77%였으나, 7개의 다중 시기 Sentinel-2 영상을 기반으로 학습하였을 때, 81%로 향상되었다. 또한, 식생 지수가 추가로 사용된 학습에서 전체 정확도가 약 83%로 향상되었다. 식생 분류 시 변수 중요도는 적색, 녹색, 단파적외선-1 밴드가 가장 높은 변수로 선정되었다. 본 연구는 극지방의 식생에 대한 분류를 수행할 시 입력특성을 최적화하는 기초 연구로 활용될 수 있을 것으로 판단된다.

Downscaling of MODIS Land Surface Temperature to LANDSAT Scale Using Multi-layer Perceptron

  • Choe, Yu-Jeong;Yom, Jae-Hong
    • 한국측량학회지
    • /
    • 제35권4호
    • /
    • pp.313-318
    • /
    • 2017
  • Land surface temperature is essential for monitoring abnormal climate phenomena such as UHI (Urban Heat Islands), and for modeling weather patterns. However, the quality of surface temperature obtained from the optical space imagery is affected by many factors such as, revisit period of the satellite, instance of capture, spatial resolution, and cloud coverage. Landsat 8 imagery, often used to obtain surface temperatures, has a high resolution of 30 meters (100 meters rearranged to 30 meters) and a revisit frequency of 16 days. On the contrary, MODIS imagery can be acquired daily with a spatial resolution of about 1 kilometer. Many past attempts have been made using both Landsat and MODIS imagery to complement each other to produce an imagery of improved temporal and spatial resolution. This paper applied machine learning methods and performed downscaling which can obtain daily based land surface temperature imagery of 30 meters.

Prediction of Global Industrial Water Demand using Machine Learning

  • Panda, Manas Ranjan;Kim, Yeonjoo
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.156-156
    • /
    • 2022
  • Explicitly spatially distributed and reliable data on industrial water demand is very much important for both policy makers and researchers in order to carry a region-specific analysis of water resources management. However, such type of data remains scarce particularly in underdeveloped and developing countries. Current research is limited in using different spatially available socio-economic, climate data and geographical data from different sources in accordance to predict industrial water demand at finer resolution. This study proposes a random forest regression (RFR) model to predict the industrial water demand at 0.50× 0.50 spatial resolution by combining various features extracted from multiple data sources. The dataset used here include National Polar-orbiting Partnership (NPP)/Visible Infrared Imaging Radiometer Suite (VIIRS) night-time light (NTL), Global Power Plant database, AQUASTAT country-wise industrial water use data, Elevation data, Gross Domestic Product (GDP), Road density, Crop land, Population, Precipitation, Temperature, and Aridity. Compared with traditional regression algorithms, RF shows the advantages of high prediction accuracy, not requiring assumptions of a prior probability distribution, and the capacity to analyses variable importance. The final RF model was fitted using the parameter settings of ntree = 300 and mtry = 2. As a result, determinate coefficients value of 0.547 is achieved. The variable importance of the independent variables e.g. night light data, elevation data, GDP and population data used in the training purpose of RF model plays the major role in predicting the industrial water demand.

  • PDF

머신러닝 기반의 공업용수 정수장 응집제 주입률 결정 (Machine Learning Based Coagulant Rate Decision Model for Industrial Water Treatment Plant)

  • 박경수;이유진;노하늘;허준;정승환
    • 산업경영시스템학회지
    • /
    • 제47권3호
    • /
    • pp.68-74
    • /
    • 2024
  • This study develops a model to determine the input rate of the chemical for coagulation and flocculation process (i.e. coagulant) at industrial water treatment plant, based on real-world data. To detect outliers among the collected data, a two-phase algorithm with standardization transformation and Density-Based Spatial Clustering of Applications with Noise (DBSCAN) is applied. In addition, both of the missing data and outliers are revised with linear interpolation. To determine the coagulant rate, various kinds of machine learning models are tested as well as linear regression. Among them, the random forest model with min-max scaled data provides the best performance, whose MSE, MAPE, R2 and CVRMSE are 1.136, 0.111, 0.912, and 18.704, respectively. This study demonstrates the practical applicability of machine learning based chemical input decision model, which can lead to a smart management and response systems for clean and safe water treatment plant.

오대산(五臺山) 전나무림(林)의 숲틈에서 발생(發生)된 전나무 치수(稚樹)들의 공간적(空間的) 유전구조(遺傳構造) (Spatial Genetic Structure of Needle Fir(Abies holophylla Seedlings on the Forest Gap Within a Needle Fir Forest at Mt. Odae in Korea))

  • 홍경낙;최영철;강범용;홍용표
    • 한국산림과학회지
    • /
    • 제90권4호
    • /
    • pp.565-572
    • /
    • 2001
  • 본 연구는 오대산의 전나무 노령임분(老齡林分)내 숲틈에서 발생된 1~2년생 전나무 치수(416개체)의 공간적 유전구조를 파악하기 위하여 ISSR(inter-simple sequence repeats) 표지자 분석을 실시하였다. 대상 숲틈의 크기는 $1,500m^2(50m{\times}30m)$로 전나무이외 수종의 상층임관 일부와 중 하층임관이 제거되고, 전나무 성목은 입목고사(立木枯死) 혹은 수세가 불량한 상태이다. 31개의 다형성 ISSR 표지자를 이용한 공간의 자기상관성분석에서는 15.6m이내에 유전적 동질성을 갖으며, 이후 31.2m까지는 임의분포를 나타내었다. 숲틈내 전나무 성목의 평균수고(21.1m), 종자의 산포범위, 성목간 평균거리(23.7m)를 고려할 때, 전나무 치수의 유전적 군락 크기(genetic patch size)는 모수의 분포밀도에 따라서 제한받는 것으로 추정된다. 치수 산포에 대한 방향성 파악을 위하여 유전적 거리를 이용한 다차원척도법의 형상좌표를 '유전적 형상(genetic configuration)'으로 설정하고, 이를 이용한 분산도분석을 실시하였다. 지향성 분산도에서는 동서방향으로 거리의 증가에 따라 치수간 유전적 동질성이 계속 감소하는 것으로 나타났다. 오대산 전나무림의 막대한 종자생산량과 조사구내 치수 발생수의 임의분포와 임상(林床)의 균일성을 고려하면, 이러한 전나무 치수의 유전적 방향은 모수간 충실율 차이나 국소환경보다는 종자 산포의 방향성에 따른 것으로 생각된다.

  • PDF

스태킹 앙상블 모델을 이용한 시간별 지상 오존 공간내삽 정확도 향상 (Improved Estimation of Hourly Surface Ozone Concentrations using Stacking Ensemble-based Spatial Interpolation)

  • 김예진;강은진;조동진;이시우;임정호
    • 한국지리정보학회지
    • /
    • 제25권3호
    • /
    • pp.74-99
    • /
    • 2022
  • 지상 오존은 차량 및 산업 현장에서 배출된 질소화합물(Nitrogen oxides; NOx)과 휘발성 유기화합물(Volatile Organic Compounds; VOCs)의 광화학 반응을 통해 생성되어 식생 및 인체에 악영향을 끼친다. 국내에서는 실시간 오존 모니터링을 수행하고 있지만 관측소 기반으로, 미관측 지역의 공간 분포 분석에 어려움이 있다. 본 연구에서는 스태킹 앙상블 기법을 활용하여 매시간 남한 지역의 지상 오존 농도를 1.5km의 공간해상도로 공간내삽하였고, 5-fold 교차검증을 수행하였다. 스태킹 앙상블의 베이스 모델로는 코크리깅(Cokriging), 다중 선형 회귀(Multi-Linear Regression; MLR), 랜덤 포레스트(Random Forest; RF), 서포트 벡터 회귀(Support Vector Regression; SVR)를 사용하였다. 각 모델의 정확도 비교 평가 결과, 스태킹 앙상블 모델이 연구 기간 내 시간별 평균 R 및 RMSE이 0.76, 0.0065ppm으로 가장 높은 성능을 보여주었다. 스태킹 앙상블 모델의 지상 오존 농도 지도는 복잡한 지형 및 도시화 변수의 특징이 잘 드러나며 더 넓은 농도 범위를 보여주었다. 개발된 모델은 매시간 공간적으로 연속적인 공간 지도를 산출할 수 있을 뿐만 아니라 8시간 평균치 산출 및 시계열 분석에 있어서도 활용 가능성이 클 것으로 기대된다.

Diversity and distribution of invasive alien plant species along elevation gradient in Makawanpur district, central Nepal

  • Dipesh Karki;Bijay Pandeya;Balkrishna Ghimire
    • Journal of Ecology and Environment
    • /
    • 제47권3호
    • /
    • pp.75-84
    • /
    • 2023
  • Background: Knowledge of the spatial trends of plant invasions in different habitats is essential for a better understanding of the process of these invasions. We examined the variation in invasive alien plant species (IAS) richness and composition at two spatial scales defined by elevation and habitat types (roadside, forest, and cultivated lands) in the Makawanpur district of Nepal. Following an elevation gradient ranging from 500 to 2,400 m asl along a mountain road, plant species cover was recorded within sample plots of size 10 m × 5 m. Systematic random sampling was adopted in every 100 m elevation intervals on three habitat types. Results: Altogether 18 invasive alien plants belonging to eight families were recorded within 60 plots, of which 14 species (representing 80%) were from tropical North and South America. The most common plants by their frequency were Ageratina adenophora, Chromolaena odorata, Bidens pilosa, Lantana camara, and Parthenium hysterophorus. We found a significant relationship between species composition and elevation in the study area. Low-elevation regions had a higher number of alien species as compared to high-elevation regions within different habitat types. Conclusions: The species richness and density of IAS were higher in the road site followed by the cultivated land and forest sites. This pattern occurred throughout the elevation range and habitats. IAS were found mostly in the open land with high sunlight availability. Information from such scientific assessment of invasive alien plants will assist in developing appropriate management plans in the Makawanpur district.

초분광 영상의 Morphological Attribute Profiles와 추가 밴드를 이용한 감독분류의 정확도 평가 (Accuracy Evaluation of Supervised Classification by Using Morphological Attribute Profiles and Additional Band of Hyperspectral Imagery)

  • 박홍련;최재완
    • 대한공간정보학회지
    • /
    • 제25권1호
    • /
    • pp.9-17
    • /
    • 2017
  • 초분광 영상(hyperspectral imagery)은 주성분분석이나 최소잡음비율 등을 이용하여 자료의 차원과 잡음을 감소시켜 토지피복분류에 사용되는 것이 일반적이다. 최근에는 분광정보와 공간적 특성을 가진 다양한 입력 자료를 이용한 감독분류에 관한 연구가 활발히 진행되고 있다. 본 연구에서는 초분광 영상을 이용한 토지피복분류를 위해 principle component(PC) 밴드와 normalized difference vegetation index(NDVI) 자료를 감독분류의 입력자료로 활용하였다. NDVI 자료는 초분광 영상에서 추출된 PC 밴드가 포함하고 있지 않는 추가적인 정보를 활용하여 식생지역에 대한 토지피복분류 정확도를 높이고자 사용하였으며, morphological filter를 통해 각 밴드의 extended attribute profiles(EAP)를 제작하여 분류를 위한 입력 자료로 사용하였다. 감독분류기법은 random forest 알고리즘을 이용하였으며, EAP를 기반으로 다양한 입력 자료의 적용에 따른 분류정확도를 비교하고자 하였다. 연구지역으로는 두 대상지를 선정하였으며, 영상 내에서 취득한 참조자료를 이용하여 정량적인 평가를 수행하였다. 본 연구에서 제안한 기법의 분류정확도는 85.72%와 91.14%로 다른 입력 자료들을 이용한 경우와 비교하여 가장 높은 분류정확도를 나타냈다. 향후, 초분광 영상을 이용한 토지피복분류의 정확도를 높이기 위한 분류 알고리즘 개발과 대상지역 특성에 맞는 추가 입력자료 개발에 관한 연구가 필요할 것으로 사료된다.