• 제목/요약/키워드: Extreme Random Forest

검색결과 44건 처리시간 0.025초

Forest Vertical Structure Mapping from Bi-Seasonal Sentinel-2 Images and UAV-Derived DSM Using Random Forest, Support Vector Machine, and XGBoost

  • Young-Woong Yoon;Hyung-Sup Jung
    • 대한원격탐사학회지
    • /
    • 제40권2호
    • /
    • pp.123-139
    • /
    • 2024
  • Forest vertical structure is vital for comprehending ecosystems and biodiversity, in addition to fundamental forest information. Currently, the forest vertical structure is predominantly assessed via an in-situ method, which is not only difficult to apply to inaccessible locations or large areas but also costly and requires substantial human resources. Therefore, mapping systems based on remote sensing data have been actively explored. Recently, research on analyzing and classifying images using machine learning techniques has been actively conducted and applied to map the vertical structure of forests accurately. In this study, Sentinel-2 and digital surface model images were obtained on two different dates separated by approximately one month, and the spectral index and tree height maps were generated separately. Furthermore, according to the acquisition time, the input data were separated into cases 1 and 2, which were then combined to generate case 3. Using these data, forest vetical structure mapping models based on random forest, support vector machine, and extreme gradient boost(XGBoost)were generated. Consequently, nine models were generated, with the XGBoost model in Case 3 performing the best, with an average precision of 0.99 and an F1 score of 0.91. We confirmed that generating a forest vertical structure mapping model utilizing bi-seasonal data and an appropriate model can result in an accuracy of 90% or higher.

지진으로 인한 건물 손상 예측 모델의 효율성 분석 (Evaluating the Efficiency of Models for Predicting Seismic Building Damage)

  • 채송화;임유진
    • 정보처리학회 논문지
    • /
    • 제13권5호
    • /
    • pp.217-220
    • /
    • 2024
  • 지진 발생은 정확히 예측하기 어렵고, 이러한 무작위성을 갖는 사건에 대비하여 모든 건물에 내진 설계를 도입하는 것은 현실적으로 어려운 과제이다. 건물의 특징 분석을 통한 건물 손상 예측을 기반으로 건물의 취약점을 보완한다면, 내진 설계를 도입하지 않은 건물에서도 피해를 최소화할 수 있으므로 건물 손상 예측 모델의 효율성을 분석하는 연구가 필요하다. 본 논문에서는 2015년 네팔 대지진으로 인해 손상된 건물 데이터를 활용하여 Random Forest, Extreme Gradient Boosting, LightGBM, CatBoost 기계학습 분류 알고리즘을 사용하여 지진 피해 예측 모델의 정확도를 비교하였다.

기계학습을 이용한 염화물 확산계수 예측모델 개발 (Development of Prediction Model of Chloride Diffusion Coefficient using Machine Learning)

  • 김현수
    • 한국공간구조학회논문집
    • /
    • 제23권3호
    • /
    • pp.87-94
    • /
    • 2023
  • Chloride is one of the most common threats to reinforced concrete (RC) durability. Alkaline environment of concrete makes a passive layer on the surface of reinforcement bars that prevents the bar from corrosion. However, when the chloride concentration amount at the reinforcement bar reaches a certain level, deterioration of the passive protection layer occurs, causing corrosion and ultimately reducing the structure's safety and durability. Therefore, understanding the chloride diffusion and its prediction are important to evaluate the safety and durability of RC structure. In this study, the chloride diffusion coefficient is predicted by machine learning techniques. Various machine learning techniques such as multiple linear regression, decision tree, random forest, support vector machine, artificial neural networks, extreme gradient boosting annd k-nearest neighbor were used and accuracy of there models were compared. In order to evaluate the accuracy, root mean square error (RMSE), mean square error (MSE), mean absolute error (MAE) and coefficient of determination (R2) were used as prediction performance indices. The k-fold cross-validation procedure was used to estimate the performance of machine learning models when making predictions on data not used during training. Grid search was applied to hyperparameter optimization. It has been shown from numerical simulation that ensemble learning methods such as random forest and extreme gradient boosting successfully predicted the chloride diffusion coefficient and artificial neural networks also provided accurate result.

기계학습 기법을 이용한 CNC 공구 마모도 예측에 관한 연구 (A Study on the Prediction of CNC Tool Wear Using Machine Learning Technique)

  • 이강배;박성호;성상하;박도명
    • 한국융합학회논문지
    • /
    • 제10권11호
    • /
    • pp.15-21
    • /
    • 2019
  • 4차 산업혁명이 주목받고 있다. 특히 스마트 팩토리는 제조 분야에서 그 필요성이 강조되고 있다. 현재 제조 분야에서 CNC(Computerized Numeric Controller: 컴퓨터 수치 제어)에 관한 연구가 활발히 진행 중이다. 국내에서는 CNC 설비에 음향 센서, 진동 센서 등 여러 가지 센서를 부착하여 소음, 진동 등 설비 관련 데이터를 수집하는 방안에 관한 연구가 존재한다. 본 연구는 CNC 머신에서 발생하는 데이터를 중심으로 머신러닝 기법을 활용하여 설비 가동 조건이 공구 마모도에 미치는 영향을 분석한다. CNC 설비에서 발생하는 X축, Y축, Z축의 힘, 이동 속도 등 다양한 데이터를 수집한다. 데이터 탐색 기법을 통해 데이터의 특성 및 분포를 분석하였다. 데이터를 RF(Random Forest), XGB(Extreme Gradient Boost), SVM(Support Vector Machine)을 이용하여 CNC 설비 가동 조건이 공구 마모도에 미치는 영향을 분석하였다. 본 연구의 결과는 CNC 설비 가동에서 최적의 조건을 찾고, 이를 바탕으로 품질 향상 및 기계 손상을 예방하는데 활용될 수 있을 것으로 기대된다.

기계학습을 이용한 레이더 강우추정 기법 연구 (A study of quantitative precipitation estimation method using advanced machine learning algorithms.)

  • 신주영;노용훈
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2019년도 학술발표회
    • /
    • pp.58-58
    • /
    • 2019
  • 최근 기계학습기법에 대한 활발한 연구로 인하여 많은 기계학습기법들이 개발되었다. 이러한 최신기계학습기법은 기존에 사용되어온 기계학습기법과 경험식들보다 자연현상을 예측하고 재현하는데 높은 성능을 보이는 것으로 알려져 있다. 레이더 자료를 이용한 강우추정 기법으로는 ZR관계식이 널리 사용되고 있다. 이상적인 조건에서는 ZR 관계식을 이용한 레이더 강우추정이 양호한 성능을 보이나, 실제 레이더 자료를 이용한 강우추정은 이상적인 환경이 아닌 경우가 매우 많다. 이런 ZR관계식의 한계점을 보완하기 위한 방법으로 기계학습기법을 이용한 레이더 강우추정 기법들이 개발되었으나, 현재 한국의 레이더 자료를 대상으로 해서는 많은 연구가 진행되어 오지 않고 있다. 레이더 자료를 이용한 강우추정의 정확도 향상을 위해서는 최신 기계학습기법들의 레이더 강우추정 기법에 대한 적용가능성을 평가해 볼 필요성이 있다. 본 연구에서는 random forest, stochastic gradient boosted model, extreme learning machine의 강우 레이더 강우추정 기법으로의 적용성을 평가하였다. 강우추정 기법 개발 및 성능 비교를 위해서 2018년 광덕산 이중편파 레이더 자료를 이용하였다. 다양한 이중편파 매개변수 조합을 레이더 강우추정 기법의 입력변수로 적용하였다. 기존 연구의 사용되어 온 ZR관계식의 매개변수를 또한 강우사상과 이중편파 매개변수 조합을 이용하여 추정하였다. 기계학습을 적용한 레이더 강우추정 기법이 ZR관계식보다 상관계수와 제곱근오차를 기준으로 높은 강우추정 정확도를 보였다. 특히 개발된 강우추정 기법은 호우사상에서 높은 정확도를 보이는 것을 확인 할 수 있었다. 적용된 기계학습 기법 중에서는extreme learning machine이 레이더 강우추정기법 개발에 가장 적합한 것으로 나타났다.

  • PDF

쾌삭 303계 스테인리스강 소형 압연 선재 제조 공정의 생산품질 예측 모형 (Quality Prediction Model for Manufacturing Process of Free-Machining 303-series Stainless Steel Small Rolling Wire Rods)

  • 서석준;김흥섭
    • 산업경영시스템학회지
    • /
    • 제44권4호
    • /
    • pp.12-22
    • /
    • 2021
  • This article suggests the machine learning model, i.e., classifier, for predicting the production quality of free-machining 303-series stainless steel(STS303) small rolling wire rods according to the operating condition of the manufacturing process. For the development of the classifier, manufacturing data for 37 operating variables were collected from the manufacturing execution system(MES) of Company S, and the 12 types of derived variables were generated based on literature review and interviews with field experts. This research was performed with data preprocessing, exploratory data analysis, feature selection, machine learning modeling, and the evaluation of alternative models. In the preprocessing stage, missing values and outliers are removed, and oversampling using SMOTE(Synthetic oversampling technique) to resolve data imbalance. Features are selected by variable importance of LASSO(Least absolute shrinkage and selection operator) regression, extreme gradient boosting(XGBoost), and random forest models. Finally, logistic regression, support vector machine(SVM), random forest, and XGBoost are developed as a classifier to predict the adequate or defective products with new operating conditions. The optimal hyper-parameters for each model are investigated by the grid search and random search methods based on k-fold cross-validation. As a result of the experiment, XGBoost showed relatively high predictive performance compared to other models with an accuracy of 0.9929, specificity of 0.9372, F1-score of 0.9963, and logarithmic loss of 0.0209. The classifier developed in this study is expected to improve productivity by enabling effective management of the manufacturing process for the STS303 small rolling wire rods.

Projecting the spatial-temporal trends of extreme climatology in South Korea based on optimal multi-model ensemble members

  • Mirza Junaid Ahmad;Kyung-sook Choi
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.314-314
    • /
    • 2023
  • Extreme climate events can have a large impact on human life by hampering social, environmental, and economic development. Global circulation models (GCMs) are the widely used numerical models to understand the anticipated future climate change. However, different GCMs can project different future climates due to structural differences, varying initial boundary conditions and assumptions about the physical phenomena. The multi-model ensemble (MME) approach can improve the uncertainties associated with the different GCM outcomes. In this study, a comprehensive rating metric was used to select the best-performing GCMs out of 11 CMIP5 and 13 CMIP6 GCMs, according to their skills in terms of four temporal and five spatial performance indices, in replicating the 21 extreme climate indices during the baseline (1975-2017) in South Korea. The MME data were derived by averaging the simulations from all selected GCMs and three top-ranked GCMs. The random forest (RF) algorithm was also used to derive the MME data from the three top-ranked GCMs. The RF-derived MME data of the three top-ranked GCMs showed the highest performance in simulating the baseline extreme climate which was subsequently used to project the future extreme climate indices under both the representative concentration pathway (RCP) and the socioeconomic concentration pathway scenarios (SSP). The extreme cold and warming indices had declining and increasing trends, respectively, and most extreme precipitation indices had increasing trends over the period 2031-2100. Compared to all scenarios, RCP8.5 showed drastic changes in future extreme climate indices. The coasts in the east, south and west had stronger warming than the rest of the country, while mountain areas in the north experienced more extreme cold. While extreme cold climatology gradually declined from north to south, extreme warming climatology continuously grew from coastal to inland and northern mountainous regions. The results showed that the socially, environmentally and agriculturally important regions of South Korea were at increased risk of facing the detrimental impacts of extreme climatology.

  • PDF

기계학습기법을 이용한 땅밀림 위험등급 분류 (Classification of Soil Creep Hazard Class Using Machine Learning)

  • 이기하;레수안히엔;연민호;서준표;이창우
    • 한국방재안전학회논문집
    • /
    • 제14권3호
    • /
    • pp.17-27
    • /
    • 2021
  • 본 연구에서는 6개의 기계학습 기법들을 활용하여 2019년과 2020년 전국 땅밀림 현장조사 결과를 기반으로 땅밀림 위험지역을 A부터 C까지 3개 등급(A등급: 위험, B등급: 보통, C등급: 양호)으로 구분할 수 있는 분류모형을 구축하고, 분류 정확도를 비교·분석한다. 기계학습 기법으로는 K-Nearest Neighbor, Support Vector Machine, Logistic Regression, Decision Tree, Random Forest, Extreme Gradient Boosting 총 6개를 적용하였다. 분류 정확도 분석결과, 6개의 기법 모두 0.9 이상의 우수한 정확도를 보여주었다. 수치형 자료를 학습에 적용한 경우가, 문자형 자료를 학습한 모형보다 우수한 성능을 나타냈으며, 현장조사 평가점수 자료군(C1~C4) 보다는 전문가의견이 반영된 평가점수 자료군(R1~R4)으로 학습한 모형이 정확도가 높은 것으로 분석되었다. 특히, 직접징후와 간접징후 정보를 학습에 반영한 경우가 예측정확도가 높게 나타났다. 향후 땅밀림 현장조사 자료가 지속적으로 확보될 경우, 본 연구에서 활용한 기계학습기법은 땅밀림 분류를 위한 도구로 활용이 가능할 것으로 판단된다.

Unveiling the mysteries of flood risk: A machine learning approach to understanding flood-influencing factors for accurate mapping

  • Roya Narimani;Shabbir Ahmed Osmani;Seunghyun Hwang;Changhyun Jun
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.164-164
    • /
    • 2023
  • This study investigates the importance of flood-influencing factors on the accuracy of flood risk mapping using the integration of remote sensing-based and machine learning techniques. Here, the Extreme Gradient Boosting (XGBoost) and Random Forest (RF) algorithms integrated with GIS-based techniques were considered to develop and generate flood risk maps. For the study area of NAPA County in the United States, rainfall data from the 12 stations, Sentinel-1 SAR, and Sentinel-2 optical images were applied to extract 13 flood-influencing factors including altitude, aspect, slope, topographic wetness index, normalized difference vegetation index, stream power index, sediment transport index, land use/land cover, terrain roughness index, distance from the river, soil, rainfall, and geology. These 13 raster maps were used as input data for the XGBoost and RF algorithms for modeling flood-prone areas using ArcGIS, Python, and R. As results, it indicates that XGBoost showed better performance than RF in modeling flood-prone areas with an ROC of 97.45%, Kappa of 93.65%, and accuracy score of 96.83% compared to RF's 82.21%, 70.54%, and 88%, respectively. In conclusion, XGBoost is more efficient than RF for flood risk mapping and can be potentially utilized for flood mitigation strategies. It should be noted that all flood influencing factors had a positive effect, but altitude, slope, and rainfall were the most influential features in modeling flood risk maps using XGBoost.

  • PDF

Cognitive Impairment Prediction Model Using AutoML and Lifelog

  • Hyunchul Choi;Chiho Yoon;Sae Bom Lee
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권11호
    • /
    • pp.53-63
    • /
    • 2023
  • 본 연구는 고령층의 치매 예방을 위한 선별검사 수단으로 자동화된 기계학습(AutoML)을 활용하여 인지기능 장애 예측모형을 개발하였다. 연구 데이터는 한국지능정보사회진흥원의 '치매 고위험군 웨어러블 라이프로그 데이터'를 활용하였다. 분석은 구글 코랩 환경에서 PyCaret 3.0.0이 사용하여 우수한 분류성능을 보여주는 5개의 모형을 선정하고 앙상블 학습을 진행하여 모형을 통합한 뒤, 최종 성능평가를 진행하였다. 연구결과, Voting Classifier, Gradient Boosting Classifier, Extreme Gradient Boosting, Light Gradient Boosting Machine, Extra Trees Classifier, Random Forest Classifier 모형 순으로 높은 예측성능을 보이는 것으로 나타났다. 특히 '수면 중 분당 평균 호흡수'와 '수면 중 분당 평균 심박수'가 가장 중요한 특성변수(feature)로 확인되었다. 본 연구의 결과는 고령층의 인지기능 장애를 보다 효과적으로 관리하고 예방하기 위한 수단으로 기계학습과 라이프로그의 활용 가능성에 대한 고려를 시사한다.