• 제목/요약/키워드: accuracy-study

검색결과 16,314건 처리시간 0.044초

Sentinel-1 SAR 위성영상의 위상차분간섭기법(DInSAR)을 이용한 적설심의 공간분포 추정 (Estimation of spatial distribution of snow depth using DInSAR of Sentinel-1 SAR satellite images)

  • 박희성;정건희
    • 한국수자원학회논문집
    • /
    • 제55권12호
    • /
    • pp.1125-1135
    • /
    • 2022
  • 적설에 의한 피해는 자주 발생하지 않지만 발생하면 광범위한 지역에 피해를 준다. 적설에 의한 피해를 예방하기 위해서는 지역별로 피해를 유발하는 적설심을 미리 파악해 둘 필요가 있다. 하지만 관측하고 있는 적설심은 특정 관측지점으로 한정되어 피해를 유발하는 지역별 피해유발적설심을 파악하는데 어려움이 있다. 이를 극복하기 위한 일반적인 방법은 관측지점의 적설을 보간하여 공간적으로 확대하는 것이다. 하지만 이것은 매우 적은 자료를 가지고 고도 등 지형적인 특성이 다른 넓은 영역을 통계적으로 추론해야 하는 한계로 인해 지역에 대한 피해유발 피해유발적설심의 구명에 더 혼란을 주기도 한다. 이를 보완하기 위해서는 넓은 영역을 관측하는 위성영상을 활용할 수 있으며, 그 중에서도 합성개구레이더(Synthetic Aperture Radar; SAR)를 이용한 위상차분 간섭기법(DInSAR)을 활용할 수 있다. 위상간섭영상은 두 개의 다른 시기에 측정된 합성개구레이더 영상의 위상간섭을 이용한 것으로 일반적으로 미세한 지형의 변화를 추적할 때 사용되기도 한다. 본 연구에서는 유럽우주국(ESA)에서 운영하는 Sentinel-1B 위성의 dual polarimetric IW 모드 C-band SAR 데이터를 사용하여 DInSAR 분석을 수행하여 적설심의 공간분포를 추정하였다. 또한 정지궤도복합위성 천리안 2호(GK-2A)의 L2 적설심 추정 자료를 이용하여 비교하였다. 적용 결과, 적설예측의 정확도는 격자별로 계산할 경우, DInSAR 는 약 0.92%, GK-2A 는 약 0.71% 를 나타내 DInSAR의 적용성이 높게 나타났다. 즉, DInSAR 방법을 이용하여 계산된 적설심과 기상관측소에서 관측된 적설심을 공간보간하여 비교한 결과, 적설의 분석 결과 적설심을 과대추정하는 경우가 발생하기는 했으나, 적설심의 공간분포를 추정하는데 충분한 정보를 제공했으며, 이러한 방법으로 파악된 적설심의 공간분포는 실제 피해발생지역의 적설심을 보다 정확하게 추정하는데 기여할 수 있으며, 이것은 지역별 피해유발적설심을 파악하는데 도움이 될 것이다.

곰피추출물의 지표성분 Dieckol의 분석법 개선 및 검증 (Modification and Validation of an Analytical Method for Dieckol in Ecklonia Stolonifera Extract)

  • 한웅호;최선일;문효;이세정;오건;진희구;오현지;김은진;김종욱;이부용;이옥환
    • 한국식품위생안전성학회지
    • /
    • 제37권3호
    • /
    • pp.143-148
    • /
    • 2022
  • 본 연구에서는 곰피추출물을 이용하여 건강기능식품 개발 시 원료의 표준화를 위하여 HPLC-PDA를 이용하여 지표성분 dieckol의 분석법 개선 및 검증을 실시하였다. 분석법의 유효성 검증은 ICH가이드라인에 근거하여 특이성, 직선성, 정확성, 정밀성, 검출한계 및 정량한계를 통해 신뢰성 및 타당성을 검증하였다. 지표성분 dieckol 분석을 위하여 0.1% formic acid가 첨가된 water와 acetonitrile을 이동상으로 사용하였고 컬럼은 Capcell pak C18을 사용하여 HPLC를 이용한 분석방법에서 표준용액과 곰피추출물의 지표성분 dieckol 피크 머무름 시간 일치하고 다른 물질의 간섭을 받지 않는 것을 확인하였으며, PDA spectrum이 일치하므로 특이성을 확인하였다. Dieckol의 검량선의 상관계수(R2)은 1에 가까운 높은 상관계수 값 0.9997로 높은 직선성을 확인할 수 있었으며 분석에 적합함을 알 수 있었다. 농도를 알고 있는 곰피추출물에 dieckol 표준용액을 최종 농도가 각각 저농도(2.5 ㎍/mL), 중간농도(5 ㎍/mL), 고농도(10 ㎍/mL)가 되도록 첨가하여 정밀성 및 정확성을 계산하였다. 정밀성은 일간, 일내 정밀성으로 확인하였으며, intra-day 및 inter-day 분석에서 RSD는 각각 1.58-4.39%, 1.37-4.64% 수준으로 5% 이하의 우수한 정밀성을 보였다. 정확성 측정결과 intra-day 및 inter-day 분석에서 회수율은 각각 96.91-102.33% 및 98.41-105.71%로 우수한 정확성을 나타내었다. 검출한계(LOD)와 정량한계(LOQ)는 0.18 ㎍/mL, 0.56 ㎍/mL로 각각 확인되였으며 낮은 농도에서도 검출이 가능함을 보였다. 확립된 분석법은 특이성, 직선성, 정밀성, 정확성, 검출한계 및 정량한계에 대한 분석법 검증결과가 모두 우수한 분석방법임을 증명하였다. 또한 검증된 분석법을 이용하여 곰피추출물 중 함유한 dieckol 함량을 분석한 결과 27.39±0.50 mg/dry weight g로 분석되었다. 본 연구는 HPLC-PDA를 이용한 곰피추출물의 지표성분인 dieckol의 분석방법을 개선 및 유효성 검증을 진행하여 과학적으로 신뢰성이 있는 적합한 분석방법임이 검증되었다.

일반화 적응 심층 잠재요인 추천모형 (A Generalized Adaptive Deep Latent Factor Recommendation Model)

  • 김정하;이지평;장성현;조윤호
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.249-263
    • /
    • 2023
  • 대표적인 추천 시스템 방법론인 협업 필터링(Collaborative Filtering)에는 이웃기반 방법(Neighbor Methods)과 잠재 요인 모델(Latent Factor model)이라는 두 가지 접근법이 있다. 이중 행렬 분해(Matrix Factorization)를 이용하는 잠재 요인 모델은 사용자-아이템 상호작용 행렬을 두 개의 보다 낮은 차원의 직사각형 행렬로 분해하고 이들의 행렬 곱으로 아이템의 평점(Rating)을 예측한다. 평점 패턴으로부터 추출된 요인 벡터들을 통해 사용자와 아이템 속성을 포착할 수 있기 때문에 확장성, 정확도, 유연성 측면에서 이웃기반 방법보다 우수하다고 알려져 있다. 하지만 평점이 지정되지 않은 아이템에 대해서는 선호도가 다른 개개인의 다양성을 반영하지 못하는 근본적인 한계가 있고 이는 반복적이고 부정확한 추천을 초래하게 된다. 이러한 잠재요인 모델의 한계를 개선하고자 각각의 아이템 별로 사용자의 선호도를 적응적으로 학습하는 적응 심층 잠재요인 모형(Adaptive Deep Latent Factor Model; ADLFM)이 등장하였다. ADLFM은 아이템의 특징을 설명하는 텍스트인 아이템 설명(Item Description)을 입력으로 받아 사용자와 아이템의 잠재 벡터를 구하고 어텐션 스코어(Attention Score)를 활용하여 개인의 다양성을 반영할 수 있는 방법을 제시한다. 하지만 아이템 설명을 포함하는 데이터 셋을 요구하기 때문에 이 방법을 적용할 수 있는 대상이 많지 않은 즉 일반화에 있어 한계가 있다. 본 연구에서는 아이템 설명 대신 추천시스템에서 보편적으로 사용하는 아이템 ID를 입력으로 하고 Self-Attention, Multi-head attention, Multi-Conv1d 등 보다 개선된 딥러닝 모델 구조를 적용함으로써 ADLFM의 한계를 개선할 수 있는 일반화된 적응 심층 잠재요인 추천모형 G-ADLFRM을 제안한다. 다양한 도메인의 데이터셋을 가지고 입력과 모델 구조 변경에 대한 실험을 진행한 결과, 입력만 변경했을 경우 동반되는 정보손실로 인해 ADLFM 대비 MAE(Mean Absolute Error)가 소폭 높아지며 추천성능이 하락했지만, 처리할 정보량이 적어지면서 epoch 당 평균 학습속도는 대폭 향상되었다. 입력 뿐만 아니라 모델 구조까지 바꿨을 경우에는 가장 성능이 우수한 Multi-Conv1d 구조가 ADLFM과 유사한 성능을 나타내며 입력변경으로 인한 정보손실을 충분히 상쇄시킬 수 있음을 보여주었다. 결론적으로 본 논문에서 제시한 모형은 기존 ADLFM의 성능은 최대한 유지하면서 빠른 학습과 추론이 가능하고(경량화) 다양한 도메인에 적용할 수 있는(일반화) 새로운 모형임을 알 수 있다.

머신러닝을 활용한 수도권 약수터 수질 예측 모델 개발 (Development of a water quality prediction model for mineral springs in the metropolitan area using machine learning)

  • 임영우;엄지연;곽기영
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.307-325
    • /
    • 2023
  • 코로나19 팬데믹의 장기화로 인해 실내 생활에 지쳐가는 사람들이 우울감, 무기력증 등을 해소하기 위해 근거리의 산과 국립공원을 찾는 빈도가 폭발적으로 증가하였다. 자연으로 나온 수많은 사람들이 오가는 걸음을 멈추고 숨을 돌리며 쉬어가는 장소가 있는데 바로 약수터이다. 산이나 국립공원이 아니더라도 근린공원 또는 산책로에서도 간간이 찾아볼 수 있는 약수터는 수도권에만 약 6백여개가 위치해 있다. 하지만 불규칙적이고 수작업으로 수행되는 수질검사로 인해 사람들은 실시간으로 검사 결과를 알 수 없는 상태에서 약수를 음용하게 된다. 따라서 본 연구에서는 약수터 수질에 영향을 미치는 요인을 탐색하고 다양한 곳에 흩어져 있는 데이터를 수집하여 실시간으로 약수터 수질을 예측할 수 있는 모델을 개발하고자 한다. 데이터 수집의 한계로 인해 서울과 경기로 지역을 한정한 후 데이터 관리가 잘 이루어지고 있는 18개 시의 약 300여개 약수터를 대상으로 2015~2020년의 수질 검사 데이터를 확보하였다. 약수터 수질 적합 여부에 영향을 미칠 것으로 여겨지는 다양한 요인들 중 두 차례의 검토를 거쳐 총 10개의 요인을 최종 선별하였다. 최근 주목받고 있는 자동화 머신러닝 기술인 AutoML 기법을 활용하여 20여가지의 머신러닝 기법들 중 예측 성능 기준 상위 5개의 모델을 도출하였으며 그 중 catboost 모델이 75.26%의 예측 분류 정확도로 가장 높은 성능을 가지고 있음을 확인하였다. 추가로 SHAP 기법을 통해 분석에 사용한 변인들이 예측에 미치는 절대적인 영향력을 살펴본 결과 직전 수질 검사에서 부적합 판정을 받았는지 여부가 가장 중요한 요인이었으며 그 외 평균 기온, 과거 연속 2번 수질 부적합 판정 기록 유무, 수질 검사 당일 기온, 약수터 고도 등이 수질 부적합 여부에 영향을 미치고 있음을 확인하였다.

딥러닝 기반 옥수수 포장의 잡초 면적 평가 (Deep Learning Approaches for Accurate Weed Area Assessment in Maize Fields)

  • 박혁진;권동원;상완규;반호영;장성율;백재경;이윤호;임우진;서명철;조정일
    • 한국농림기상학회지
    • /
    • 제25권1호
    • /
    • pp.17-27
    • /
    • 2023
  • 포장에서 잡초의 발생은 농작물의 생산량을 크게 떨어트리는 원인 중 하나이고 SSWM을 기반으로 잡초를 변량 방제하기 위해서 잡초의 발생 위치, 밀도 그리고 이를 정량화하는 것은 필수적이다. 본 연구에서는 2020년의 국립식량과학원에서 잡초 피해를 입은 옥수수 포장의 영상데이터를 무인항공기를 활용해서 수집하였고 이를 배경과 옥수수로 분리하여 딥러닝 기반 영상 분할 모델 제작을 위한 학습데이터를 획득하였다. DeepLabV3+, U-Net, Linknet, FPN의 4가지의 영상 분할 네트워크들의 옥수수의 검출 정확도를 평가하기 위해 픽셀정확도, mIOU, 정밀도, 재현성의 지표를 활용해서 정확도를 검증하였다. 검증 결과 DeepLabV3+ 모델이 0.76으로 가장 높은 mIOU를 나타냈고, 해당 모델과 식물체의 녹색 영역과 배경을 분리하는 지수인 ExGR을 활용해서 잡초의 면적을 정량화, 시각화하였다. 이러한 연구의 결과는 무인항공기로 촬영된 영상을 활용해서 넓은 면적의 옥수수 포장에서 빠르게 잡초의 위치와 밀도를 특정하고 정량화하는 것으로 잡초의 밀도에 따른 제초제의 변량 방제를 위한 의사결정에 도움이 될 것으로 기대한다.

기침 소리의 다양한 변환을 통한 코로나19 진단 모델 (A COVID-19 Diagnosis Model based on Various Transformations of Cough Sounds)

  • 김민경;김건우;최근호
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.57-78
    • /
    • 2023
  • 2019년 11월 중국 우한시에서 발병한 코로나19는 2020년 중국을 넘어 세계로 퍼져나가 2020년 3월에는 전 세계적으로 확산되었다. 코로나19와 같이 전염성이 강한 바이러스는 예방과 확진시 적극적인 치료도 중요하지만 우선 전파 속도가 빠른 바이러스인 점을 감안할 때, 확진 사실을 재빠르게 파악하여 전파를 차단하는 것이 더욱 중요하다. 그러나 감염여부를 확인하기 위한 PCR검사는 비용과 시간이 많이 소요되고, 자가키트검사 또한 접근성은 쉽지만 매번 수시로 받기에는 키트의 가격이 부담이 될 수밖에 없는 실정이다. 이러한 상황에서 기침 소리를 기반으로 코로나19 양성 여부를 판단할 수 있게 된다면 누구나 쉽게 언제, 어디서든 확진 여부를 체크할 수 있어 신속성과 경제성 측면에서 큰 장점을 가질 수 있을 것이다. 따라서 본 연구는 기침 소리를 기반으로 코로나19 확진 여부를 식별할 수 있는 분류 모델을 개발하는 것을 목적으로 하였다. 이를 위해, 본 연구에서는 먼저 MFCC, Mel-Spectrogram, Spectral contrast, Spectrogram 등을 통해 기침 소리를 벡터화 하였다. 이 때, 기침 소리의 품질을 위해 SNR을 통해 잡음이 많은 데이터는 삭제하였고, chunk를 통해 음성 파일에서 기침 소리만 추출하였다. 이후, 추출된 기침 소리의 feature를 이용하여 코로나 양성과 음성을 분류하기 위한 모델을 구축하였으며, XGBoost, LightGBM, FCNN 알고리즘을 통해 모델 학습을 수행하고 각 알고리즘별 성능을 비교하였다. 또한, 기침 소리를 다차원 벡터로 변환한 경우와, 이미지로 변환한 경우에 대해 모델 성능에 대한 비교 실험을 수행하였다. 실험 결과, 건강상태에 대한 기본정보와 기침 소리를 MFCC, Mel-Spectogram, Spectral contrast, 그리고 Spectrogram을 통해 다차원 벡터로 변환한 feature를 모두 활용한 LightGBM 모델이 0.74의 가장 높은 정확도를 보였다.

18~34 남성의 최대산소 섭취량 추정 (Prediction of Maximal Oxygen Uptake Ages 18~34 Years)

  • 전유정;임재형;이병근;김창환;김병완
    • 한국체육학회지인문사회과학편
    • /
    • 제51권3호
    • /
    • pp.373-382
    • /
    • 2012
  • 본 연구의 목적은 신체변인과 최대하 대사반응을 이용하여 최대산소섭취량(VO2max)을 간편하고 정확하게 추정하는 데 있다. 18~34세 남성 250명을 대상으로 추정집단(n=179)과 타당도 검증집단(n=71)으로 나누어 최대 운동부하검사를 실시하였으며 3분인 1단계와 6분인 2단계 종료 시점의 대사반응을 측정하였다. 추정 집단을 대상으로 단계선택법(stepwise method)으로 다중회귀분석 (multiple regression analysis)을 실시하였다. 단계별분석법으로 분석한 모형 1의 추정변인은 체중, 6분HR, 6분VO2이고 R은 0.64(p<.01)이었으며 SEE와 CV는 각각 4.74, 11.7%로 나타났고(p<.01), 추정식은 VO2max(ml/kg/min)= 72.256-0.340(Weight)-0.220(6분HR)+0.013(6분VO2)이며 다중공선성이 나타나지 않았다. 모형 2의 추정변인은 체중, 6분HR, 6분VO2, 6분VCO2이고 R은 0.66(p<.01)이었으며 SEE와 CV는 각각 4.59, 11.3%로 나타났고(p<.01), 추정식은 VO2max(ml/kg/min)= 68.699-0.277(Weight) -0.206(6분HR)+0.020(6분VO2)-0.009(6분VCO2)이며, 역시 다중공선성이 나타나지 않았다. 모형 1과 비교했을 때 모형 2는 상관이 더 높지만 다중공선성 측면에서는 다소 불리하게 나타났다. 모형 1과 모형 2를 교차타당도 검증집단에 적용했을 때, 측정된 VO2max와 추정된 VO2Max 간에 유의한 상관관계가 나타났다(R=0.53, 0.56, P<.001). 타당도 검증을 통해 유용성과 간편성을 고려하면, 본 연구에서 얻은 신체변인 및 최대하 대사반응을 이용한 추정모형들이 모두 사용가능하나 모형 2가 정확도 측면에서 다소 유리하다.

농지 공간격자 자료의 층화랜덤샘플링: 농업시스템 기후변화 영향 공간모델링을 위한 국내 농지 최적 층화 및 샘플 수 최적화 연구 (A stratified random sampling design for paddy fields: Optimized stratification and sample allocation for effective spatial modeling and mapping of the impact of climate changes on agricultural system in Korea)

  • 이민영;김용은;홍진솔;조기종
    • 환경생물
    • /
    • 제39권4호
    • /
    • pp.526-535
    • /
    • 2021
  • 공간 샘플링은 공간모델링 연구에 활용되어 샘플링 비용을 줄이면서 모델링의 효율성을 높이는 역할을 한다. 농업분야에서는 기후변화 영향을 예측하고 평가하기 위한 고해상도 공간자료 기반 모델링에 대한 연구 수요가 빠르게 증가하고 있으며, 이에 따라 공간 샘플링의 필요성과 중요성이 증가하고 있다. 본 연구는 국내 농지 공간샘플링 연구를 통해 농업분야 기후변화연구의 공간자료 활용의 효율성을 제고하고자 하였다. 본 연구는 층화랜덤샘플링을 기반으로 하였으며, 1 km 해상도의 농지 공간격자자료 모집단(11,386개 격자)에 대해서 RCP 시나리오별(RCP 4.5/8.5) 연대별(2030/2050/2080년대) 공간샘플링을 설계하였다. 국내 농지는 기상 및 토양 특성에 따라 계층화 되었으며, 샘플링 효율 극대화를 위해 최적 층화 및 샘플 배정 최적화를 수행하였다. 최적화는 작물수량, 온실가스 배출량, 해충 분포 확률을 포함하는 16개 목표 변수에 대해 주어진 정밀도 제한 내에서 샘플 수를 최소화하는 방향으로 진행되었다. 샘플링의 정밀도와 정확도 평가는 각각 변동계수(CV)와 상대적 편향을 기반으로 하였다. 국내 농지 공간격자 모집단 계층화 및 샘플 배정 및 샘플 수 최적화 결과, 전체 농지는 5~21개 계층, 46~69개 샘플 수 수준에서 최적화되었다. 본 연구결과물들은 국내 농업시스템 대표 공간격자로써 널리 활용될 수 있을 것으로 기대된다. 또한, 기후변화 영향예측 공간모델링 연구들에 활용되어 샘플링 비용 및 계산 시간을 줄이면서도 모델의 효율성을 높이는 데에 기여할 수 있다.

CCTV 영상 기반 강우강도 산정을 위한 실환경 실험 자료 중심 적정 강우 이미지 DB 구축 방법론 개발 (Rainfall image DB construction for rainfall intensity estimation from CCTV videos: focusing on experimental data in a climatic environment chamber)

  • 변종윤;전창현;김현준;이재준;박헌일;이진욱
    • 한국수자원학회논문집
    • /
    • 제56권6호
    • /
    • pp.403-417
    • /
    • 2023
  • 본 연구에서는 CCTV 영상 기반 강우강도 산정 시 필수적으로 요구되는 적정 강우 이미지 DB를 구축하기 위한 방법론을 개발하였다. 먼저, 실환경에서 불규칙적이고 높은 변동성을 보일 수 있는 변수들(바람으로 인한 빗줄기의 변동성, 녹화 환경에서 포함되는 움직이는 객체, 렌즈 위의 흐림 현상 등)에 대한 통제가 가능한 한국건설생활환경시험연구원 내 기후환경시험실에서 CCTV 영상 DB를 구축하였다. 서로 다른 5개의 실험 조건을 고려하여 이상적 환경에서 총 1,728개의 시나리오를 구성하였다. 본 연구에서는 1,920×1,080 사이즈의 30 fps (frame per second) 영상 36개에 대하여 프레임 분할을 진행하였으며, 총 97,200개의 이미지를 사용하였다. 이후, k-최근접 이웃 알고리즘을 기반으로 산정된 최종 배경과 각 이미지와의 차이를 계산하여 빗줄기 이미지를 분리하였다. 과적합 방지를 위해 각 이미지에 대한 평균 픽셀 값을 계산하고, 설정한 픽셀 임계치보다 큰 자료를 선별하였다. 180×180 사이즈로의 재구성을 위해서 관심영역을 설정하고 10 Pixel 단위로 이동을 진행하여 픽셀 변동성이 최대가 되는 영역을 산정하였다. 합성곱 신경망 모델의 훈련을 위해서 120×120 사이즈로 재변환하고 과적합 방지를 위해 이미지 증강 과정을 거쳤다. 그 결과, 이미지 기반 강우 강도 합성곱 신경망 모델을 통해 산정된 결과값과 우량계에서 취득된 강우자료가 전반적으로 유사한 양상을 보였으며, 모든 강우강도 실험 조건에 대해서 약 92%의 데이터의 PBIAS (percent bias)가 절댓값 범위 10% 이내에 해당하였다. 본 연구의 결과물과 전이학습 등의 방법을 연계하여 기존 실환경 CCTV의 한계점을 개선할 수 있을 것으로 기대된다.

머신러닝 기법을 이용한 재해강도 분류모형 개발 (Development of disaster severity classification model using machine learning technique)

  • 이승민;백선욱;이준학;김경탁;김수전;김형수
    • 한국수자원학회논문집
    • /
    • 제56권4호
    • /
    • pp.261-272
    • /
    • 2023
  • 최근 급격한 도시화와 기후변화에 따라 재난에 의한 피해가 증가하고 있다. 국내 기상청에서는 표준 경보(주의보, 경보)를 전국적으로 통일된 표준 경보 기준(3시간 및 12시간 최대 누적강우량)에 따라 발령하여 재해에 따른 지역별, 재난 사상별 특성이 고려되지 않은 문제점이 있다. 따라서 본 연구에서는 서울특별시, 인천광역시, 경기도의 호우·태풍에 대한 재해 피해액 및 누적강우량을 활용하여 대상지역별 재해강도에 따른 단계별 기준을 설정하고, 강우에 따라 발생할 수 있는 재해의 강도를 분류하는 모형을 개발하고자 하였다. 즉, 본 연구에서는 호우·태풍에 의한 재해 피해액 누적 분포 함수의 분위별로 재해강도의 범주(관심, 주의, 경계, 심각 단계)를 분류하였고, 재해강도의 범주에 따른 누적강우량 기준을 대상 지자체별로 제시하였다. 그리고 지자체별 재해강도 분류모형 개발을 위해 4가지(의사결정나무, 서포트 벡터 머신, 랜덤 포레스트, XGBoost)의 머신러닝 모형을 활용하였는데 강우량, 누적강우량, 지속시간 최대 강우량(3시간, 12시간), 선행강우량을 독립변수로 이용하여 종속변수인 지자체별 재해강도를 분류하였다. 각 모형별 F1 점수를 이용한 정확도 평가 결과, 의사결정나무의 F1 점수가 0.56으로 가장 우수한 정확도를 보였다. 본 연구에서 제시한 머신러닝 기반 재해강도 분류모형을 활용하면 호우·태풍에 의한 재해에 대한 지자체별 위험 상태를 단계별로 파악할 수 있어, 재난 담당자들의 신속한 의사결정을 위한 기초 자료로 활용될 수 있을 것으로 판단된다.