• 제목/요약/키워드: 앙상블 예측기법

검색결과 161건 처리시간 0.029초

부스팅 인공신경망학습의 기업부실예측 성과비교 (An Empirical Analysis of Boosing of Neural Networks for Bankruptcy Prediction)

  • 김명종;강대기
    • 한국정보통신학회논문지
    • /
    • 제14권1호
    • /
    • pp.63-69
    • /
    • 2010
  • 최근 기계학습 분야에서 분류자의 정확도 개선을 위하여 제안된 다양한 방법들 중 가장 큰 주목을 받고 있는 학습방법 중 하나는 앙상블 학습이다. 그러나 앙상블 학습은 의사결정트리와 같이 불안정한 학습 알고리즘의 성과 개선 효과는 탁월한 반면, 인공신경망과 같이 안정적인 학습알고리즘의 성과 개선 효과는 응용 분야와 구현 방법에 따라 서로 상반된 결론들을 보여주고 있다. 본 연구에서는 국내 기업의 부실화 예측문제를 활용하여 인공신경 망 분류자 및 대표적 앙상블 학습기법인 부스팅 분류자를 적용한 결과 앙상블 학습은 기업부실 예측문제에 있어 전통적 인공신경망의 성과를 개선할 수 있음을 검증하였다.

목조 문화재 영상에서의 변위량 측정을 위한 앙상블 딥러닝 모델 (An Ensemble Deep Learning Model for Measuring Displacement in Cultural Asset images)

  • 강재용;김인기;임현석;곽정환
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.141-143
    • /
    • 2021
  • 본 논문에서는 목조 문화재의 변위량을 감지할 수 있는 앙상블 딥러닝 모델 모델을 제안한다. 우선 총 2개의 서로 다른 사전 학습된 합성 곱 신경망을 사용하여 입력 영상에 대한 심층 특징들을 추출한다. 그 이후 2개의 서로 다른 심층 특징들을 결합하여 하나의 특징 벡터를 생성한다. 그 이후 합쳐진 특징 벡터는 완전 연결 계층의 입력 값으로 들어와서 최종적으로 변위의 심각 단계에 대한 예측을 수행하게 된다. 데이터 셋으로는 충주시 근처의 문화재에 방문해서 수집한 목조 문화재 이미지를 가지고 정상 및 비정상으로 구분한 데이터 셋을 사용하였다. 실험 결과 앙상블 딥러닝 기법을 사용한 모델이 앙상블 기법을 사용하지 않는 모델보다 더 좋은 성능을 나타냄을 확인하였다. 이러한 결과로부터 우리가 제안한 방법이 목재 문화재의 변위량 예측에 있어서 매우 적합함을 보여준다.

  • PDF

일강우 내삽을 이용한 일유량 시뮬레이션 및 앙상블 유량 발생 (Ensemble Daily Streamflow Forecast Using Two-step Daily Precipitation Interpolation)

  • 황연상;허준행;정영훈
    • 한국수자원학회논문집
    • /
    • 제44권3호
    • /
    • pp.209-220
    • /
    • 2011
  • 입력자료의 불확실성은 강우-유출 모의에서 중요한 불확실성 요소 중의 하나이다. 본 연구에서는 먼저 세 가지의 서로 다른 내삽 기법을 통해 계산된 강수 입력 자료 (관측값을 각 소유역의 중심점으로 내삽하여 추정한 입력자료임)들이 강우-유출 모형에 미치는 영향을 분포형 수문모형 (PRMS)을 이용하여 분석하였으며, 내삽오차를 바탕으로 발생한 입력자료를 앙상블 유량 예측에 이용하는 과정을 수문학적으로 서로 다른 두개 하천 유역에 적용하였다. 또한 Monte Carlo기법을 이용하여 수문 모형의 매개변수가 서로 다른 입력자료의 특성에 따라 변화하는 양상을 구분하여 보았다. 본 연구에서 제시된 앙상블 유량 예측방법은 기상 예측 및 기상 모형의 결과물 등의 입력자료를 이용함으로써 중/장기 유량 예측에 활용될 수 있을 것으로 판단된다.

경향성 변화에 대응하는 딥러닝 기반 초미세먼지 중기 예측 모델 개발 (Development of a Deep Learning-based Midterm PM2.5 Prediction Model Adapting to Trend Changes)

  • 민동준;김혜림;이상근
    • 정보처리학회 논문지
    • /
    • 제13권6호
    • /
    • pp.251-259
    • /
    • 2024
  • 초미세먼지, 특히 지름이 2.5㎛ 이하인 PM2.5는 인체 건강과 경제에 큰 피해를 주는 오염물질이다. 본 연구는 대한민국 서울 지역을 중심으로, 2017년부터 2022년까지 자료를 수집하여 PM2.5 데이터 분석 및 데이터 경향성 변화 추이를 분석하고, PM2.5 중기 예측 모델을 개발하는 것을 목표로 한다. 수집, 생산된 대기질 및 기상 데이터, 재분석 데이터, 수치모델 예측 데이터를 바탕으로, 모델을 학습하고 이를 통합한 경향성 변화에도 대응할 수 있는 앙상블 기법을 제안한다. 본 연구에서 제안하는 앙상블 기법은 PM2.5 농도 예측 성능 면에서 기존 모델 대비 미래 D+3~D+6 예측일 F1 Score 기준 평균 2019년 약 42.16%, 2021년 약 58.92%, 2022년 약 34.79% 높은 성능을 보였다. 제안한 모델은 변화하는 환경 조건에도 성능을 유지함으로써 안정적인 예측을 가능하게 하며, 기존 딥러닝 기반 PM2.5 단기 예측보다 먼 예측을 수행하는 중기 예측 모델을 제시한다.

앙상블 러닝 기반 동적 가중치 할당 모델을 통한 보험금 예측 인공지능 연구 (Research on Insurance Claim Prediction Using Ensemble Learning-Based Dynamic Weighted Allocation Model)

  • 최종석
    • 한국정보전자통신기술학회논문지
    • /
    • 제17권4호
    • /
    • pp.221-228
    • /
    • 2024
  • 보험금 예측은 보험사의 리스크 관리와 재무 건전성 유지를 위한 핵심 과제 중 하나이다. 정확한 보험금 예측을 통해 보험사는 적정한 보험료를 책정하고, 예상 외의 손실을 줄이며, 고객 서비스의 질을 향상시킬 수 있다. 본 연구에서는 앙상블 러닝 기법을 적용하여 보험금 예측 모델의 성능을 향상시키고자 한다. 랜덤 포레스트(Random Forest), 그래디언트 부스팅 머신(Gradient Boosting Machine, GBM), XGBoost, Stacking, 그리고 제안한 동적 가중치 할당 모델(Dynamic Weighted Ensemble, DWE) 모델을 사용하여 예측 성능을 비교 분석하였다. 모델의 성능 평가는 평균 절대 오차(MAE), 평균 제곱근 오차(MSE), 결정 계수(R2) 등을 사용하여 수행되었다. 실험 결과, 동적 가중치 할당 모델이 평가 지표에서 가장 우수한 성능을 보였으며, 이는 랜덤 포레스트와 XGBoost, LR, LightGBM의 예측 결과를 결합하여 최적의 예측 성능을 도출한 결과이다. 본 연구는 앙상블 러닝 기법이 보험금 예측의 정확성을 높이는 데 효과적임을 입증하며, 보험업계에서 인공지능 기반 예측 모델의 활용 가능성을 제시한다.

실시간 하천유량 예측을 위한 기상청 AWS 자료의 활용성 평가 (Availability of AWS data from KMA for real-time river flow forecast)

  • 이병주;장기호;최영진
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2011년도 학술발표회
    • /
    • pp.131-131
    • /
    • 2011
  • 기후변화로 인한 기상이변 현상이 빈번하게 발생하면서 홍수와 같은 자연재해의 피해규모가 증가하고 있다. 이를 극복하기 위해 최근에는 구조적 대책뿐만 아니라 홍수예측시스템과 같은 비구조적 대책에도 많은 관심과 연구가 이루어지고 있다. 통상 홍수예측을 위해서는 예측강우의 정확도가 중요하게 부각되지만 중규모 이상의 유역에서는 수 시간의 지체시간 효과로 인해 AWS 실황강우만으로도 어느정도 선행시간에 대해서 하천유량예측이 가능하다고 할 수 있다. 본 연구에서는 기상청 AWS 실황강우를 이용하여 하천유량을 예측할 경우 어느정도 선행시간과 정확도를 확보할 수 있는지에 대해서 분석하고자 한다. 분석을 위한 시단위 강우자료와 기상자료는 각각 AWS와 ASOS 자료를 이용하였다. 또한 하천유량 모의를 위한 강우-유출모형으로는 SURF 모델(Sejong University River Forecast Model)을 이용하였다. 이 모형은 저류함수모형 기반의 연속형 강우-유출모형으로 미래에 대한 유출모의결과의 정확도를 향상시키기 위해 앙상블 칼만필터링 기법을 연계한 모형이다. 그림 1은 충주댐유역에 대해서 2009.7.8~17일(240시간)에 대해서 관측유량 자료동화 전후의 결과를 나타낸 것이다. 현시점을 100, 105, 110, 115시간으로 가정하고 미래기간에 대해서는 관측강우를 0으로 가정했을 때 대략 첨두유량 발생 5시간 전에 예측된 모의유량이 관측유량과 거의 일치함을 확인할 수 있다. 따라서 실황강우와 관측유량 자료동화 기법을 연계할 경우 수 시간의 선행시간에 대해서 유량예측이 가능한 것으로 판단된다.

  • PDF

앙상블 기법을 이용한 가뭄지수 예측 (Drought index forecast using ensemble learning)

  • 정지현;차상훈;김묘정;김광섭;임윤진;이경은
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권5호
    • /
    • pp.1125-1132
    • /
    • 2017
  • 가뭄의 심도와 빈도가 강해지는 상황에서 가뭄예측을 위한 연구가 지속적으로 이루어지고 있으나 가뭄현상의 시간적 변동이 비선형적이며 복잡하여 단일 모형만으로 예측하기에는 한계가 있다. 이 연구에서는 기상가뭄지수인 표준강수지수 (SPI)와 세계기후지수, 날씨 관련 변수 등과 같은 다양한 설명변수들 사이의 관계를 설명할 선행 모형과 가법 모형을 먼저 구축한 후 앙상블 기법 중 확률 기울기 하강 (stochastic gradient descent; SGD) 방법을 이용하여 가중치를 설정하는 결합모형을 구축하였다. 우리나라 14개 지역에 대한 1954년 ~ 2013년 자료를 이용하여 모형을 구축하고 2014년 ~ 2015년 자료를 이용하여 모형의 성능을 비교하였다. 그 결과 14개 지역 중 8개 지역에 대하여 개별 모형에 비해 결합모형의 성능이 좋았으며 가뭄 예측이 개선되었다.

사람 성격 요소에 따른 위치 방문 선호도 예측의 자동화 시스템 (The Automated System for Location Visiting Preference Prediction with Personality Factors)

  • 송하윤;정지현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.935-938
    • /
    • 2021
  • 데이터 베이스에 저장된 사용자의 위치, 성격정보를 자동으로 받아서 머신러닝으로 회귀분석하여 방문 장소에 대한 선호도를 예측한다. 사람의 성격 요소로는 BFF 와 다른 기본 요소들을 사용하였다. 이를 위하여 자동화된 시스템을 구성하였고 위치 방문 선호도를 예측하기 위한 머신러닝 기법으로는 앙상블기법을 사용하였다. 예측 결과는 장소 카테고리별로 방문 선호도가 나타나고 이를 사용자 별로 나누어 저장할 예정이다. 데이터의 양이 많아지면서 나타나는 문제들을 해결하여 향후 연구에 도움이 될 것이다.

앙상블 기법을 이용한 안동댐 유입량 예측 (Prediction of Andong Reservoir Inflow Using Ensemble Technique)

  • 강민석;유명수;이재응
    • 대한토목학회논문집
    • /
    • 제34권3호
    • /
    • pp.795-804
    • /
    • 2014
  • 본 연구에서는 앙상블유량예측기법과 SWAT 모형을 이용하여 안동댐의 2011년 7월~9월의 각 댐유입량 예측을 실행하였으며 월별 및 순별 분석을 수행하였다. 또한 정확한 분석을 위해 기상청의 월별 및 순별 강우예보자료를 이용한 가중값 부여방법을 사용하였다. 분석 결과 기상청에서 발표한 강우 예측 구간이 실제 강우 구간과 동일하면 PDF-Ratio 가중값 부여방법이 가장 높은 정확성을 보이며, 과거 강우발생 구간 통계 중 높은 구간이 실제 강우 구간과 동일하다면 수정 PDF-Ratio 가중값 부여방법이 가장 높은 정확성을 보였다. 이는 기상청 예측이 맞지 않은 경우에도 과거 강우발생 구간의 빈도에 따라 정확성을 높일 수 있을 것으로 판단된다. 반대로 기상청의 예측이 실제와 다르면서 과거 강우발생 구간 통계에서도 낮은 구간의 강우가 발생하면 균일 가중값 부여방법의 정확성이 가장 높게 분석되었다.