• Title/Summary/Keyword: 앙상블 예측

검색결과 323건 처리시간 0.028초

데이터융합, 앙상블과 클러스터링을 이용한 교통사고 심각도 분류분석 (Data Fusion, Ensemble and Clustering for the Severity Classification of Road Traffic Accident in Korea)

  • 손소영;이성호
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 2000년도 춘계공동학술대회 논문집
    • /
    • pp.597-600
    • /
    • 2000
  • 계속적인 증가 추세를 보이고 있는 교통량으로 인해 환경 문제뿐 아니라 교통사고로 인한 사상자 및 물적피해가 상당량으로 집계되고 있다. 본 논문에서는 데이터융합 및 앙상블 클러스터링방법을 이용한 교통사고 심각도 분류분석방법을 제안함으로서 교통사고예방에 기여하고자 한다. 이를 위하여 신경망과 Decision-Tree기법을 이용하여 얻은 물적피해와 신체상해가 발생할 확률을 융합하는 전형적인 데이터 융합기법(템스터-쉐퍼, 베이지안 방법, 로지스틱융합방법)을 사용하였다. 또한, 분류정확도를 향상시키고자 Bootstrap 재추출 방법을 이용해 얻어진 여러 개의 분류예측 결과 중 다수의 분류결과를 선택하는 앙상블 (arcing, bagging)기법을 적용하였다. 더불어, 본 연구에서는 클러스터링 방법을 제시하고, 이 방법이 기존의 융합기법, 앙상블기법과 비교한 결과, 분류예측면에서 정확도가 향상됨을 보였다.

  • PDF

앙상블 SVM을 이용한 동적 웹 정보 예측 시스템 (Dynamic Web Information Predictive System Using Ensemble Support Vector Machine)

  • 박창희;윤경배
    • 정보처리학회논문지B
    • /
    • 제11B권4호
    • /
    • pp.465-470
    • /
    • 2004
  • 기존의 웹 정보 예측 시스템은 예측에 필요한 정보를 얻기 위하여 사용자 프로파일과 사용자로부터의 명시적 피드백 정보를 필요로 하는 단점이 존재한다. 본 논문에서는 이러한 단점을 극복하고자 웹 사이트에 접속한 고객의 행동을 나타내는 클릭 스트림 데이터와 이를 기반으로 한 사용자의 암시적 피드백 정보를 이용하여 각 사용자가 가장 필요로 하는 웹 정보를 예측한다. 이를 이용하여 관련 정보를 제공할 수 있는 앙상블 SVM을 이용한 동적 웹 정보 예측 시스템을 설계하고 구현하며, 기존의 웹 정보 예측 시스템과 성능 비교를 수행한 결과, 제안된 방법의 우수함이 입증되었다.

앙상블모형을 이용한 공백기술예측 (Vacant Technology Forecasting using Ensemble Model)

  • 전성해
    • 한국지능시스템학회논문지
    • /
    • 제21권3호
    • /
    • pp.341-346
    • /
    • 2011
  • 공백기술예측은 기술경영 분야에서 중요하게 다루어지는 주제이다. 다양한 분야에서 현재까지의 기술개발결과를 분석하여 상대적으로 연구개발이 이루어지지 못한 분야를 찾아내어 개발하는 것은 국가와 기업의 발전에 중요한 영향을 미친다. 현재 특허는 기술개발결과에 대한 가장 객관적인 데이터 중 하나이다. 본 논문에서는 특허데이터를 이용하여 공백기술을 정량적으로 예측할 수 있는 방법에 대하여 연구한다. 하나의 정량적 기술예측모형이 완벽하다는 보장을 할 수 없기 때문에 본 연구에서는 여러 가지 모형들의 결과를 결합하여 예측하는 앙상블모형을 제안한다. 통계적 분석기법과 기계학습 알고리즘을 결합하여 보다 객관적이고 정확한 공백기술예측모형을 구축한다. 제안방법의 객관적인 성능평가를 위하여 각 기술분야에 대하여 최초 특허가 이루어진 시점부터 최근까지 출원, 등록된 특허데이터를 이용한다.

지천유입이 있는 대하천에서 수질예측을 위한 인공신경망모델의 개발 (Development of Artificial Neural Network Model for Prediction of Water Quality Parameters in Large Rivers with Tributary Inflow)

  • 서일원;윤세훈
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.141-141
    • /
    • 2017
  • 본 연구에서는 대하천의 8개의 수질인자(수온, 용존산소, 수소이온농도, 전기전도도, 총질소, 총인, 탁도, 클로로필-a)를 예측할 수 있는 인공신경망모델을 개발하였다. 인공신경망모델(ANN)은 수질데이터가 가지는 불확실성 및 비정상성, 복잡한 상호관련성에 효과적으로 대응할 수 있는 데이터기반 모델이다. 데이터기반 모델의 특성상 예측정확도를 높이기 위해서 양질의 입력데이터를 구성하는 것이 가장 중요하다. 때문에 각각의 수질인자뿐만 아니라 기상학적 인자 또한 예측을 위한 입력자료로 사용하였으며, 요인분석 및 층화표층추출법을 적용하여 입력데이터를 구성하였고 앙상블기법을 이용하여 추가적으로 예측의 정확도를 향상시켰다. 개발된 모델을 이용하여 지천유입이 있는 북한강의 수질자료를 예측한 결과 탁도를 제외한 7개의 수질인자 모두 0.85 이상의 설명력을 보였으며, 실측값과 예보값을 비교해본 결과 평균적으로 10% 미만의 에러값을 나타냈다. 요인분석을 통하여 연관성있는 인자를 입력인자로 추가한 경우 향상된 결과값을 보였주었으며, 앙상블기법을 적용한 결과 정확도 면에서 큰 향상을 보여주었다.

  • PDF

CMIP6 기후변화 자료를 이용한 국내 미래 극한강우의 예측 (Future projections of extreme precipitation by using CMIP6 database at finer scales over South Korea)

  • 김종호;도이반만
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.368-368
    • /
    • 2021
  • 기후 변화로 인한 극한사상의 크기와 빈도 변화를 예측하는 것은 수공 인프라 설계에 있어 주된 관심사 중 하나이다. 보통 극한사상에 대한 강도, 빈도, 지속시간에 대한 정보가 필요하며, 이는 일반적으로 IDF(Intensity-Duration-Frequency) 곡선으로부터 추출된다. 최근 CMIP(Coupled Model Intercomparison Project) 6단계에서 새로운 이산화탄소 배출 시나리오와 업데이트된 기후모델을 이용하여 미래의 기후에 대한 예측 시계열을 발표했으므로, 미래 기후 변화 시나리오를 기반으로 IDF 곡선을 새로 추정하고 미래 기간의 변화를 평가할 필요가 있다. 본 연구에서는 한국의 40개 지역에 대해 일단위 자료를 시단위로 축소(downscaling)한 후, 확률론적 일기생성기(stochastic weather generator)를 이용하여 30년 시단위 시계열을 100개의 앙상블로 생성하였다. 생성된 시계열로부터 연최대강수량 시계열을 재구성하여 GEV 분포와 gumbel 분포에 적용하였다. 적합도 검정(Anderson-Darling(AD) 검정 및 Kolmogorov-Smirnov(KS) 검정)을 수행하였으며, 과거 자료를 기반으로 생성된 IDF 곡선과 비교 검증하였다. CMIP5의 기후변화 자료를 사용한 결과와 CMIP6 기후변화의 결과를 비교하였으며, 본 연구의 주요 결과는 다음과 같다. (1) 향후 강우 강도는 증가할 것이며 강우 강도의 증가는 말기에 현저하게 관찰될 것이다. (2) 시간별 강우 강도의 미래 변화가 일단위 강우 강도보다 더 크다. (3) 강우 강도의 불확실성을 정량화하기 위해 앙상블을 사용해야 한다. (4) 강우 강도의 미래 변화에 대한 공간적인 경향이 확인된다. 시단위 시계열 앙상블을 생성하여 추정된 IDF 곡선에 대한 정보는 기후 변화의 영향을 평가하고 적절한 적응 및 대응 전략을 개발하는 데 도움이 될 것이다.

  • PDF

용수공급을 위한 댐 방류량 결정에서의 앙상블 유량 예측 효과 분석 (Analysis of ensemble streamflow prediction effect on deriving dam releases for water supply)

  • 김연주;김기주;김영오
    • 한국수자원학회논문집
    • /
    • 제56권12호
    • /
    • pp.969-980
    • /
    • 2023
  • 2000년대 이후 우리나라에 도입된 앙상블 유량 예측은 수문 예측 현업에서 성과를 보였음에도 불구하고 수자원 시스템 관리에서는 적극적으로 활용되지 못하고 있다. 따라서 본 연구에서는 용수공급을 위한 수자원 관리 측면에서 앙상블 유량 예측의 효용성을 보이고자 댐 실무자들을 위한 간단한 가상 예제를 만들고, 이를 확장하며 실제 대한민국 다목적댐에 적용하였다. 가상 예제에서는 앙상블 유량 예측의 평균은 같지만 표준편차가 다를 때, 댐 운영 비용이 상이함을 확인하였다. 그리고 이를 대한민국 다목적댐에 적용하기 위해 동일한 평균을 가지지만 표준편차가 평균과 동일한 유형W와 표준편차가 평균의 10배인 유형 P를 가정하여 용량 대비 연유입량 비율에 따라 소양강댐(CIR = 1.345)과 충주댐(CIR = 0.563)에 표본 추계학적 동적계획법으로 최적방류량을 도출하였다. 그리고 도출된 최적방류량으로 2020년부 2022년까지 모의 운영을 진행하였다. 그 결과, 충주댐에서는 표준편차가 적은 유형W에서 상대적으로 공격적인 최적방류량이 도출되었고, 모의 운영 결과 또한 양호함을 보였다. 소양강댐에서도 최적방류량에서 충주댐과 같은 결과를 보였지만, 모의 운영에서는 유형W와 P의 차이가 없었다. 결과적으로 동일한 평균을 가지더라도 앙상블 유량 예측의 표준편차에 따라 다른 최적방류량과 모의 운영 결과가 도출되었고, 특히 용량 대비 연유입량이 작을수록 이러한 불확실성에 더욱 민감하게 반응함을 보였다. 본 내용을 바탕으로 현재 단일 대푯값만을 사용하여 댐 운영을 하는 수자원 관리에 개선을 기대한다.

개선된 배깅 앙상블을 활용한 기업부도예측 (Bankruptcy prediction using an improved bagging ensemble)

  • 민성환
    • 지능정보연구
    • /
    • 제20권4호
    • /
    • pp.121-139
    • /
    • 2014
  • 기업의 부도 예측은 재무 및 회계 분야에서 매우 중요한 연구 주제이다. 기업의 부도로 인해 발생하는 비용이 매우 크기 때문에 부도 예측의 정확성은 금융기관으로서는 매우 중요한 일이다. 최근에는 여러 개의 모형을 결합하는 앙상블 모형을 부도 예측에 적용해 보려는 연구가 큰 관심을 끌고 있다. 앙상블 모형은 개별 모형보다 더 좋은 성과를 내기 위해 여러 개의 분류기를 결합하는 것이다. 이와 같은 앙상블 분류기는 분류기의 일반화 성능을 개선하는 데 매우 유용한 것으로 알려져 있다. 본 논문은 부도 예측 모형의 성과 개선에 관한 연구이다. 이를 위해 사례 선택(Instance Selection)을 활용한 배깅(Bagging) 모형을 제안하였다. 사례 선택은 원 데이터에서 가장 대표성 있고 관련성 높은 데이터를 선택하고 예측 모형에 악영향을 줄 수 있는 불필요한 데이터를 제거하는 것으로 이를 통해 예측 성과 개선도 기대할 수 있다. 배깅은 학습데이터에 변화를 줌으로써 기저 분류기들을 다양화시키는 앙상블 기법으로 단순하면서도 성과가 매우 좋은 것으로 알려져 있다. 사례 선택과 배깅은 각각 모형의 성과를 개선시킬 수 있는 잠재력이 있지만 이들 두 기법의 결합에 관한 연구는 아직까지 없는 것이 현실이다. 본 연구에서는 부도 예측 모형의 성과를 개선하기 위해 사례 선택과 배깅을 연결하는 새로운 모형을 제안하였다. 최적의 사례 선택을 위해 유전자 알고리즘이 사용되었으며, 이를 통해 최적의 사례 선택 조합을 찾고 이 결과를 배깅 앙상블 모형에 전달하여 새로운 형태의 배깅 앙상블 모형을 구성하게 된다. 본 연구에서 제안한 새로운 앙상블 모형의 성과를 검증하기 위해 ROC 커브, AUC, 예측정확도 등과 같은 성과지표를 사용해 다양한 모형과 비교 분석해 보았다. 실제 기업데이터를 사용해 실험한 결과 본 논문에서 제안한 새로운 형태의 모형이 가장 좋은 성과를 보임을 알 수 있었다.

앙상블 학습을 이용한 적조 발생 예측의 성능향상 (Enhancing of Red Tide Blooms Prediction using Ensemble Train)

  • 박선;정민아;이성로
    • 대한전자공학회논문지SP
    • /
    • 제49권1호
    • /
    • pp.41-48
    • /
    • 2012
  • 적조란 유해조류의 일시적인 대 번식으로 바다를 적색으로 변화시키며 양식장의 어패류를 집단 폐사 시킬 뿐 아니라 연안환경 및 바다 생태계에 악영향을 미치는 자연 현상이다. 적조에 의한 양식어업의 피해는 매년 발생하고 있으며 매년 적조방제에 많은 비용을 소비하고 있다. 이 때문에 적조 발생을 미리 예측할 수 있으면 적조에 대한 피해 및 방재 비용을 최소화 시킬수 있다. 본 논문은 앙상블 학습은 이용한 적조발생 예측 방법을 제안한다. 제안방법은 앙상블 학습의 bagging과 boosting 방법을 이용하여서 적조를 예측의 성능을 향상시킨다. 실험결과 제안방법은 단일 분류기에 비하여서 더 좋은 적조 발생 예측 성능을 보였다.

Path Loss Prediction Using an Ensemble Learning Approach

  • Beom Kwon;Eonsu Noh
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권2호
    • /
    • pp.1-12
    • /
    • 2024
  • 경로 손실(Path Loss)을 예측하는 것은 셀룰러 네트워크(Cellular Network)에서 기지국(Base Station) 의 설치 위치 선정 등 무선망 설계에 중요한 요인 중 하나다. 기존에는 기지국의 최적 설치 위치를 결정하기 위해 수많은 현장 테스트(Field Tests)를 통해 경로 손실 값을 측정했다. 따라서 측정에 많은 시간이 소요된다는 단점이 있었다. 이러한 문제를 해결하기 위해 본 연구에서는 머신러닝(Machine Learning, ML) 기반의 경로 손실 예측 방법을 제안한다. 특히, 경로 손실 예측 성능을 향상시키기 위해서 앙상블 학습(Ensemble Learning) 접근법을 적용하였다. 부트스트랩 데이터 세트(Bootstrap Dataset)을 활용하여 서로 다른 하이퍼파라미터(Hyperparameter) 구성을 갖는 모델들을 얻고, 이 모델들을 앙상블하여 최종 모델을 구축했다. 인터넷상에 공개된 경로 손실 데이터 세트를 활용하여 제안하는 앙상블 기반 경로 손실 예측 방법과 다양한 ML 기반 방법들의 성능을 평가 및 비교했다. 실험 결과, 제안하는 방법이 기존 방법들보다 우수한 성능을 달성하였으며, 경로 손실 값을 가장 정확하게 예측할 수 있다는 것을 입증하였다.

강우앙상블 예측자료의 공간적 특성 및 적용성 평가 (Appraisal of spatial characteristics and applicability of the predicted ensemble rainfall data)

  • 이상협;성연정;김경탁;정영훈
    • 한국수자원학회논문집
    • /
    • 제53권11호
    • /
    • pp.1025-1037
    • /
    • 2020
  • 본 연구는 호우경보에 사용되는 Limited area ENsemble prediction System (LENS) 강우예측자료에 대한 공간적 특성 및 적용성을 평가하였다. LENS는 13개의 강우앙상블 멤버를 가지고 있어 호우경보를 발령하는데 있어 확률적인 방법을 활용할 수 있다. 그러나 LENS의 자료의 접근성은 매우 낮아 강우예측자료의 적용성에 대한 연구가 미흡한 실정이다. 본 연구에서는 행정구역별로 활용되는 호우경보 시스템에 따라 하나의 지점값과 면적평균값을 관측값과 비교하여 평가지수를 산정하였다. 또한, LENS의 발령시간에 따르는 각 앙상블 멤버들의 정확성을 평가하였다. LENS는 멤버별로 과대 혹은 과소 예측의 불확실성을 보여줬다. 면적단위의 예측이 지점단위의 예측보다 더 높은 예측성을 보여주었다. 또한, 다가오는 72시간의 강우를 예측하는 LENS 자료는 수재해의 영향성이 있을 수 있는 강우 사상에 대하여 예측성능이 좋은 것으로 평가되었다. 추후 국지강우앙상블시스템(LENS) 자료는 행정구역 또는 유역면적 단위의 홍수 대비에 기초자료로 활용될 수 있을 것으로 기대된다.