• Title/Summary/Keyword: 앙상블 기법

Search Result 298, Processing Time 0.029 seconds

Cross-Validated Ensemble Methods in Natural Language Inference (자연어 추론에서의 교차 검증 앙상블 기법)

  • Yang, Kisu;Whang, Taesun;Oh, Dongsuk;Park, Chanjun;Lim, Heuiseok
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.8-11
    • /
    • 2019
  • 앙상블 기법은 여러 모델을 종합하여 최종 판단을 산출하는 기계 학습 기법으로서 딥러닝 모델의 성능 향상을 보장한다. 하지만 대부분의 기법은 앙상블만을 위한 추가적인 모델 또는 별도의 연산을 요구한다. 이에 우리는 앙상블 기법을 교차 검증 방법과 결합하여 앙상블 연산을 위한 비용을 줄이며 일반화 성능을 높이는 교차 검증 앙상블 기법을 제안한다. 본 기법의 효과를 입증하기 위해 MRPC, RTE 데이터셋과 BiLSTM, CNN, BERT 모델을 이용하여 기존 앙상블 기법보다 향상된 성능을 보인다. 추가로 교차 검증에서 비롯한 일반화 원리와 교차 검증 변수에 따른 성능 변화에 대하여 논의한다.

  • PDF

A Study on the Influence of Prediction and Scenario Periods for the Reliability of Ensemble Streamflow Prediction (예측 및 시나리오 기간이 앙상블 유량예측의 신뢰도에 미치는 영향 검토)

  • Kang, Tae-Ho;Kim, Chung-Soo;Kim, Nam-Won
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2010.05a
    • /
    • pp.1279-1283
    • /
    • 2010
  • 미국의 경우 1994년 발생한 대홍수(Great Flood)에 대해 사건조사를 수행하면서 예측에 포함되는 불확실성 정도를 제공하지 못하는 확정적 예측의 위험성 및 확률유량예측에 대한 필요성이 부각되었으며, 앙상블 유량예측(Ensemble Streamflow Prediction, ESP) 기법을 활용한 확률유량예측 방안에 대해 지속적으로 연구가 수행되고 있다. 국내에서도 확률예측에 대한 필요성이 인식되면서 기존 국외 연구사례를 토대로 국내 환경에 적용 가능한 방안에 대한 연구가 진행되었으며, 중장기 앙상블 유량예측의 경우 현업에서 다양한 형태로 활용되고 있다. 앙상블 유량예측의 기본이론은 예측시점의 초기조건 하에서 예측기간에 발생 가능한 기상 앙상블 시나리오를 수문모형의 입력자료로 사용하여 불확실성 범위를 설명 가능한 유량 앙상블을 모의하는 기법이다. 이러한 이론적 단순함 때문에 쉽게 현업의 유량예측 시스템 내에서 사용할 수 있다는 장점이 있으나, 동시에 기법적 특성으로 인하여 유량예측의 신뢰도가 현업에서 활용되기 어려울 정도로 낮아지는 관계로, 이러한 한계점을 극복하기 위해 그동안 기상자료 및 수문모형으로 인한 불확실성 저감에 대한 연구가 수행되었다. 하지만 예측 및 시나리오 기간의 잘못된 설정으로 기존의 불확실성 저감을 위한 연구의 적용에도 불구하고 앙상블 유량예측의 신뢰도가 오히려 낮아질 수 있으므로, 본 연구는 시나리오 기간에 따른 오차의 양상과 예측기간의 증가에 따른 초기조건의 영향을 분석하여 앙상블 유량예측의 기법적 특성 하에서 신뢰도 높은 예측을 기대할 수 있는 예측 및 시나리오 기간을 제안하였다.

  • PDF

Attention-Based Ensemble for Mitigating Side Effects of Data Imbalance Method (데이터 불균형 기법의 부작용 완화를 위한 어텐션 기반 앙상블)

  • Yo-Han Park;Yong-Seok Choi;Wencke Liermann;Kong Joo Lee
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.546-551
    • /
    • 2023
  • 일반적으로 딥러닝 모델은 모든 라벨에 데이터 수가 균형을 이룰 때 가장 좋은 성능을 보인다. 그러나 현실에서는 특정라벨에 대한 데이터가 부족한 경우가 많으며 이로 인해 불균형 데이터 문제가 발생한다. 이에 대한 해결책으로 오버샘플링과 가중치 손실과 같은 데이터 불균형 기법이 연구되었지만 이러한 기법들은 데이터가 적은 라벨의 성능을 개선하는 동시에 데이터가 많은 라벨의 성능을 저하시키는 부작용을 가지고 있다. 본 논문에서는 이 문제를 완화시키고자 어텐션 기반의 앙상블 기법을 제안한다. 어텐션 기반의 앙상블은 데이터 불균형 기법을 적용한 모델과 적용하지 않은 모델의 출력 값을 가중 평균하여 최종 예측을 수행한다. 이때 가중치는 어텐션 메커니즘을 통해 동적으로 조절된다. 그로므로 어텐션 기반의 앙상블 모델은 입력 데이터 특성에 따라 가중치를 조절할 수가 있다. 실험은 에세이 자동 평가 데이터를 대상으로 수행하였다. 실험 결과로는 제안한 모델이 데이터 불균형 기법의 부작용을 완화하고 성능이 개선되었다.

  • PDF

Uncertainty assessment of ensemble streamflow prediction method (앙상블 유량예측기법의 불확실성 평가)

  • Kim, Seon-Ho;Kang, Shin-Uk;Bae, Deg-Hyo
    • Journal of Korea Water Resources Association
    • /
    • v.51 no.6
    • /
    • pp.523-533
    • /
    • 2018
  • The objective of this study is to analyze uncertainties of ensemble-based streamflow prediction method for model parameters and input data. ESP (Ensemble Streamflow Prediction) and BAYES-ESP (Bayesian-ESP) based on ABCD rainfall-runoff model were selected as streamflow prediction method. GLUE (Generalized Likelihood Uncertainty Estimation) was applied for the analysis of parameter uncertainty. The analysis of input uncertainty was performed according to the duration of meteorological scenarios for ESP. The result showed that parameter uncertainty was much more significant than input uncertainty for the ensemble-based streamflow prediction. It also indicated that the duration of observed meteorological data was appropriate to using more than 20 years. And the BAYES-ESP was effective to reduce uncertainty of ESP method. It is concluded that this analysis is meaningful for elaborating characteristics of ESP method and error factors of ensemble-based streamflow prediction method.

Ensemble Classification Method for Efficient Medical Diagnostic (효율적인 의료진단을 위한 앙상블 분류 기법)

  • Jung, Yong-Gyu;Heo, Go-Eun
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.10 no.3
    • /
    • pp.97-102
    • /
    • 2010
  • The purpose of medical data mining for efficient algorithms and techniques throughout the various diseases is to increase the reliability of estimates to classify. Previous studies, an algorithm based on a single model, and even the existence of the model to better predict the classification accuracy of multi-model ensemble-based research techniques are being applied. In this paper, the higher the medical data to predict the reliability of the existing scope of the ensemble technique applied to the I-ENSEMBLE offers. Data for the diagnosis of hypothyroidism is the result of applying the experimental technique, a representative ensemble Bagging, Boosting, Stacking technique significantly improved accuracy compared to all existing, respectively. In addition, compared to traditional single-model techniques and ensemble techniques Multi modeling when applied to represent the effects were more pronounced.

Probabilistic Runoff Analysis using Ensemble Technoque with Localization Method (앙상블 기반 지역화 기법을 이용한 확률론적 유출량 분석)

  • Lee, Han-Yong;Jang, Suk-Hwan;Lee, Jae-Kyoung;Jo, Jun-Won
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2019.05a
    • /
    • pp.207-207
    • /
    • 2019
  • 최근 우리나라는 지역 특성 및 기후변화의 영향으로 인해 수문학적 요소의 변동성이 커지고 수자원의 지속적인 관리에 있어 유출량은 중요한 문제로 여겨지고 있다. 특히 일부 소하천 또는 접경지역과 같은 미계측유역은 수문학적 요소에 대한 자료가 부족하고 수문모형의 초기치 설정과 과거 유출량 자료를 통하여 최적화한 매개변수를 결정해야하므로 장기유출분석이 어렵다. 본 연구의 적용유역으로 미계측유역인 임진강상류 유역에 대한 유출량 추정을 위해 계측 유역의 자료를 활용하여 모형의 매개변수 등을 추정하는 지역화 기법인 다중선형회귀분석과 공간근접분석을 활용하여 유출량을 산정 및 검증하였다. 또한, 확률론적 예측이 가능한 앙상블 기법 적용을 통한 유출량 예측을 하였고, 이를 예측 정확성 평가지표를 통해 효율성 검토를 수행하여 미계측유역의 유출량에 대해 확률론적 예측을 수행하였다. 대표적 지역화 기법의 적용성을 검토한 결과, 계측유역을 통해 다중선형회귀분석과 공간근접분석을 abcd 모형에 적용하였다. 모의유출량을 산정하고 실측 유출량과 비교 분석 결과 모의정확성이 높게 분석되었다. 이와 같은 검증 결과를 토대로 미계측유역의 유출량을 추정하였다. 또한, 지역화 기법을 앙상블 기법에 적용하여 확률론적 유출량 예측의 효율성을 검토하였다. 적용유역과 같은 지류를 포함하고 있는 임진강하류 유역을 대상으로 수행하였다. 검증기간(2013년~2017년) 동안의 월 예측 유출량 앙상블 생성을 위해 과거 강우량와 증발량(1988년~2012년) 자료를 사용하였으며, 지역화 기법을 적용한 abcd 모형을 이용하였다. 예측 유출량의 정확성 평가를 실시하였으며, 정확성이 비교적 높게 분석되었다. 이와 같은 결과를 토대로 미계측유역의 확률론적 유출량을 예측하였다. 따라서, 대표적 지역화 기법을 앙상블 기법에 적용하여 확률론적 유출량을 예측할 경우 보다 정확한 유출량 예측이 가능하다.

  • PDF

Long-term Streamflow Prediction for Integrated Real-time Water Management System (통합실시간 물관리 운영시스템을 위한 장기유량예측)

  • Kang Boosik;Rieu Seung Yup;Ko Ick-Hwan
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2005.05b
    • /
    • pp.1450-1454
    • /
    • 2005
  • 수자원관리에 있어서 미래시구간에 대한 유량예측은 수자원시스템운영자에게 있어서 의사결정에 결정적인 영향을 미치는 가장 중요한 요소 중의 하나이다. 효율적 물배분이나 발전 등의 이수활동을 위해서 최소 월단위 이상의 장기유량예측이 필요하며, 이를 위해서는 강우예측이 선행되어야 하는데, 본 연구에서는 통합 실시간 물관리 운영시스템을 위한 중장기 유량예측을 목표로 방법론을 제시하고자 한다. 중장기 유량예측을 수행하는 대표적인 방법 중의 하나는 앙상블 유량예측(ESP; Ensemble Streamflow Prediction) 기법이다. ESP란 현재의 유역상태를 초기조건으로 사용하고 과거의 온도나 강수 등의 시계열앙상블을 모형입력으로 이용해서 강우-유출모형을 통하여 유출량을 예측하는 기법이다. ESP는 결국 현재의 유역상태와 유역에서의 과거강우관측기록, 미래강우예측에 대한 정보를 조합하여 그에 따른 유출앙상블을 생산해 내게 된다. 유출앙상블은 각 앙상블 트레이스가 갖게 되는 가중치에 따라 확률분포를 달리 갖게 되고 경우에 따라서는 유량으로부터 2차적으로 유도되는 변수들의 확률분포로 전이되기도 한다. 기존의 ESP 이론은 미국 NWS의 범주형 확률예보를 근간으로 하고 있어, 이를 국내 환경에 그대로 적용시키기에 어려움이 있어 왔다. 따라서 본 연구에서는 국내 기상청의 월간 강수전망을 이용하고, 이러한 정보의 특성에 맞는 ESP기법을 제시하였다. 더 나아가 중장기 수자원운영을 위한 일단위 월강수시나리오 구성을 위해서 수치예보와 월강수전망을 조합하여 ESP를 사용하는 기법을 제시하였다.

  • PDF

Comparative assessment of ensemble kalman filtering and particle filtering for lumped hydrologic modeling (집중형 수문모형에 대한 앙상블 칼만필터와 파티클 필터의 수문자료동화 특성 비교)

  • Garim Lee;Bomi Kim;Songhee Lee;Seong Jin Noh
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2023.05a
    • /
    • pp.233-233
    • /
    • 2023
  • 효율적인 수자원 관리에 필수적인 요소 중 하나는 유역 유출의 정확한 예측이다. 동일한 유역이라 할지라도 과거 기후조건에 대해 매개변수나 모형구조가 최적화된 수문모형은 현재나 미래 기후에 대해 최적이라 할수 없으며, 이에 따라 유역 유출 해석의 불확실성 또한 증가하고 있다. 수문자료동화는 모형의 입력 자료에 따른 불확실성을 줄이고 예측정확도를 향상 시킬 수 있는 방법으로, 수문모형의 상태량이나 매개변수를 업데이트하여 모형 초기 조건의 가능성 높은 추정치를 생성하는 기법이다. 본 연구에서는 국내 댐 상류 유역에 대해 집중형 수문모형과 순차자료동화 기법의 연계 패키지인 airGRdatassim 모형을 적용하여, 앙상블 칼만 필터와 파티클 필터 기법의 수문자료동화 특성을 비교 분석하고, 자료동화와 관련된 하이퍼-매개변수의 불확실성이 수문모의 성능에 미치는 영향을 분석하였다. 자료동화 적용 결과, 두 자료동화 기법 중 파티클 필터에 의한 모의성능이 높았으며 기상강제력 노이즈의 범위, 갱신 대상 상태량 설정, 앙상블 설정 등 수문자료동화의 설정과 관련된 하이퍼 매개변수의 불확실성은 두 기법별 뚜렷한 차이를 보였다. 또한, 본 연구에서는 일단위에서 시단위로 확장한 유량 예측 자료동화의 시험 모의결과 및 앙상블 수문동화기법의 도전과제에 대해서도 논의한다.

  • PDF

Development of data assimilation technique using a surrogate model (대체모형을 이용한 자료동화기법 개발)

  • Kim, Jongho;Tran, Vinh Ngoc
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2020.06a
    • /
    • pp.381-381
    • /
    • 2020
  • 자료동화(Data Assimilation) 기법은 실시간 수문학적 예측에 있어 정확도 향상을 위해 필수적인 과정이다. 가장 대중적으로 사용되는 기법들 중 하나가 모델 상태변수와 매개변수를 동시에 업데이트할 수 있는 이중 앙상블 칼만 필터(Dual Ensemble Kalman Filter)이다. 이 방법은 정확도 개선 및 적용의 용이성 때문에 많은 연구 분야에서 사용되어져 왔지만, 앙상블을 생성하는 과정에서 상당시간이 소요되는 단점이 존재한다. 본 연구에서는 상태변수와 매개변수를 동시에 업데이트 하면서 홍수 예측의 정확성을 보장할 뿐만 아니라, 앙상블 생성에 있어 계산 효율을 크게 향상시킬 수 있는 기법을 제안한다. Polynomial Chaos Expansion(PCE) 기법을 사용하여 앙상블 칼만 필터를 모방(mimic)할 수 있는 새로운 대체필터(Surrogate Filter)를 개발하는 것을 목표로 한다. 구체적으로 대체필터를 구성하기 위한 다양한 필터를 설계하였다. 첫째 시간에 대해서 PCE가 변화하지 않는 '불변 필터'(즉, 전체 예측기간에 대해 하나의 필터를 사용하여 자료동화할 수 있는 대체필터)와, 매 시간마다 PCE가 변화하는 '시변 필터'(즉, 예측하는 매 시간마다 새로운 필터를 생성해야 하는 대체필터)를 설계하여 적용성, 정확성, 예측성 등을 비교하였다. 또한, PCE의 하이퍼 매개변수를 최적화하기 위한 최적의 프레임 워크가 제안되어, 대체필터를 구축하는 데 효율을 높이고 PCE의 과적합(overfitting) 현상을 피할 수 있도록 하였다. 본 연구에서 제안된 기법은 기존 단일 및 이중 앙상블 칼만 필터(EnKF)의 결과와 비교 검증하였으며, 그 결과는 다음과 같다. (1) 대체필터의 대부분은 원래 EnKF와 비슷한 정도의 불확실성을 설명할 수 있음; (2) 모든 대체 필터는 선행시간이 짧은 경우의 예측에 있어 우수한 결과를 제공하며, 시변 필터가 불변 필터보다 더 정확한 예측 결과를 제공함; (3) 대체필터는 원래 앙상블 칼만필터보다 최대 500배 빠른 속도로 성능을 향상시킬 수 있음. 제안된 대체필터는 자료동화를 수행하는 기존필터와 비슷한 정도의 정확성, 매우 향상된 효율성을 보장함을 확인할 수 있었다.

  • PDF

Data Fusion, Ensemble and Clustering for the Severity Classification of Road Traffic Accident in Korea (데이터융합, 앙상블과 클러스터링을 이용한 교통사고 심각도 분류분석)

  • 손소영;이성호
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 2000.04a
    • /
    • pp.597-600
    • /
    • 2000
  • 계속적인 증가 추세를 보이고 있는 교통량으로 인해 환경 문제뿐 아니라 교통사고로 인한 사상자 및 물적피해가 상당량으로 집계되고 있다. 본 논문에서는 데이터융합 및 앙상블 클러스터링방법을 이용한 교통사고 심각도 분류분석방법을 제안함으로서 교통사고예방에 기여하고자 한다. 이를 위하여 신경망과 Decision-Tree기법을 이용하여 얻은 물적피해와 신체상해가 발생할 확률을 융합하는 전형적인 데이터 융합기법(템스터-쉐퍼, 베이지안 방법, 로지스틱융합방법)을 사용하였다. 또한, 분류정확도를 향상시키고자 Bootstrap 재추출 방법을 이용해 얻어진 여러 개의 분류예측 결과 중 다수의 분류결과를 선택하는 앙상블 (arcing, bagging)기법을 적용하였다. 더불어, 본 연구에서는 클러스터링 방법을 제시하고, 이 방법이 기존의 융합기법, 앙상블기법과 비교한 결과, 분류예측면에서 정확도가 향상됨을 보였다.

  • PDF