• 제목/요약/키워드: 앙상블기법

검색결과 299건 처리시간 0.034초

자연어 추론에서의 교차 검증 앙상블 기법 (Cross-Validated Ensemble Methods in Natural Language Inference)

  • 양기수;황태선;오동석;박찬준;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.8-11
    • /
    • 2019
  • 앙상블 기법은 여러 모델을 종합하여 최종 판단을 산출하는 기계 학습 기법으로서 딥러닝 모델의 성능 향상을 보장한다. 하지만 대부분의 기법은 앙상블만을 위한 추가적인 모델 또는 별도의 연산을 요구한다. 이에 우리는 앙상블 기법을 교차 검증 방법과 결합하여 앙상블 연산을 위한 비용을 줄이며 일반화 성능을 높이는 교차 검증 앙상블 기법을 제안한다. 본 기법의 효과를 입증하기 위해 MRPC, RTE 데이터셋과 BiLSTM, CNN, BERT 모델을 이용하여 기존 앙상블 기법보다 향상된 성능을 보인다. 추가로 교차 검증에서 비롯한 일반화 원리와 교차 검증 변수에 따른 성능 변화에 대하여 논의한다.

  • PDF

예측 및 시나리오 기간이 앙상블 유량예측의 신뢰도에 미치는 영향 검토 (A Study on the Influence of Prediction and Scenario Periods for the Reliability of Ensemble Streamflow Prediction)

  • 강태호;김충수;김남원
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2010년도 학술발표회
    • /
    • pp.1279-1283
    • /
    • 2010
  • 미국의 경우 1994년 발생한 대홍수(Great Flood)에 대해 사건조사를 수행하면서 예측에 포함되는 불확실성 정도를 제공하지 못하는 확정적 예측의 위험성 및 확률유량예측에 대한 필요성이 부각되었으며, 앙상블 유량예측(Ensemble Streamflow Prediction, ESP) 기법을 활용한 확률유량예측 방안에 대해 지속적으로 연구가 수행되고 있다. 국내에서도 확률예측에 대한 필요성이 인식되면서 기존 국외 연구사례를 토대로 국내 환경에 적용 가능한 방안에 대한 연구가 진행되었으며, 중장기 앙상블 유량예측의 경우 현업에서 다양한 형태로 활용되고 있다. 앙상블 유량예측의 기본이론은 예측시점의 초기조건 하에서 예측기간에 발생 가능한 기상 앙상블 시나리오를 수문모형의 입력자료로 사용하여 불확실성 범위를 설명 가능한 유량 앙상블을 모의하는 기법이다. 이러한 이론적 단순함 때문에 쉽게 현업의 유량예측 시스템 내에서 사용할 수 있다는 장점이 있으나, 동시에 기법적 특성으로 인하여 유량예측의 신뢰도가 현업에서 활용되기 어려울 정도로 낮아지는 관계로, 이러한 한계점을 극복하기 위해 그동안 기상자료 및 수문모형으로 인한 불확실성 저감에 대한 연구가 수행되었다. 하지만 예측 및 시나리오 기간의 잘못된 설정으로 기존의 불확실성 저감을 위한 연구의 적용에도 불구하고 앙상블 유량예측의 신뢰도가 오히려 낮아질 수 있으므로, 본 연구는 시나리오 기간에 따른 오차의 양상과 예측기간의 증가에 따른 초기조건의 영향을 분석하여 앙상블 유량예측의 기법적 특성 하에서 신뢰도 높은 예측을 기대할 수 있는 예측 및 시나리오 기간을 제안하였다.

  • PDF

앙상블기법을 이용한 다양한 데이터마이닝 성능향상 연구 (A Study for Improving the Performance of Data Mining Using Ensemble Techniques)

  • 정연해;어수행;문호석;조형준
    • Communications for Statistical Applications and Methods
    • /
    • 제17권4호
    • /
    • pp.561-574
    • /
    • 2010
  • 본 논문은 8가지 방법의 데이터 마이닝 알고리즘(CART, QUEST, CRUISE, 로지스틱 회귀분석, 선형판별분석, 이차판별분석, 신경망분석, 서포트 벡터 머신) 기법과 단일 알고리즘에 2가지 앙상블기법(배깅, 부스팅)을 적용한 16가지 방법을 바탕으로 총 24가지의 방법을 비교하였다. 알고리즘의 성능 비교를 위하여 13개의 이항반응변수로 구성된 데이터를 사용하였다. 비교 기준은 민감도, 특이도 및 오분류율을 사용하여 데이터 마이닝 기법의 성능향상에 대해 평가하였다.

데이터 불균형 기법의 부작용 완화를 위한 어텐션 기반 앙상블 (Attention-Based Ensemble for Mitigating Side Effects of Data Imbalance Method)

  • 박요한;최용석;;이공주
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.546-551
    • /
    • 2023
  • 일반적으로 딥러닝 모델은 모든 라벨에 데이터 수가 균형을 이룰 때 가장 좋은 성능을 보인다. 그러나 현실에서는 특정라벨에 대한 데이터가 부족한 경우가 많으며 이로 인해 불균형 데이터 문제가 발생한다. 이에 대한 해결책으로 오버샘플링과 가중치 손실과 같은 데이터 불균형 기법이 연구되었지만 이러한 기법들은 데이터가 적은 라벨의 성능을 개선하는 동시에 데이터가 많은 라벨의 성능을 저하시키는 부작용을 가지고 있다. 본 논문에서는 이 문제를 완화시키고자 어텐션 기반의 앙상블 기법을 제안한다. 어텐션 기반의 앙상블은 데이터 불균형 기법을 적용한 모델과 적용하지 않은 모델의 출력 값을 가중 평균하여 최종 예측을 수행한다. 이때 가중치는 어텐션 메커니즘을 통해 동적으로 조절된다. 그로므로 어텐션 기반의 앙상블 모델은 입력 데이터 특성에 따라 가중치를 조절할 수가 있다. 실험은 에세이 자동 평가 데이터를 대상으로 수행하였다. 실험 결과로는 제안한 모델이 데이터 불균형 기법의 부작용을 완화하고 성능이 개선되었다.

  • PDF

데이터융합, 앙상블과 클러스터링을 이용한 교통사고 심각도 분류분석 (Data Fusion, Ensemble and Clustering for the Severity Classification of Road Traffic Accident in Korea)

  • 손소영;이성호
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 2000년도 춘계공동학술대회 논문집
    • /
    • pp.597-600
    • /
    • 2000
  • 계속적인 증가 추세를 보이고 있는 교통량으로 인해 환경 문제뿐 아니라 교통사고로 인한 사상자 및 물적피해가 상당량으로 집계되고 있다. 본 논문에서는 데이터융합 및 앙상블 클러스터링방법을 이용한 교통사고 심각도 분류분석방법을 제안함으로서 교통사고예방에 기여하고자 한다. 이를 위하여 신경망과 Decision-Tree기법을 이용하여 얻은 물적피해와 신체상해가 발생할 확률을 융합하는 전형적인 데이터 융합기법(템스터-쉐퍼, 베이지안 방법, 로지스틱융합방법)을 사용하였다. 또한, 분류정확도를 향상시키고자 Bootstrap 재추출 방법을 이용해 얻어진 여러 개의 분류예측 결과 중 다수의 분류결과를 선택하는 앙상블 (arcing, bagging)기법을 적용하였다. 더불어, 본 연구에서는 클러스터링 방법을 제시하고, 이 방법이 기존의 융합기법, 앙상블기법과 비교한 결과, 분류예측면에서 정확도가 향상됨을 보였다.

  • PDF

앙상블 유량예측기법의 불확실성 평가 (Uncertainty assessment of ensemble streamflow prediction method)

  • 김선호;강신욱;배덕효
    • 한국수자원학회논문집
    • /
    • 제51권6호
    • /
    • pp.523-533
    • /
    • 2018
  • 본 연구에서는 충주댐 유역에 대해 앙상블 유량예측기법의 강우-유출 모델 매개변수, 입력자료에 따른 불확실성 분석을 수행하였다. 앙상블 유량예측기법으로는 ESP (Ensemble Streamflow Prediction) 기법과 BAYES-ESP (Bayesian-ESP) 기법을 활용하였으며, 강우-유출 모델로는 ABCD를 활용하였다. 모델 매개변수에 따른 불확실성 분석은 GLUE (Generalized Likelihood Uncertainty Estimation) 기법을 적용하였으며, 입력자료에 따른 불확실성 분석은 유량예측 앙상블에 활용되는 기상시나리오의 기간에 따라 수행하였다. 연구결과 앙상블 유량예측 기법은 입력자료 보다 모델 매개변수의 영향을 크게 받았으며, 20년 이상의 관측 기상자료가 확보되었을 때 활용하는 것이 적절하였다. 또한 BAYES-ESP는 ESP에 비해 불확실성을 감소시킬 수 있는 것으로 나타났다. 본 연구는 불확실성 분석을 통해 앙상블 유량예측기법의 특징을 규명하고 오차의 원인을 분석하였다는 점에서 가치가 있다고 판단된다.

MSWSI 개선을 통한 앙상블기법 기반 확률론적 가뭄해석 (The Probabilistic Drought Analysis Based on Ensemble Technique through the MSWSI Improvement)

  • 장석환;이재경;조준원
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.300-300
    • /
    • 2018
  • 최근 우리나라는 봄철 지속적으로 가뭄이 발생하는 추세로 모니터링과 더불어 가뭄 피해를 경감할 수 있도록 가뭄해석 기법이 필요하다. 이를 위해 우선적으로 우리나라 실정에 적합한 가뭄지수를 산정하고, 개선을 통해 가뭄정보들이 수자원확보를 위한 관리와 정책에 활용되어야 한다. 이에 따라 본 연구에서는 국내 기존에 활용되고 있는 수문학적 가뭄지수인 개선된 지표수공급지수(MSWSI : Modified Surface Water Supply Index)를 선정하고 개선하였으며, 개선된 MSWSI를 이용하여 앙상블기법 기반의 확률론적 가뭄해석을 수행하였다. MSWSI의 개선에 있어서는 우선, 유역 내 공식적으로 수집되는 모든 수문기상인자를 조사하여 기존 MSWSI에서 적용한 강수량, 하천유량, 댐 유입량, 지하수량 4가지 인자와 사용 가능한 댐 저수위, 댐 방류량 인자를 추가하여 반영하였다. 또한 각 수문인자들에 대하여 인자별로 적합한 확률분포를 적용하였다. 또한 극심한 가뭄이 발생한 2006년과 2014년을 대상으로 비교 검토를 실시하고, 앙상블기반 확률론적 가뭄전망을 수행하고 검증하였다. 연구결과, 본 연구에서 개선한 MSWSI가 2006년과 2014년 발생한 가뭄현상을 더 잘 나타내는 것으로 분석되었다. 또한 실제 수문기상현상을 더욱 잘 반영하여 실제 가뭄과 유사한 가뭄결과로 분석되어, 개선된 MSWSI가 효용성이 있음을 확인하였다. 또한 앙상블 기반의 확률론적 가뭄전망 결과, 본 연구에서 개선한 MSWSI를 이용하였을 때 더 우수한 것으로 분석되었다. 대부분의 유역에서 실제 가뭄지수가 개선된 MSWSI를 이용한 가뭄전망 범위에 속하는 것으로 나타나, 본 연구에서 개선한 MSWSI를 활용한다면 보다 정확한 가뭄모니터링 수행이 가능하며, 가뭄전망의 정확성을 높일 것으로 판단된다.

  • PDF

효율적인 의료진단을 위한 앙상블 분류 기법 (Ensemble Classification Method for Efficient Medical Diagnostic)

  • 정용규;허고은
    • 한국인터넷방송통신학회논문지
    • /
    • 제10권3호
    • /
    • pp.97-102
    • /
    • 2010
  • 의료 데이터 마이닝의 목적은 효율적인 알고리즘 및 기법을 통하여 각종 질병을 예측 분류하고 신뢰도를 높이는데 있다. 기존의 연구로 단일모델을 기반으로 하는 알고리즘이 존재하며 나아가 모델의 더 좋은 예측과 분류 정확도를 위하여 다중모델을 기반으로 하는 앙상블 기법을 적용한 연구도 진행되고 있다. 본 논문에서는 의료데이터의 보다 높은 예측의 신뢰도를 위하여 기존의 앙상블 기법에 사분위간 범위를 적용한 I-ENSEMBLE을 제안한다. 갑상선 기능 저하증 진단을 위한 데이터를 통해 실험 적용한 결과 앙상블의 대표적인 기법인 Bagging, Boosting, Stacking기법 모두 기존에 비해 현저하게 향상된 정확도를 나타내었다. 또한 기존 단일모델 기법과 비교하여 다중모델인 앙상블 기법에 사분위간 범위를 적용했을 때 더 뚜렷한 효과를 나타냄을 확인하였다.

앙상블 기반 지역화 기법을 이용한 확률론적 유출량 분석 (Probabilistic Runoff Analysis using Ensemble Technoque with Localization Method)

  • 이한용;장석환;이재경;조준원
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2019년도 학술발표회
    • /
    • pp.207-207
    • /
    • 2019
  • 최근 우리나라는 지역 특성 및 기후변화의 영향으로 인해 수문학적 요소의 변동성이 커지고 수자원의 지속적인 관리에 있어 유출량은 중요한 문제로 여겨지고 있다. 특히 일부 소하천 또는 접경지역과 같은 미계측유역은 수문학적 요소에 대한 자료가 부족하고 수문모형의 초기치 설정과 과거 유출량 자료를 통하여 최적화한 매개변수를 결정해야하므로 장기유출분석이 어렵다. 본 연구의 적용유역으로 미계측유역인 임진강상류 유역에 대한 유출량 추정을 위해 계측 유역의 자료를 활용하여 모형의 매개변수 등을 추정하는 지역화 기법인 다중선형회귀분석과 공간근접분석을 활용하여 유출량을 산정 및 검증하였다. 또한, 확률론적 예측이 가능한 앙상블 기법 적용을 통한 유출량 예측을 하였고, 이를 예측 정확성 평가지표를 통해 효율성 검토를 수행하여 미계측유역의 유출량에 대해 확률론적 예측을 수행하였다. 대표적 지역화 기법의 적용성을 검토한 결과, 계측유역을 통해 다중선형회귀분석과 공간근접분석을 abcd 모형에 적용하였다. 모의유출량을 산정하고 실측 유출량과 비교 분석 결과 모의정확성이 높게 분석되었다. 이와 같은 검증 결과를 토대로 미계측유역의 유출량을 추정하였다. 또한, 지역화 기법을 앙상블 기법에 적용하여 확률론적 유출량 예측의 효율성을 검토하였다. 적용유역과 같은 지류를 포함하고 있는 임진강하류 유역을 대상으로 수행하였다. 검증기간(2013년~2017년) 동안의 월 예측 유출량 앙상블 생성을 위해 과거 강우량와 증발량(1988년~2012년) 자료를 사용하였으며, 지역화 기법을 적용한 abcd 모형을 이용하였다. 예측 유출량의 정확성 평가를 실시하였으며, 정확성이 비교적 높게 분석되었다. 이와 같은 결과를 토대로 미계측유역의 확률론적 유출량을 예측하였다. 따라서, 대표적 지역화 기법을 앙상블 기법에 적용하여 확률론적 유출량을 예측할 경우 보다 정확한 유출량 예측이 가능하다.

  • PDF

통합실시간 물관리 운영시스템을 위한 장기유량예측 (Long-term Streamflow Prediction for Integrated Real-time Water Management System)

  • 강부식;유승엽;고익환
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2005년도 학술발표회 논문집
    • /
    • pp.1450-1454
    • /
    • 2005
  • 수자원관리에 있어서 미래시구간에 대한 유량예측은 수자원시스템운영자에게 있어서 의사결정에 결정적인 영향을 미치는 가장 중요한 요소 중의 하나이다. 효율적 물배분이나 발전 등의 이수활동을 위해서 최소 월단위 이상의 장기유량예측이 필요하며, 이를 위해서는 강우예측이 선행되어야 하는데, 본 연구에서는 통합 실시간 물관리 운영시스템을 위한 중장기 유량예측을 목표로 방법론을 제시하고자 한다. 중장기 유량예측을 수행하는 대표적인 방법 중의 하나는 앙상블 유량예측(ESP; Ensemble Streamflow Prediction) 기법이다. ESP란 현재의 유역상태를 초기조건으로 사용하고 과거의 온도나 강수 등의 시계열앙상블을 모형입력으로 이용해서 강우-유출모형을 통하여 유출량을 예측하는 기법이다. ESP는 결국 현재의 유역상태와 유역에서의 과거강우관측기록, 미래강우예측에 대한 정보를 조합하여 그에 따른 유출앙상블을 생산해 내게 된다. 유출앙상블은 각 앙상블 트레이스가 갖게 되는 가중치에 따라 확률분포를 달리 갖게 되고 경우에 따라서는 유량으로부터 2차적으로 유도되는 변수들의 확률분포로 전이되기도 한다. 기존의 ESP 이론은 미국 NWS의 범주형 확률예보를 근간으로 하고 있어, 이를 국내 환경에 그대로 적용시키기에 어려움이 있어 왔다. 따라서 본 연구에서는 국내 기상청의 월간 강수전망을 이용하고, 이러한 정보의 특성에 맞는 ESP기법을 제시하였다. 더 나아가 중장기 수자원운영을 위한 일단위 월강수시나리오 구성을 위해서 수치예보와 월강수전망을 조합하여 ESP를 사용하는 기법을 제시하였다.

  • PDF