• Title/Summary/Keyword: 앙상블기법

Search Result 299, Processing Time 0.033 seconds

Spatial Autocorrelation Characteristic Analysis on Bayesian ensemble Precipitation of Nakdong River Basin (낙동강유역 강우의 공간자기상관 특성분석을 통한 베이지안 앙상블 강우 검증)

  • Moon, Soo Jin;Sun, Ho Young;Kang, Boo Sik
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.411-411
    • /
    • 2017
  • 유역 내 발생하는 강우의 공간적인 분포는 인접성 및 거리에 따라 달라질 수 있다. 공간자기상관 분석은 공간단위(유역 또는 행정구역)의 변수(강수 등)가 주변지역과 갖는 관계를 통해 얼마나 분산되어 있는지 혹은 군집되어 있는지를 판별하는 기법으로 최근 많은 연구에서 활성화 되고 있다. 본 연구에서는 낙동강유역을 대상으로 1980~2000년까지 20개년의 기상청을 통해 수집한 강우자료와 CMIP5(Coupled Model Intercomparison Project Phase 5)에서 제공하는 기후변화 자료 중 가용할 수 있는 20개 모델의 강우를 수집하였다. 기후변화 자료는 정상성 분위사상법으로 지역오차보정을 실시하고 불확실성을 저감하고자 베이지안 모델 평균기법을 통해 새로운 시계열을 생성하였다. 생성된 시계열의 공간적인 분포를 정량적으로 평가하고자 중권역별 공간자기상관 분석을 수행하였다. 대부분의 연구에서는 GIS를 활용하여 정성적으로 강우의 분포를 나타내고 있지만 본 연구에서는 공간단위의 인접성 또는 거리에 따른 척도를 기반으로 공간자기상관을 탐색할 수 있는 Moran's I와 LISA(Local Indicators of Spatial Association)기법을 적용하였다. Moran's I는 전체 연구지역에 대한 관계를 하나의 값으로 보여주는 전역적인 기법이며, LISA는 상대적으로 넓은 지역을 국지적으로 구분하여 특정지역에 대한 Hot spot 및 Cold spot을 통해 공간자기상관 정도를 나타내는 국지적인 기법이다. 두 기법을 적용하기 위하여 인접성 기반의 공간매트릭스를 산정하고 계절별 관측값과 베이지안 앙상블 강우의 Moran's I 및 LISA 분석을 실시하였다. 관측자료와 베이지안 앙상블 강우의 분석결과가 매우 유사하게 나타남으로써 베이지안 앙상블 강우의 공간적인 분포가 관측강우를 충분히 재현하고 있다고 판단된다.

  • PDF

H-PaDiM : Anomaly Segmentation Performance Analysis Based on PaDiM-Based Homogeneous Ensemble Method (H-PaDiM : PaDiM 기반 동종 앙상블 기법에 따른 이상 탐지성능 분석)

  • Kim, InKi;Gwak, Jeonghwan
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.95-97
    • /
    • 2022
  • 본 논문에서는 산업 현장에서 발생하는 불량품 탐지 분야에서 효율적으로 생산품의 불량을 탐지할 수 있는 PaDiM 구조의 Backbone 모델을 단일 Wide-ResNet 대신 두 개의 Wide-ResNet을 사용함으로써, 단일 모델에서 추출된 저차원의 Feature를 앙상블을 통해 성능 향상을 일으킬 수 있는 것을 증명하였다. 단일 Wide-ResNet 환경에서는 MVTec 데이터셋에서 생성된 다변량 가우시안 분포가 데이터셋의 적은 샘플수로 인하여 각 클래스 간 불균형이 발생하는 문제를 동종 앙상블을 통해 해결할 수 있었다. 따라서 본 논문에서는 제안하는 동종 모델의 앙상블을 사용함으로써 기존의 One-class classification 환경에서 불량품 탐지환경에서 적은 수의 데이터 샘플 환경에서 성능 향상을 나타낼 수 있음을 입증하였다.

  • PDF

Spatial Entities Extraction using Bidirectional LSTM-CRF Ensemble (Bidirectional LSTM-CRF 앙상블을 이용한 공간 개체 추출)

  • Min, Tae Hong;Lee, Jae Sung
    • Annual Conference on Human and Language Technology
    • /
    • 2017.10a
    • /
    • pp.133-136
    • /
    • 2017
  • 공간 정보 추출은 대량의 텍스트 문서에서 자연어로 표현된 공간 관련 개체 및 관계를 추출하는 것으로 질의응답 시스템, 챗봇 시스템, 네비게이션 시스템 등에서 활용될 수 있다. 본 연구는 한국어에 나타나 있는 공간 개체들을 효과적으로 추출하기 위한 앙상블 기법이 적용된 Bidirectional LSTM-CRF 모델을 소개한다. 한국어 공간 정보 말뭉치를 이용하여 실험한 결과, 기존 모델보다 매크로 평균이 향상되어 전반적인 공간 관계 추출에 유용할 것으로 기대한다.

  • PDF

Spatial Entities Extraction using Bidirectional LSTM-CRF Ensemble (Bidirectional LSTM-CRF 앙상블을 이용한 공간 개체 추출)

  • Min, Tae Hong;Lee, Jae Sung
    • 한국어정보학회:학술대회논문집
    • /
    • 2017.10a
    • /
    • pp.133-136
    • /
    • 2017
  • 공간 정보 추출은 대량의 텍스트 문서에서 자연어로 표현된 공간 관련 개체 및 관계를 추출하는 것으로 질의응답 시스템, 챗봇 시스템, 네비게이션 시스템 등에서 활용될 수 있다. 본 연구는 한국어에 나타나 있는 공간 개체들을 효과적으로 추출하기 위한 앙상블 기법이 적용된 Bidirectional LSTM-CRF 모델을 소개한다. 한국어 공간 정보 말뭉치를 이용하여 실험한 결과, 기존 모델보다 매크로 평균이 향상되어 전반적인 공간 관계 추출에 유용할 것으로 기대한다.

  • PDF

Reducing Uncertainties in Climate Change Assessment (기후변화 영향평가의 불확실성 저감연구)

  • Lee, Jae-Kyoung;Kim, Young-Oh
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2008.05a
    • /
    • pp.345-351
    • /
    • 2008
  • 미래의 기후변화 영향평가에 있어 전지구모형(General Circulation Model)은 가장 중요한 자료 중 하나이다. 즉, 온실가스 방출(emission) 시나리오에 기초한 전지구모형의 모의결과를 이용하면 미래 수자원에 대한 정보를 얻을 수 있다. 하지만 미래 수자원은 방출 시나리오, 상세화(downscaling) 기법, 강우-유출모형, 전지구모형의 종류에 따라 크게 달라질 수 있어 매우 큰 불확실성(uncertainty)을 포함하고 있다. 이러한 불확실성을 줄이는 방법 중 하나로 전지구모형의 모의능력에 따라 가중치(weight)를 부여하고 결합(combining)하는 multi-model 앙상블(ensemble) 기법이 선진국을 중심으로 활발히 연구되고 있다. 본 연구에서는 우선 기후변화 영향평가를 위하여 국내에서 사용가능한 전지구모형을 조사하고 그 중CCSM3, CSRIO, ECHAM4, GFDL, MIRCO를 선택하였다. 한강 충주댐 유역에 대하여 과거($1980{\sim}1999$년)와 미래($2030{\sim}2049$년) 기간에 대하여 전지구모형의 기후정보를 간단한 선형보간법을 이용하여 상세화하였다. 다음으로 multi-model 앙상블 기법을 조사하였다. 본 연구에서는 Giorgi et al.(2002)이 제안한 Reliability Ensemble Average(REA) 기법을 적용하여 선형보간법으로 상세화한 전지구모형의 모의결과에 가중치를 주어 불확실성을 줄이는 연구를 수행하였다. 특히 REA를 구성하는 식 중 모형의 편차(bias) 뿐만 아니라 분산(variance)까지 고려함으로서 이를 개선하는 Modified-REA를 제안하였다. 제안한 방안을 이용하여 결합한 전지구모형의 모의결과가 기존 REA의 결과보다 기후정보의 불확실성을 더 줄일 수 있는 것으로 나타났다.

  • PDF

Stochastic Continuous Storage Function Model with Ensemble Kalman Filtering (II) : Application and Verification (앙상블 칼만필터를 연계한 추계학적 연속형 저류함수모형 (II) : - 적용 및 검증 -)

  • Lee, Byong-Ju;Bae, Deg-Hyo;Shamir, Eylon
    • Journal of Korea Water Resources Association
    • /
    • v.42 no.11
    • /
    • pp.963-972
    • /
    • 2009
  • The objective of this study is to evaluate an application of stochastic continuous storage function model with ensemble Kalman filter technique. The case study is performed at the upstream basin of Jibo streamflow gauge including Andong and Imha dam. Test period is for the rainy season during 2006 and 2007. Long term runoff analysis is feasible in the case of using deterministic model. Ensemble members for input data and parameters are generated using Monte Carlo simulation for the purpose of applying ensemble Kalman filter technique. The cumulative absolute errors of stochastic model to the deterministic one are improved for the amount of 17.5 %, 18.3 % and more than 40.0 % for Andong dam, Imha dam and Jibo station, respectively. The results indicate that the stochastic model improves the accuracy of the simulated discharge considerably.

Sentiment analysis of online food product review using ensemble technique (앙상블 기법을 활용한 온라인 음식 상품 리뷰 감성 분석)

  • Kim, Han-Min;Park, Kyungbo
    • Journal of Digital Convergence
    • /
    • v.17 no.4
    • /
    • pp.115-122
    • /
    • 2019
  • In the online marketplace, consumers are exposed to various products and freely express opinions. As consumer product reviews have a important effect on the success of online markets and other consumers, online market needs to accurately analyze the consumers' emotions about their products. Text mining, which is one of the data analysis techniques, can analyze the consumer's reviews on the products and efficiently manage the products. Previous studies have analyzed specific domains and less than 20,000 data, despite the different accuracy of the analysis results depending on the data domain and size. Further, there are few studies on additional factors that can improve the accuracy of analysis. This study analyzed 72,530 review data of food product domain that was not mainly covered in previous studies by using ensemble technique. We also examined the influence of summary review on improving accuracy of analysis. As a result of the study, this study found that Boosting ensemble technique has the highest accuracy of analysis. In addition, the summary review contributed to improving accuracy of the analysis.

SVM Ensemble Techniques for Class Imbalance Problem (데이터 불균형 문제에서의 SVM 앙상블 기법의 적용)

  • 강필성;이형주;조성준
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.706-708
    • /
    • 2004
  • 대부분의 기계학습 알고리즘은 학습 데이터에서 각각의 범주간의 비율이 동일하거나 비슷하다는 가정 하에 문제를 풀게 된다. 그러나 실제 문제에서는 그 비율이 동일하지 않으며 매우 큰 차이를 보이기도 하는데, 이는 분류 성능을 저하시키는 요인이기도 하다 따라서 본 논문에서는 이러한 데이터의 불균형 문제를 해소하는 방안으로 SVM 앙상블 기법을 적용한 샘플링을 제안하고 이를 실제 불균형 데이터에 적용함으로써 제안된 방법이 기존의 방법들에 비해 향상된 성능을 나타내는 것을 보였다.

  • PDF

The Automated System for Location Visiting Preference Prediction with Personality Factors (사람 성격 요소에 따른 위치 방문 선호도 예측의 자동화 시스템)

  • Song, Ha Yoon;Jung, Ji Hyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.11a
    • /
    • pp.935-938
    • /
    • 2021
  • 데이터 베이스에 저장된 사용자의 위치, 성격정보를 자동으로 받아서 머신러닝으로 회귀분석하여 방문 장소에 대한 선호도를 예측한다. 사람의 성격 요소로는 BFF 와 다른 기본 요소들을 사용하였다. 이를 위하여 자동화된 시스템을 구성하였고 위치 방문 선호도를 예측하기 위한 머신러닝 기법으로는 앙상블기법을 사용하였다. 예측 결과는 장소 카테고리별로 방문 선호도가 나타나고 이를 사용자 별로 나누어 저장할 예정이다. 데이터의 양이 많아지면서 나타나는 문제들을 해결하여 향후 연구에 도움이 될 것이다.

Improving an Ensemble Model by Optimizing Bootstrap Sampling (부트스트랩 샘플링 최적화를 통한 앙상블 모형의 성능 개선)

  • Min, Sung-Hwan
    • Journal of Internet Computing and Services
    • /
    • v.17 no.2
    • /
    • pp.49-57
    • /
    • 2016
  • Ensemble classification involves combining multiple classifiers to obtain more accurate predictions than those obtained using individual models. Ensemble learning techniques are known to be very useful for improving prediction accuracy. Bagging is one of the most popular ensemble learning techniques. Bagging has been known to be successful in increasing the accuracy of prediction of the individual classifiers. Bagging draws bootstrap samples from the training sample, applies the classifier to each bootstrap sample, and then combines the predictions of these classifiers to get the final classification result. Bootstrap samples are simple random samples selected from the original training data, so not all bootstrap samples are equally informative, due to the randomness. In this study, we proposed a new method for improving the performance of the standard bagging ensemble by optimizing bootstrap samples. A genetic algorithm is used to optimize bootstrap samples of the ensemble for improving prediction accuracy of the ensemble model. The proposed model is applied to a bankruptcy prediction problem using a real dataset from Korean companies. The experimental results showed the effectiveness of the proposed model.