• 제목/요약/키워드: Ensemble Technique

검색결과 217건 처리시간 0.022초

전이학습 기반 특징융합을 이용한 누출판별 기법 연구 (A Study on Leakage Detection Technique Using Transfer Learning-Based Feature Fusion)

  • 한유진;박태진;이종혁;배지훈
    • 정보처리학회 논문지
    • /
    • 제13권2호
    • /
    • pp.41-47
    • /
    • 2024
  • 시간 및 주파수 영역에서 각각 학습한 모델 간에 성능 차이가 발생할 경우, 앙상블을 수행하더라도 개별 모델 간의 성능 불균형으로 인하여 앙상블의 성능이 오히려 저하되는 현상을 확인할 수 있었다. 따라서, 본 논문은 시간 영역과 주파수 영역에서 특징을 추출하고, 이들을 융합한 단계적 학습 방법을 통해 파이프라인 누출 감지의 정확성을 높이기 위한 누출판별 기법을 제안한다. 이 방법은 두 단계의 학습 과정으로 이루어지며, 먼저, 단계 1에서는 시간 영역과 주파수 영역에서 독립적으로 모델 학습을 수행하여 도메인별로 주어진 데이터로부터 중요한 특징들을 효과적으로 추출하도록 하였다. 단계 2에서는 사전학습 완료된 각 모델로부터 해당 분류기를 제거한 후, 두 도메인의 특징들을 서로 융합하고 새로운 분류기를 추가하여 재학습을 수행하였다. 본 논문에서 제안하는 전이학습 기반 특징융합 기법은 시간 및 주파수 영역에서 추출된 특징들을 융합하여 모델 학습을 수행함으로써, 두 영역의 특징이 상호 보완적으로 작용하여 모델이 다양한 정보를 활용함으로 인해 99.88%의 높은 정확도를 달성하여 파이프 누수 감지에 있어 우수한 성능을 입증하였다.

낙동강유역 하천유량 예측모형 구축 (Streamflow Forecast Model on Nakdong River Basin)

  • 이병주;배덕효
    • 한국수자원학회논문집
    • /
    • 제44권11호
    • /
    • pp.853-861
    • /
    • 2011
  • 본 연구는 연속형 강우-유출모형과 관측유량 자료동화기법으로 앙상블 칼만필터 기법을 연계한 SURF 모형을 낙동강유역에 적용하여 하천유량예측의 적용성을 평가하고자 하는데 그 목적이 있다. 낙동강유역을 43개 소유역으로 구분하고 2006년과 2007년의 홍수기간 동안 12개 평가지점에 대해 유출모의를 수행하였다. 관측유량 자료동화 효과로 인해 예측유량의 정확도가 향상되며 1~5시간의 예측선행시간별 유효성지수를 분석한 결과 자료동화로 인해 46.2~30.1%의 모의유량의 정확도가 개선되는 것으로 나타났다. 또한 관측강우의 50%를 적용하여 자료동화 전 후의 모의 첨두유량에 대한 평균정상절대오차를 비교하였으며 자료동화로 인해 40% 이상의 정확도가 향상됨을 확인하였다. 이상의 결과로부터 SURF 모형은 낙동강유역의 실시간 하천유량예측에 활용될 수 있을 것으로 판단된다.

요속검사시 배뇨상황에 무관한 신호대잡음비 개선 기법 (Enhancement of signal-to-noise ratio for uroflowmetric test regardless of urination situation)

  • 김경아;최성수;이상봉;김경옥;박경순;신은영;김원재;차은종
    • 센서학회지
    • /
    • 제18권6호
    • /
    • pp.423-431
    • /
    • 2009
  • Standard uroflowmetry measures the urine weight using single load cell to evaluate the urinary flow rate. Impact noise should be introduced due to gravity when the urine stream falls down into the container upon the load cell. The present study placed three load cells on the three vertices of a regular triangle and the three signals were ensemble averaged to enhance the signal-to-noise ratio(SNR) regardless of how the urination was made. Simulated urination experiment was performed with three different urine collection methods. In all three methods, SNR of the averaged signal was much higher than each load cell signals. With no urine collection device, the present signal averaging technique resulted in SNR values higher by 10~15 dB than when dual funnels or upper funnel were used to guide the urine stream. Therefore, it was demonstrated that the three point measurement followed by with ensemble averaging could enable accurate uroflowmetric test without any specially made urine collection devices.

전지구 계절 예측 시스템의 토양수분 초기화 방법 개선 (Improvement of Soil Moisture Initialization for a Global Seasonal Forecast System)

  • 서은교;이명인;정지훈;강현석;원덕진
    • 대기
    • /
    • 제26권1호
    • /
    • pp.35-45
    • /
    • 2016
  • Initialization of the global seasonal forecast system is as much important as the quality of the embedded climate model for the climate prediction in sub-seasonal time scale. Recent studies have emphasized the important role of soil moisture initialization, suggesting a significant increase in the prediction skill particularly in the mid-latitude land area where the influence of sea surface temperature in the tropics is less crucial and the potential predictability is supplemented by land-atmosphere interaction. This study developed a new soil moisture initialization method applicable to the KMA operational seasonal forecasting system. The method includes first the long-term integration of the offline land surface model driven by observed atmospheric forcing and precipitation. This soil moisture reanalysis is given for the initial state in the ensemble seasonal forecasts through a simple anomaly initialization technique to avoid the simulation drift caused by the systematic model bias. To evaluate the impact of the soil moisture initialization, two sets of long-term, 10-member ensemble experiment runs have been conducted for 1996~2009. As a result, the soil moisture initialization improves the prediction skill of surface air temperature significantly at the zero to one month forecast lead (up to ~60 days forecast lead), although the skill increase in precipitation is less significant. This study suggests that improvements of the prediction in the sub-seasonal timescale require the improvement in the quality of initial data as well as the adequate treatment of the model systematic bias.

머신러닝을 이용한 철광석 가격 예측에 대한 연구 (Forecasting of Iron Ore Prices using Machine Learning)

  • 이우창;김양석;김정민;이충권
    • 한국산업정보학회논문지
    • /
    • 제25권2호
    • /
    • pp.57-72
    • /
    • 2020
  • 철광석의 가격은 여러 국가와 기업들의 수요와 공급에 따라서 높은 변동성이 지속되고 있다. 이러한 비즈니스 환경에서 철광석의 가격을 예측하는 것은 중요해졌다. 본 연구는 머신러닝 기법을 이용하여 철광석이 거래되는 시점으로부터 한 달 전에 철광석 거래가격을 미리 예측하는 모형을 개발하고자 하였다. 예측 모형은 시계열 데이터를 활용한 예측 방법론으로 많이 활용되고 있는 시차분포 모형과 다층신경망 (Multi-layer perceptron), 순환신경망 (Recurrent neural network), 그리고 장단기 기억 네트워크 (Long short-term memory)와 같은 딥 러닝(Deep Learning) 모형을 사용하였다. 측정지표를 통해 개별 모형을 비교한 결과에 따르면, LSTM 모형이 예측 오차가 가장 낮은 것으로 나타났다. 또한, 앙상블 기법을 적용한 모형들을 비교한 결과, 시차분포와 LSTM의 앙상블 모형이 예측오차가 가장 낮은 것으로 나타났다.

협업필터링과 스태킹 모형을 이용한 상품추천시스템 개발 (Development of Product Recommender System using Collaborative Filtering and Stacking Model)

  • 박성종;김영민;안재준
    • 융합정보논문지
    • /
    • 제9권6호
    • /
    • pp.83-90
    • /
    • 2019
  • 사람들은 자신의 더 나은 선택을 위하여 끊임없이 노력한다. 이러한 이유로 추천시스템이 개발되었으며, 1990년대 초반부터 계속해서 발전하고 있다. 그 중, 협업필터링 기법은 추천시스템 분야에서 우수한 성능을 보였으며, 기계학습이 등장하면서 기계학습을 이용한 추천시스템에 관한 연구가 활발히 진행되었다. 본 연구는 앙상블 방법 중에서 스태킹 모형을 사용하여 추천시스템을 구축하며, 실제 고객의 상품 구매 데이터를 활용하여 협업필터링과 기계학습 기반 스태킹 모형으로 추천시스템을 개발하였다. 제시한 모형의 추천 성능은 기존의 협업필터링과 기계학습 기반 추천시스템과 비교하여 모형의 우수성을 확인하며, 연구결과는 스태킹 모형을 이용한 추천시스템 모형의 추천 성능이 개선됨을 확인하였다. 향후 본 연구에서 제안한 모형은 개인이나 기업이 더 나은 선택을 하여 상품을 추천할 때 도움을 줄 것으로 기대한다.

OBDII 데이터 기반의 실시간 연료 소비량 예측 모델 연구 (A Modeling of Realtime Fuel Comsumption Prediction Using OBDII Data)

  • 양희은;김도현;최호섭
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권2호
    • /
    • pp.57-64
    • /
    • 2021
  • 자율주행차 시대가 도래하면서 ECU (Electronic Control Unit)는 점차 고도화되고 있고, 이에 따라 차량에서 정확한 데이터를 추출하고 분석하려는 연구가 다양하게 시도되어 왔다. 그러나 ECU는 차량 제조사별로 상이한 프로토콜을 가지고 있어 상용 단말기로는 정확한 데이터 추출과 분석이 어렵다. 본 연구에서는 정확한 차량 데이터를 추출하기 위하여 전용 펌웨어를 개발하여 차량의 2019년 1월부터 2월의 실제 주행데이터 53,580건의 데이터를 추출하였으며, 20회가 넘는 실제 도로 주행을 통해서 데이터의 정확도를 검증하였다. 이러한 데이터를 바탕으로 실시간 연료 소비량 예측 모델의 정확도를 높이기 위하여 스태킹 앙상블 기법을 이용하였다. 본 연구에서는 베이스 모델로 Ridge, Lasso, XGBoost, LightGBM이 사용되고 메타 모델은 Ridge가 사용되었으며, 예측 성능은 MAE 0.011, RMSE 0.017로 최적의 결과를 보였다.

머신러닝 CatBoost 다중 분류 알고리즘을 이용한 조류 발생 예측 모형 성능 평가 연구 (Evaluation of Multi-classification Model Performance for Algal Bloom Prediction Using CatBoost)

  • 김준오;박정수
    • 한국물환경학회지
    • /
    • 제39권1호
    • /
    • pp.1-8
    • /
    • 2023
  • Monitoring and prediction of water quality are essential for effective river pollution prevention and water quality management. In this study, a multi-classification model was developed to predict chlorophyll-a (Chl-a) level in rivers. A model was developed using CatBoost, a novel ensemble machine learning algorithm. The model was developed using hourly field monitoring data collected from January 1 to December 31, 2015. For model development, chl-a was classified into class 1 (Chl-a≤10 ㎍/L), class 2 (10<Chl-a≤50 ㎍/L), and class 3 (Chl-a>50 ㎍/L), where the number of data used for the model training were 27,192, 11,031, and 511, respectively. The macro averages of precision, recall, and F1-score for the three classes were 0.58, 0.58, and 0.58, respectively, while the weighted averages were 0.89, 0.90, and 0.89, for precision, recall, and F1-score, respectively. The model showed relatively poor performance for class 3 where the number of observations was much smaller compared to the other two classes. The imbalance of data distribution among the three classes was resolved by using the synthetic minority over-sampling technique (SMOTE) algorithm, where the number of data used for model training was evenly distributed as 26,868 for each class. The model performance was improved with the macro averages of precision, rcall, and F1-score of the three classes as 0.58, 0.70, and 0.59, respectively, while the weighted averages were 0.88, 0.84, and 0.86 after SMOTE application.

Development and Verification of an AI Model for Melon Import Prediction

  • KHOEURN SAKSONITA;Jungsung Ha;Wan-Sup Cho;Phyoungjung Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권7호
    • /
    • pp.29-37
    • /
    • 2023
  • 기후변화로 인해 농작물 생산과 유통에 관한 관심이 증대되고 있고, 빅데이터와 AI를 활용한 생산량 예측을 통해 농가의 출하량 조절과 유통단계의 조절에 활용하는 시도가 이루어지고 있다. 농산물 반입량 예측은 가격에 영향을 미칠 뿐 아니라 농가의 출하량과 유통회사의 유통량 조절을 할 수 있으므로 마케팅 전략을 수립하는데 중요한 정보이다. 본 연구에서는 농업 통계 정보 시스템에서 공개한 도매시장 참외 반입량 데이터를 기반으로 미래의 반입량을 예측하는 인공지능 예측 모델을 생성하고 정확도를 평가한다. 우리는 Neural Prophet 기법과 Ensembled Neural Prophet 모델 그리고 GRU 모델 등 세 가지 모델을 사용하여 예측 모델을 생성한다. 모델의 성능은 MAE와 RMSE라는 두 가지 주요 지표를 비교하여 평가한 결과 Ensembled Neural Prophet 모델이 가장 정확하게 예측하였으며, GRU 모델도 앙상블 모델과 유사한 성능을 보여주고 있다. 본 연구에서 개발된 모형은 웹에 publish 되어 현장에서 1년 6개월 동안 사용하고 있으며, 가까운 미래의 참외 생산량을 예측하고, 마케팅 및 유통전략을 수립하는 데 활용되고 있다.

머신러닝을 이용한 공연문화예술 개인화 장르 추천 시스템 (A Personalized Recommendation System Using Machine Learning for Performing Arts Genre)

  • 김형수;박예린;이정민
    • 경영정보학연구
    • /
    • 제21권4호
    • /
    • pp.31-45
    • /
    • 2019
  • 공연문화예술 시장의 확대에도 불구하고, 중소규모 공연장은 소비자의 정보 접근성이 좋지 않아 어려움을 겪고 있다. 본 연구는 중소규모 공연장의 마케팅 역량을 강화할 수 있는 하나의 대안으로써 머신러닝 기반의 장르 추천 시스템을 제시하고자 한다. 국내 한 공연장의 고객 마스터 DB와 거래이력 DB를 활용하여 고객당 3개의 장르를 추천하는 5개의 추천 시스템을 개발하였다. 추천시점 이후 1년 동안의 실제 공연구매 이력을 바탕으로 추천 시스템의 성능을 비교하여 최적의 추천시스템을 제안하였다. 분석 결과, 단일 예측모형보다는 앙상블 모형 기반의 추천시스템이 우수한 성능을 보이는 것으로 나타났다. 본 연구는 공연문화예술 분야에는 일천했던 개인화 추천 기법을 적용했고, 분석 결과 공연문화예술 분야에서도 충분히 활용할 만한 가치가 있음을 시사하고 있다.