• 제목/요약/키워드: 앙상블 예측기법

검색결과 161건 처리시간 0.024초

온라인 판매촉진활동 분석을 통한 고객 리뷰평점 추천 및 예측에 관한 연구 : S사 Wearable 상품중심으로 (A Study on Customer Review Rating Recommendation and Prediction through Online Promotional Activity Analysis - Focusing on "S" Company Wearable Products -)

  • 신호철
    • 한국콘텐츠학회논문지
    • /
    • 제22권4호
    • /
    • pp.118-129
    • /
    • 2022
  • 본 논문에서는 국내 온라인 기업의 Wearable 제품을 선정하고 판매 데이터를 수집해 다양한 분석과 매출 예측을 통해 판촉 활동의 전략 모델을 연구하는 데 목적이 있다. 데이터 분석을 위해 여러 가지의 알고리즘을 사용하여 분석할 것이며, 최상의 모형으로 결과를 선택할 것이다. 최상의 결과로 선택된 모형인 Gradient Boosting 모델은 지도학습을 통해 종속변수 예측에 있어서 판촉 유형, 가격, 판매 수량, 성별, 모델, 판매경로, 제품 성능, 판매 날짜, 지역 등 9개의 독립변수를 투입할 수 있게 된다. 본 연구에서는 판매촉진 유형별로 종속변수로 설정된 리뷰 값을 앙상블 분석 기법을 통해 더욱더 세부적으로 학습하고 분석 및 예측이 주목적이며, 판매촉진 활동을 통한 고객에게 할인 혜택을 주어질 경우와 주어지지 않을 경우에 리뷰 평점을 연구하는 데 목적이 있다. 분석 결과로 본다면 평가 결과는 AUC 95% 수준이며, F1도 93% 정도이다. 결국 판매촉진 활동 유형 중 가치 부가 혜택이 리뷰 수와 리뷰 평점에 영향을 준다고 것을 확인할 수 있었으며, 주요 변인들이 리뷰와 리뷰 평점의 영향을 준다는 것도 확인할 수 있었다.

신재생 에너지 최적 활용을 위한 축열조 온도 예측 모델 연구 (A Study on the Thermal Prediction Model cf the Heat Storage Tank for the Optimal Use of Renewable Energy)

  • 오한별;장경민;오지영;이명배;박장우;조용윤;신창선
    • 스마트미디어저널
    • /
    • 제12권10호
    • /
    • pp.63-70
    • /
    • 2023
  • 최근 스마트팜 에너지 비용 중 35% 낸난방비 에너지 소비가 증가되어 에너지 소비 효율화가 요구되며, 전기료 현실화에 대한 우려로 신재생 에너지 중요성이 증가하고 있다. 신재생 에너지는 수력, 풍력, 태양광 등에 속하며, 이중 태양광 에너지는 전기에너지로 변환하는 발전기술로, 이 기술은 에너지원이 환경에 미치는 영향이 적고, 유지 보수가 간편하다는 특징을 갖고 있다. 본 연구에서는 온실 축열조, 히트펌프 데이터 기반으로 축열조 영향을 많이 미치는 요소를 선정하고 축열조 공급 온도예측 모델을 개발하고자 한다. 시계열 데이터 분석 및 예측에 효과적인 LSTM(Long Short-Term Memory)과 다른 앙상블 학습 기법보다 뛰어난 XGBoost 모델을 이용하여 예측한다. 히트펌프 축열조 온도를 예측함으로써 에너지 소비를 최적화하여 시스템 운영을 최적화할 수 있다. 또한, 태양광 활용에 따른 냉난방비 절감 및 농가의 에너지 자립도 개선 등 스마트팜 에너지 통합 운영 시스템에 연계하고자 한다. 플랫폼을 통해 폐열 에너지의 공급을 관리하고 최대 난방부하 및 계절, 시간별 작물생장에 필요한 에너지값을 도출하여 이를 기반으로 최적 에너지 운용방안을 도출하고자 한다.

마른나무흰개미(가칭)의 국내 기후적합성 평가 (Assessing the Climatic Suitability for the Drywood Termite, Cryptotermes domesticus Haviland (Blattodea: Kalotermitidae), in South Korea)

  • 김민중;이준기;남영우;박용환
    • 한국응용곤충학회지
    • /
    • 제62권3호
    • /
    • pp.215-220
    • /
    • 2023
  • 최근 국내에서 외래 곤충인 (가칭)마른나무흰개미(Cryptotermes domesticus)가 서울에 위치한 주택에서 발견되었다. 이 종은 국내에 정착할 경우 잠재적으로 목재나 목조건물에 피해를 줄 수 있어 시급한 국내 발생 조사가 필요하다. 본 연구에서는 종 분포 모델 기법을 활용하여 마른나무흰개미의 정착 가능성과 관련된 기후적합성을 추정하는 것을 목표로 하였다. 문헌 자료를 바탕으로 전세계 분포 정보를 수집하고, 생물기후변수를 활용하여 4개의 모델링 알고리즘으로 기후적합성 예측 모델을 구동하였다. 개발한 모델들의 결과를 종합하여 최종적으로 마른나무흰개미의 평균 발생 확률로 표현되는 앙상블 모델을 개발하였다. 그 결과 마른나무흰개미는 열대 지방에서에서 해양성 기후를 보이는 연안이나 도서지역에서 기후적합성이 높을 것으로 예상되었다. 국내에서는 기후적합성이 전반적으로 낮을 것으로 추정되었다. 하지만, 마른나무흰개미의 정착 및 확산 가능성을 염두해두고, 최근 발생이 보고된 지점을 중심으로 정밀 역학 조사가 필요할 것으로 보인다.

원전 증기발생기 세관 결함 크기 예측을 위한 Bagging 신경회로망에 관한 연구 (A Study on Bagging Neural Network for Predicting Defect Size of Steam Generator Tube in Nuclear Power Plant)

  • 김경진;조남훈
    • 비파괴검사학회지
    • /
    • 제30권4호
    • /
    • pp.302-310
    • /
    • 2010
  • 본 논문에서는 원자력 발전소 증기발생기 세관에 발생할 수 있는 결함의 크기측정에 사용되는 Bagging 신경회로망에 대한 연구를 수행하였다. Bagging은 부트스트랩(bootstrap) 샘플링에 기반을 둔 추정기 앙상블을 생성하는 방법이다. 증기발생기 세관의 결함 크기측정을 위하여 다양한 폭과 깊이를 갖는 4가지 결함패턴의 eddy current testing 신호를 생성하였다. 그 다음, 단일 신경회로망(single neural network; SNN)과 Bagging 신경회로망(Bagging neural network; BNN)을 구성하여 각 결함의 폭과 깊이를 추정하였다. SNN과 BNN 추정성능은 최대오차를 이용해서 측정하였다. 실험결과, 결함 깊이 추정시의 SNN과 BNN 최대오차는 0.117mm와 0.089mm 이었다. 또한, 결함 폭 추정 시에는 SNN과 BNN 최대오차는 0.494mm와 0.306mm 이었다. 이러한 실험결과는 BNN 추정성능이 SNN 추정성능보다 우수하다는 것을 보여준다.

Stacking Ensemble Learning을 활용한 블록 탑재 시수 예측 (A Study on the Work-time Estimation for Block Erections Using Stacking Ensemble Learning)

  • 권혁천;유원선
    • 대한조선학회논문집
    • /
    • 제56권6호
    • /
    • pp.488-496
    • /
    • 2019
  • The estimation of block erection work time at a dock is one of the important factors when establishing or managing the total shipbuilding schedule. In order to predict the work time, it is a natural approach that the existing block erection data would be used to solve the problem. Generally the work time per unit is the product of coefficient value, quantity, and product value. Previously, the work time per unit is determined statistically by unit load data. However, we estimate the work time per unit through work time coefficient value from series ships using machine learning. In machine learning, the outcome depends mainly on how the training data is organized. Therefore, in this study, we use 'Feature Engineering' to determine which one should be used as features, and to check their influence on the result. In order to get the coefficient value of each block, we try to solve this problem through the Ensemble learning methods which is actively used nowadays. Among the many techniques of Ensemble learning, the final model is constructed by Stacking Ensemble techniques, consisting of the existing Ensemble models (Decision Tree, Random Forest, Gradient Boost, Square Loss Gradient Boost, XG Boost), and the accuracy is maximized by selecting three candidates among all models. Finally, the results of this study are verified by the predicted total work time for one ship among the same series.

Development of AI-based Smart Agriculture Early Warning System

  • Hyun Sim;Hyunwook Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권12호
    • /
    • pp.67-77
    • /
    • 2023
  • 본 연구는 스마트팜 환경에서 진행된 혁신적인 연구로, 딥러닝을 기반으로 한 질병 및 해충 탐지 모델을 개발하고, 이를 지능형 사물인터넷(IoT) 플랫폼에 적용하여 디지털 농업 환경 구현의 새로운 가능성을 탐색하였다. 연구의 핵심은 Pseudo-Labeling, RegNet, EfficientNet 등 최신 ImageNet 모델과 전처리 방식을 통합하여, 복잡한 농업 환경에서 다양한 질병과 해충을 높은 정확도로 탐지하는 것이었다. 이를 위해 앙상블 학습 기법을 적용하여 모델의 정확도와 안정성을 극대화했으며, 평균 정밀도(mAP), 정밀도, 재현율, 정확도, 박스 손실 등의 다양한 성능 지표를 통해 모델을 평가하였다. 또한, SHAP 프레임워크를 활용하여 모델의 예측 기준에 대한 깊은 이해를 도모하였고, 이를 통해 모델의 결정 과정을 보다 투명하게 만들었다. 이러한 분석은 모델이 어떻게 다양한 변수들을 고려하여 질병 및 해충을 탐지하는지에 대한 중요한 통찰력을 제공하였다.

공간분포모델을 활용한 사료작물 이탈리안 라이그라스(Lolium multiflorum L.)의 재배적지 변동예측연구 (A Study on the Prediction of Suitability Change of Forage Crop Italian Ryegrass (Lolium multiflorum L.) using Spatial Distribution Model)

  • 김현애;현신우;김광수
    • 한국농림기상학회지
    • /
    • 제16권2호
    • /
    • pp.103-113
    • /
    • 2014
  • 우리나라에서의 사료작물 생산면적이 제한적이기 때문에 미래의 기후조건에서 최적 재배 가능 지역을 중심으로 이탈리안 라이그라스와 같은 사료작물의 생산체계를 설계하는 것이 필요하다. 특히, 한반도를 대상으로 이탈리안 라이그라스의 재배 가능지역을 파악하는 것이 미래를 대비한 정책 결정에 도움을 줄 수 있다. 이번 연구에서는 기후자료를 기반으로 작물의 재배적합도를 예측하는 EcoCrop 모델을 사용하여 현재(1950~2000), 2020년대(2010~2039), 2050년대(2040~2069), 2080년대(2070~2099)의 이탈리안 라이그라스의 재배 가능지역을 분석하였다. 또한, 전구 기후모델인 CCCMA, CSIRO, UKMO-HadCM3, UKMO-HadGEM1, 그리고 NCAR 모델 등으로부터 얻어진 규모축소 기후자료를 활용한 앙상블 예측기법을 재배적합도 예측에 적용하여 미래 기후변화 조건에서의 불확실도를 낮추는 것을 시도하였다. 2050년대까지 이탈리안 라이그라스의 재배적합도는 남한과 북한 모두 크게 상승할 것으로 예측되었다. 예를 들어, 현재 기후조건에서 충청북도와 강원도에서 평균적인 재배적합도가 76.75와 44.77으로 낮게 예측되었지만 2020년대에 각각 16.2% 및 46.1% 증가하여 2080년대에는 모든 행정구역에서 평균적인 재배적합도가 90이상으로 나타날 것으로 예측되었다. 반면, 2080년대에 16개의 시 도 중 11개의 지역에서 재배적합도가 감소할 것으로 예측되었다. 북한의 경우 현재 기후조건에서 평균적인 재배적합도는 28.40으로 평균적인 재배적합도가 낮았다. 그러나 기후변화가 진행되면서 재배적합도가 크게 증가하여 2080년대에는 14개 행정구역 중 10곳에서 평균적인 재배적합도가 80 이상일 것으로 예측되었다. 특히 나선, 신의주 및 개성 인근 지역의 재배적합도가 크게 증가할 것으로 예측되어 이를 중심으로 수출을 위한 사료 생산단지 및 축산단지 조성이 가능할 것으로 예상되었다. 현재, 내한성 향상을 중심으로 이탈리안 라이그라스의 새로운 품종들이 개발 및 보급되고 있어 이러한 신품종을 대상으로 한 이모작 가능지를 구분하기 위해 품종별로 최적화된 모수를 활용한 재배적합도 예측지도를 작성연구가 연구가 필요할 것으로 사료되었다.

잡음 학생 모델 기반의 자가 학습을 활용한 음향 사건 검지 (Sound event detection model using self-training based on noisy student model)

  • 김남균;박창수;김홍국;허진욱;임정은
    • 한국음향학회지
    • /
    • 제40권5호
    • /
    • pp.479-487
    • /
    • 2021
  • 본 논문에서는 잡음 학생 모델 기반의 자가 학습을 활용한 음향 사건 검지 기법을 제안한다. 제안된 음향 사건 검지 모델은 두 단계로 구성된다. 첫 번째 단계에서는 잔차 합성곱 순환 신경망(Residual Convolutional Recurrent Neural Network, RCRNN)을 훈련하여 레이블이 지정되지 않은 비표기 데이터셋의 레이블 예측에 활용한다. 두 번째 단계에서는 세 가지 잡음 종류를 적용한 잡음 학생 모델을 자가학습 기법으로 반복하여 학습한다. 여기서 잡음 학생 모델은 SpecAugment, Mixup, 시간-주파수 이동을 활용한 특징 잡음, 드롭아웃을 활용한 모델 잡음, 그리고 semi-supervised loss function을 적용한 레이블 잡음을 활용하여 학습된다. 제안된 음향 사건 검지 모델의 성능은 Detection and Classification of Acoustic Scenes and Events(DCASE) 2020 Challenge Task 4의 validation set으로 평가하였다. DCASE 2020 챌린지 데이터셋의 baseline 및 최상위 랭크된 모델과 이벤트 단위 F1 점수 성능을 비교한 결과, 제안된 음향 사건 검지 모델이 단일 모델과 앙상블 모델에서 최상위 모델 대비 F1 점수를 각각 4.6 %와 3.4 % 향상시켰다.

ECMWF 계절 기상 전망 기술의 정확성 및 국내 유역단위 적용성 평가 (Assessment of ECMWF's seasonal weather forecasting skill and Its applicability across South Korean catchments)

  • 이용신;강신욱
    • 한국수자원학회논문집
    • /
    • 제56권9호
    • /
    • pp.529-541
    • /
    • 2023
  • 기후변화에 따른 가뭄 등 극한 기상을 예측하기 위해, 최근 전 세계적으로 GCMs 모델에 기반하여 향후 7개월까지를 전망하는 계절 기상 전망(Seasonal Forecasts) 기술이 꾸준히 관심을 받고 있다. 그러나 국내에서의 연구 및 적용사례는 많지 않으며, 특히 유역단위에서 그 활용성에 대해서는 검증이 필요하다. 따라서 본 연구에서는 국내 12개 다목적댐 유역에 대해 2011년부터 2020년까지 계절 기상 전망의 정확성을 과거 45년간의 기상 자료(climatology)와 비교하여 평가하였다. 본 연구에서는 ECMWF에서 제공하는 계절 기상 전망의 인자로 향후 수문전망에 활용성이 높은 강수, 기온 그리고 증발산을 선정하였고, 앙상블 전망의 정확성 평가를 위해 Continuous Ranked Probability Skill Score (CRPSS) 기법을 적용하였다. 또한, 계절 기상 전망에 대해 선형 편의 보정기법(Linear scaling)을 적용하여 그 효과를 평가하였다. 연구결과, 계절 기상 전망이 향후 1개월 간은 climatology와 유사한 정확도를 보이나 전망 리드타임이 증가함에 따라 그 정확도가 크게 낮아지는 특성을 나타냈다. Climatology와 비교하여, 계절적으로는 Dry season보다는 Wet season이 더 나은 결과를 보였으며, 특히 건조했던 2015년과 2017년의 Wet season에서는 장기간에 걸친 전망 정확도가 모두 높게 나타났다.

회사채 신용등급 예측을 위한 SVM 앙상블학습 (Ensemble Learning with Support Vector Machines for Bond Rating)

  • 김명종
    • 지능정보연구
    • /
    • 제18권2호
    • /
    • pp.29-45
    • /
    • 2012
  • 회사채 신용등급은 투자자의 입장에서는 수익률 결정의 중요한 요소이며 기업의 입장에서는 자본비용 및 기업 가치와 관련된 중요한 재무의사결정사항으로 정교한 신용등급 예측 모형의 개발은 재무 및 회계 분야에서 오랫동안 전통적인 연구 주제가 되어왔다. 그러나, 회사채 신용등급 예측 모형의 성과와 관련된 가장 중요한 문제는 등급별 데이터의 불균형 문제이다. 예측 문제에 있어서 데이터 불균형(Data imbalance) 은 사용되는 표본이 특정 범주에 편중되었을 때 나타난다. 데이터 불균형이 심화됨에 따라 범주 사이의 분류경계영역이 왜곡되므로 분류자의 학습성과가 저하되게 된다. 본 연구에서는 데이터 불균형 문제가 존재하는 다분류 문제를 효과적으로 해결하기 위한 다분류 기하평균 부스팅 기법 (Multiclass Geometric Mean-based Boosting MGM-Boost)을 제안하고자 한다. MGM-Boost 알고리즘은 부스팅 알고리즘에 기하평균 개념을 도입한 것으로 오분류된 표본에 대한 학습을 강화할 수 있으며 불균형 분포를 보이는 각 범주의 예측정확도를 동시에 고려한 학습이 가능하다는 장점이 있다. 회사채 신용등급 예측문제를 활용하여 MGM-Boost의 성과를 검증한 결과 SVM 및 AdaBoost 기법과 비교하여 통계적으로 유의적인 성과개선 효과를 보여주었으며 데이터 불균형 하에서도 벤치마킹 모형과 비교하여 견고한 학습성과를 나타냈다.