• 제목/요약/키워드: Combination 예측 모델

검색결과 172건 처리시간 0.031초

양방향 순환신경망 임베딩을 이용한 리그오브레전드 승패 예측 (Predicting Win-Loss of League of Legends Using Bidirectional LSTM Embedding)

  • 김철기;이수원
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권2호
    • /
    • pp.61-68
    • /
    • 2020
  • e-sports는 최근 꾸준한 성장을 이루면서 세계적인 인기 스포츠 종목이 되었다. 본 논문에서는 e-sports의 대표적인 게임인 리그오브레전드 경기 시작 단계에서의 승패 예측 모델을 제안한다. 리그오브레전드에서는 챔피언이라고 불리는 게임 상의 유닛을 플레이어가 선택하여 플레이하게 되는데, 각 플레이어의 선택을 통하여 구성된 팀의 챔피언 능력치 조합은 승패에 영향을 미친다. 제안 모델은 별다른 도메인 지식 없이 플레이어 단위 챔피언 능력치를 팀 단위 챔피언 능력치로 임베딩한 Bidirectional LSTM 임베딩 기반 딥러닝 모델이다. 기존 분류 모델들과 비교 결과 팀 단위 챔피언 능력치 조합을 고려한 제안 모델에서 58.07%의 가장 높은 예측 정확도를 보였다.

도메인 조합 기반 단백질-단백질 상호작용 확률 예측 틀 (A Domain Combination-based Probabilistic Framework for Protein-Protein Interaction Prediction)

  • 한동수;서정민;김홍숙;장우혁
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제10권4호
    • /
    • pp.299-308
    • /
    • 2004
  • 최근 단백질 및 도메인과 관련된 방대한 양의 데이타들이 인터넷상에 공표되고 축적됨에 따라, 단백질간의 상호작용에 대한 예측 시스템의 필요성이 제기되고 있다. 본 논문에서는 이러한 데이타를 이용하여 계산적으로 도메인 조합 쌍에 기반하여 단백질의 상호작용 확률을 예측하는 새로운 단백질 상호작용 예측 시스템을 제안한다. 제안된 예측 시스템에서는 기존의 도메인 쌍(domain pair)의 제약성을 극복하기 위하여 도메인 조합(domain combination)과 도메인 조합 쌍(domain combination pair)의 개념이 새롭게 도입하였다. 그리고 도메인 조합 쌍(domain combination pair 또는 dc-pair)을 단백질 상호작용의 기본 단위로 간주하고 예측을 시도한다. 예측 시스템은 크게 예측 준비 과정과 서비스 과정으로 구성되어 있다. 예측 준비 과정에서는 상호작용이 있는 것으로 알려진 단백질 쌍 집합과 상호작용이 없는 것으로 추정되는 단백질 도메인 쌍 집합으로부터 각각 도메인 조합 정보와 그 출현 빈도를 추출한다. 추출된 정보들은 출현 확률 배열(Appearance Probability Matrix 또는 AP matrix)로 불리는 배열 구조에 저장된다. 논문에서는 출현 확률 배열에 기반을 두어, 단백질-단백질 상호작용을 예측하는 확률식 PIP(Primary Interaction Probability)를 고안하고, 고안된 확률식을 이용하여, 상호작용이 있는 것으로 알려진 단백질 쌍 집합과 상호작용이 없는 것으로 추정되는 단백질 도메인 쌍 집합의 확률 값 분포를 생성시킨다. 예측서비스 과정에서는 예측 준비 과정에서 얻어진 분포와 확률식을 이용하여 임의의 단백질 쌍의 상호작용 확률을 계산한다. 예측 모델의 유효성은 효모(yeast)에서 상호작용이 있는 것으로 보고된 단백질 쌍 집합과 상호작용이 없는 것으로 추정되는 단백질 쌍 집합을 이용하여 검증하였다. DIP(Database of Inter-acting Proteins)의 상호작용이 있는 것으로 알려진 효모 단백질 쌍 집합의 80%를 학습 집단으로 사용했을 때, 86%의 sensitivity와 56%의 specificity를 나타내어, 도메인을 기반으로 한 기존의 예측 시스템에 비해서 우월한 예측 정확도를 보여주었다. 이와 같은 예측 정확도의 개선은 본 예측 시스템이 상호작용의 기본 단위로 dc-pair를 채택한 점과 분류를 위하여 새롭게 고안하여 사용한 PIP식이 유효했던 것으로 판단된다.

부도예측을 위한 확신 기반의 선택 접근법에서 앙상블 멤버 사이즈의 영향에 관한 연구 (Impact of Ensemble Member Size on Confidence-based Selection in Bankruptcy Prediction)

  • 김나라;신경식;안현철
    • 지능정보연구
    • /
    • 제19권2호
    • /
    • pp.55-71
    • /
    • 2013
  • 부도예측을 위한 지식기반시스템에서 모델은 실적에 영향을 끼치는 주요한 요인이다. 예측 모형의 개발에 있어 초기 연구들은 통계기법 및 인공지능기법들을 이용하여 최고 실적을 가지는 단일 모델을 만드는데 주력하였다. 1980년대 중반 이후에는 다수 기술의 통합(하이브리드), 더 나아가, 다수 모델의 결과의 결합(앙상블) 기법이 수많은 실험에서 개별 모델들보다 더 나은 결과를 보여왔다. 다수 모델들의 출력값들을 결합하여 한 개의 최종 예측값을 산출하는 앙상블 모델링에서 결합기법은 앙상블의 예측 정확도에 영향을 끼치는 중요한 이슈이다. 본 논문은 부도예측을 위한 앙상블 결합기법으로서 앙상블 멤버들이 다른 유형의 연속형 수치 출력값들을 산출하더라도 통일된 확신을 측정할 수 있는 확신 기반의 선택 접근법을 제안하고 이에 대한 앙상블 멤버 사이즈의 영향을 연구하였다. 실험 결과는 앙상블 멤버들의 생성 타입에 따라 결합하는 모델 개수를 변화시켰을 때 가장 많은 기본 모델들을 가지는 앙상블에서의 제안 결합기법이 부도예측에 가장 자주 사용되는 다른 방법들에 비해서도 가장 높은 실적을 가진다는 것을 보였다.

난류 부분예혼합 제트화염에 대한 난류 및 연소모델의 예측성능 검토 (Investigation of the Prediction Performance of Turbulence and Combustion Models for the Turbulent Partially-premixed Jet Flame)

  • 김유정;오창보
    • 한국화재소방학회논문지
    • /
    • 제28권4호
    • /
    • pp.35-43
    • /
    • 2014
  • 3개의 난류모델과 3개의 연소모델로 구성된 9개의 모델조합을 이용하여 난류 부분예혼합 제트화염 구조에 대한 수치적 예측성능을 검토하였다. 이용된 난류모델은 표준 ${\kappa}-{\varepsilon}$ 모델(SKE), Realizable ${\kappa}-{\varepsilon}$ 모델(RKE) 및 Reynolds 응력모델(RSM)이며 연소모델들은 Eddy Dissipation Concept 모델(EDC), Steady Laminar Flamelet 모델(SLF)와 Unsteady Laminar Flamelet 모델(ULF)이다. 9개 모델조합의 예측성능을 평가하기 위하여 실험결과가 알려진 Sandia D 화염인 난류 부분예혼합 제트화염을 대상으로 수치계산을 수행하였다. 얻어진 결과로서, 화염길이의 예측은 RSM > SKE > RKE순으로 길게 예측하였으며, RKE 난류모델은 화염길이를 너무 과소 예측하는 것을 확인하였다. RSM + SLF과 RSM + ULF의 조합은 화염길이는 비교적 잘 예측하였지만 하류에서의 화염온도를 과대 예측하였다. 반면에 SKE와 연소모델의 조합에서 SLF 또는 ULF 조합은 화염길이 뿐만 아니라 하류에서의 화염온도도 비교적 잘 예측하였는 것을 확인하였다. 반경방향 화염온도 및 화학종 농도분포를 비교해 본 결과 SKE와 연소모델의 조합이 가장 예측성능이 뛰어났으며 SKE + ULF의 조합이 가장 우수한 예측성능을 갖는 것을 확인하였다.

Stock prediction using combination of BERT sentiment Analysis and Macro economy index

  • Jang, Euna;Choi, HoeRyeon;Lee, HongChul
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권5호
    • /
    • pp.47-56
    • /
    • 2020
  • 주가지수는 한 국가의 경제 지표뿐만 아니라 투자판단의 지표로도 활용되므로 이를 예측하는 연구가 지속해서 진행되고 있다. 주가지수 예측을 하는 작업은 기술적, 경제적 및 심리적 요인 등이 반영된 것으로 예측의 정확도를 위해서는 복합적 요인을 고려해야 한다. 따라서 지수의 변동에 영향을 미치는 요인들을 선별하여 반영한 주가지수 예측모델연구가 필요하다. 이와 관련한 기존 연구에서는 시장의 변동을 만들어 내는 뉴스 정보 또는 거시 경제 지표를 각각 이용하거나, 몇 가지의 지표 조합만을 반영한 예측 연구가 대부분이었다. 따라서 본 연구에서는 미국 다우존스지수 예측을 위해 뉴스 정보의 감성 분석과 다양한 거시경제지표를 고려하여 효과적인 지표 조합을 제시하고자 한다. 뉴스 정보의 감성 분석은 최신 자연어처리 기법인 BERT와 NLTK VADER를 사용하고, 예측모델은 주가예측모델로 적합하다고 알려진 딥러닝 예측모델 LSTM을 적용하여 가장 효과적인 지표 조합을 제시했다.

풍력 발전을 위한 분산형 전원전력의 단기예측 모델 설계 (Design of short-term forecasting model of distributed generation power for wind power)

  • 송재주;정윤수;이상호
    • 디지털융복합연구
    • /
    • 제12권3호
    • /
    • pp.211-218
    • /
    • 2014
  • 최근 풍력에너지는 풍력터빈의 지능화뿐만 아니라 풍력 발전량 예측 부분에서 컴퓨팅과의 결합이 확대되고 있다. 풍력 발전은 기상상태에 따라 출력변동이 심하고 출력 예측이 어려워 효율적인 전력 생산을 위해서 신재생에너지를 전력계통에 안정적으로 연계할 수 있는 기술이 필요하다. 본 논문에서는 분산형 전원의 예측정보를 향상시켜 예측한 발전량과 실제 발전량의 차이를 최소화하기 위한 분산형 전원전력의 단기예측 모델을 설계한다. 제안된 모델은 단기 예측을 위해서 물리모델과 통계모델을 결합하였으며, 물리모델에서 생산된 격자별 예측값 중 예측 지점내 예측지점의 값을 추출하고, 물리 모델 예측값에 통계모델을 적용하여 발전량 산정을 위한 최종 기상 예측값을 생성한다. 또한, 제안 모델에서는 실시간 기상청 관측자료와 실시간 중기 예측 자료를 입력 자료로 사용하여 단기 예측모델을 수행한다.

TSK 퍼지 모델 이용한 효율적인 빅 데이터 PCP 예측 알고리즘 (An Efficient Algorithm for Big Data Prediction of Pipelining, Concurrency (PCP) and Parallelism based on TSK Fuzzy Model)

  • 김장영
    • 한국정보통신학회논문지
    • /
    • 제19권10호
    • /
    • pp.2301-2306
    • /
    • 2015
  • 정보가 급증함에 따라 큰 용량의 데이터를 전송해야 할 경우가 있다. 빅 데이터 전송 기술은 큰 용량의 데이터를 전송할 때 필요하다. 본 논문은 빅 데이터를 최적화된 속도로 전송하기 위해 GridFTP의 주된 기능인 PCP를 사용하며 또한 PCP 값을 예측하는 알고리즘을 개발한다. 또한, TSK 퍼지 모델을 적용하여 PCP에 따른 최적화된 전송률을 측정하는데 사용된다. 따라서, 제안된 TSK모델을 이용한 PCP 예측 알고리즘은 본 논문의 우수성을 입증한다.

앙상블 조합 방법에 따른 주가 예측 성능 비교 (Comparison of Stock Price Forecasting Performance by Ensemble Combination Method)

  • 양현성;박준;소원호;심춘보
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.524-527
    • /
    • 2022
  • 본 연구에서는 머신러닝(Machine Learning, ML)과 딥러닝(Deep Learning, DL) 모델을 앙상블(Ensemble)하여 어떠한 주가 예측 방법이 우수한지에 대한 연구를 하고자 한다. 연구에 사용된 모델은 하이퍼파라미터(Hyperparameter) 조정을 통하여 최적의 결과를 출력한다. 앙상블 방법은 머신러닝과 딥러닝 모델의 앙상블, 머신러닝 모델의 앙상블, 딥러닝 모델의 앙상블이다. 세 가지 방법으로 얻은 결과를 평균 제곱근 오차(Root Mean Squared Error, RMSE)로 비교 분석하여 최적의 방법을 찾고자 한다. 제안한 방법은 주가 예측 연구의 시간과 비용을 절약하고, 최적 성능 모델 판별에 도움이 될 수 있다고 사료된다.

공공청사 개산견적 정확도 향상을 위한 공사비 영향요인 분석 (Analysis of Impact Factors for the Improvement of Conceptual Cost Estimation Accuracy for Public Office Building)

  • 조영호;윤석헌
    • 한국건축시공학회지
    • /
    • 제21권5호
    • /
    • pp.495-506
    • /
    • 2021
  • 본 연구는 기획단계에서 이루어지는 개산견적 예측 모델의 정확도를 향상시키기 위하여 최적의 영향요인 조합을 제시하였다. 이에 기획단계에서 활용이 가능한 정량적인 영향요인을 선정하여 상관분석 통해 공사비에 가장 많은 영향을 주는 연면적을 중심으로 8가지의 영향요인 조합을 설정하였다. 8가지 영향요인 조합을 다중회귀분석을 통하여 VIF계수 및 회귀식을 도출하였다. VIF계수를 통해 연면적, 건축면적과 층 영향요인을 함께 사용할 경우 연면적과 건축면적 두 영향요인 간의 종속적인 관계를 확인하였다. 이에 독립성이 예측 모델 정확도의 관계를 분석하기 위하여 실 사례 프로젝트 10건을 회귀식에 대입하여 정확도를 분석하였다. 분석결과, 독립성이 확보가 안 된 영향요인 조합은 다른 영향요인에 비해 정확도 떨어지는 것을 확인할 수 있다. 따라서 최대한 많은 영향요인을 활용하는 것보다 최적의 영향요인 조합을 선정하는 것이 예측 모델의 정확도를 향상시킬 수 있다고 판단되며, 본 연구에서는 연면적과 건축면적을 활용하였을 경우 정확도가 가장 높은 것을 확인하였다.

Hybrid 시계열 모델을 활용한 스마트 공장 내 수요예측 알고리즘 개발 (Development of Demand Forecasting Algorithm in Smart Factory using Hybrid-Time Series Models)

  • 김명수;정종필
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권5호
    • /
    • pp.187-194
    • /
    • 2019
  • 시장의 급속한 변화와 개별 수요자 요구의 다양화로 인하여 전통적인 예측 방식은 기업의 요구사항을 충족시키기 어렵다. 다변화하는 생산 환경에서의 올바른 수요예측은 원활한 수율관리를 위한 중요한 요소이다. 현재 산업에서 보편적으로 사용되는 기존의 많은 예측 모델은 조금씩 기능에 제한이 있다. 제안된 모델은 각 모델이 개별적으로 더 잘 수행하는 부분을 고려하여 이러한 한계를 극복하도록 설계 되었다. 본 논문에서는 동적 프로세스 분석에 적합한 Grey Relational 분석을 통한 변수 추출을 하고, ARIMA 예측값을 통하여 산출되는 과거 수요 데이터의 특징을 포함하는 통계적으로 예측된 데이터를 생성한다. 이후, LSTM 모델과 결합하여 신경망모델이 가지는 특성인 유연성, 장기적인 의존성 문제를 피하도록 구성되어진 구조를 통하여 수요예측에 영향을 주는 많은 요인들을 특징을 반영하여 수요예측을 산출할 수 있다.