• 제목/요약/키워드: 딥러닝 기반 예측 알고리즘

검색결과 140건 처리시간 0.029초

딥러닝 시계열 알고리즘 적용한 기업부도예측모형 유용성 검증 (Corporate Default Prediction Model Using Deep Learning Time Series Algorithm, RNN and LSTM)

  • 차성재;강정석
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.1-32
    • /
    • 2018
  • 본 연구는 경제적으로 국내에 큰 영향을 주었던 글로벌 금융위기를 기반으로 총 10년의 연간 기업데이터를 이용한다. 먼저 시대 변화 흐름에 일관성있는 부도 모형을 구축하는 것을 목표로 금융위기 이전(2000~2006년)의 데이터를 학습한다. 이후 매개 변수 튜닝을 통해 금융위기 기간이 포함(2007~2008년)된 유효성 검증 데이터가 학습데이터의 결과와 비슷한 양상을 보이고, 우수한 예측력을 가지도록 조정한다. 이후 학습 및 유효성 검증 데이터를 통합(2000~2008년)하여 유효성 검증 때와 같은 매개변수를 적용하여 모형을 재구축하고, 결과적으로 최종 학습된 모형을 기반으로 시험 데이터(2009년) 결과를 바탕으로 딥러닝 시계열 알고리즘 기반의 기업부도예측 모형이 유용함을 검증한다. 부도에 대한 정의는 Lee(2015) 연구와 동일하게 기업의 상장폐지 사유들 중 실적이 부진했던 경우를 부도로 선정한다. 독립변수의 경우, 기존 선행연구에서 이용되었던 재무비율 변수를 비롯한 기타 재무정보를 포함한다. 이후 최적의 변수군을 선별하는 방식으로 다변량 판별분석, 로짓 모형, 그리고 Lasso 회귀분석 모형을 이용한다. 기업부도예측 모형 방법론으로는 Altman(1968)이 제시했던 다중판별분석 모형, Ohlson(1980)이 제시한 로짓모형, 그리고 비시계열 기계학습 기반 부도예측모형과 딥러닝 시계열 알고리즘을 이용한다. 기업 데이터의 경우, '비선형적인 변수들', 변수들의 '다중 공선성 문제', 그리고 '데이터 수 부족'이란 한계점이 존재한다. 이에 로짓 모형은 '비선형성'을, Lasso 회귀분석 모형은 '다중 공선성 문제'를 해결하고, 가변적인 데이터 생성 방식을 이용하는 딥러닝 시계열 알고리즘을 접목함으로서 데이터 수가 부족한 점을 보완하여 연구를 진행한다. 현 정부를 비롯한 해외 정부에서는 4차 산업혁명을 통해 국가 및 사회의 시스템, 일상생활 전반을 아우르기 위해 힘쓰고 있다. 즉, 현재는 다양한 산업에 이르러 빅데이터를 이용한 딥러닝 연구가 활발히 진행되고 있지만, 금융 산업을 위한 연구분야는 아직도 미비하다. 따라서 이 연구는 기업 부도에 관하여 딥러닝 시계열 알고리즘 분석을 진행한 초기 논문으로서, 금융 데이터와 딥러닝 시계열 알고리즘을 접목한 연구를 시작하는 비 전공자에게 비교분석 자료로 쓰이기를 바란다.

딥러닝을 활용한 자산분배 시스템 (Portfolio System Using Deep Learning)

  • 김성수;김종인;정기철
    • 한국산업정보학회논문지
    • /
    • 제24권1호
    • /
    • pp.23-30
    • /
    • 2019
  • 딥러닝 네트워크 기반의 알고리즘의 발전으로 인공지능은 전세계적으로 빠른 성장세를 보이고 있다. 그 중 금융은 인공지능이 가장 많이 활용될 분야로 예상되고 있으며 최근 많은 연구가 되고 있다. 기존의 딥러닝을 사용한 재무 전략은 단일 종목에 대한 주가 예측에만 치중되어 있어 변동성에 취약하다. 따라서 본 연구는 딥러닝을 이용하여 펀드 구성 종목을 산출하고 종목들을 분산투자하여 ETF 상품을 구성하는 모델을 제안한다. 실험 결과로 제안하는 모델을 통해 코스피 100 지수를 대상으로 하는 성능을 분석하며 수익률 또는 안정성 측면에서 향상된 결과를 확인하였다.

딥러닝 알고리즘을 활용한 천식 환자 발생 예측에 대한 연구 (A Study on Asthmatic Occurrence Using Deep Learning Algorithm)

  • 성태응
    • 한국콘텐츠학회논문지
    • /
    • 제20권7호
    • /
    • pp.674-682
    • /
    • 2020
  • 최근 산업화 및 인구과밀화로 인해 대기오염에 대한 문제가 세계적 관심사로 대두되고 있다. 대기 오염은 인간의 건강에 다양한 악영향을 초래할 수 있는데, 그 중 본 연구에서 관심을 둔 천식과 같은 호흡계 질환은 직접적 영향을 받을 수 있다. 기존의 연구에서는 임상 데이터를 활용하여 상대적으로 적은 표본을 기반으로 천식과 같은 질환에 대기 오염 인자가 어떠한 영향을 미치는지를 파악하였다. 이는 수집 표본 별 일관성이 없는 결과를 초래할 소지가 다분하며, 의료계 종사자 이외에는 연구의 시도가 어렵다는 점에서 큰 한계를 가지고 있다. 본 연구에서는 정부에서 공개하는 대기 환경 데이터와 천식 발병 빈도 수에 대한 데이터를 기반으로, 실제 천식 발병 빈도를 예측하는 것에 연구의 주안점을 두었다. 본 연구는 시차를 적용한 피어슨 상관계수를 통해 각 대기오염 인자가 천식 발병에 어느 정도의 시차를 가지고 유의한 영향을 주는지를 검증하였다. 검증결과를 기반으로 구축된 학습데이터는 딥러닝 알고리즘에 활용되며, 천식 발병 빈도의 예측에 최적화 된 모델을 설계하였다. 모델의 평균 대비 오차율은 약 11.86%로 타 머신러닝 기반의 알고리즘 대비 우수한 성능을 나타냄을 확인하였다. 제안한 모델은 국가 보험 체계 및 보건 예산 관리에서의 효율화 및 병원에서의 의료 인력 배치 및 수급에의 효율성 또한 제공할 수 있다. 또한 만성 천식 질환자에 대한 대기 환경별 발병 위험에 대한 조기 경보를 통해 국민 건강 증진에 기여할 수 있다.

LSTM 기반 딥러닝 알고리즘을 적용한 상수도시스템 누수인지 모델 개발 (Development of leakage detection model in water distribution networks applying LSTM-based deep learning algorithm)

  • 이찬욱;유도근
    • 한국수자원학회논문집
    • /
    • 제54권8호
    • /
    • pp.599-606
    • /
    • 2021
  • 지하에 매설되어 있는 사회기반시설물 중 하나인 상수도시스템은 정수처리된 물을 수용가에게 수송 및 공급하는 기능을 가지고 있다. 최근들어, 계측능력이 향상됨에 따라 유량데이터에 의한 딥러닝기법을 적용한 누수 인지 및 탐지와 관련한 연구가 다수 수행되고 있다. 본 연구에서는 현재까지 상수도 분야에 적용되지 않은 LSTM 기반의 딥러닝 알고리즘을 활용하여 누수발생에 대한 인지 모형을 개발하였다. 가정한 데이터를 기반으로 모형에 대한 검증을 수행하였으며 2% 이상의 누수가 발생한 경우에 대하여 모두 인식이 가능한 것으로 나타났다. 향후, 제안된 모형을 토대로 유량 데이터 예측부분에 있어서 보다 정밀한 결과가 도출 될 수 있을것으로 판단된다.

정확한 댐유입량 예측을 위한 SWLSTM 개발 (Accurate dam inflow predictions using SWLSTM)

  • 김종호;쩐득충
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.292-292
    • /
    • 2021
  • 최근 데이터 과학의 획기적인 발전으로 딥러닝(Deep Learning) 알고리즘이 개발되어 다양한 분야에 널리 적용되고 있다. 본 연구에서는 인공신경망 중 하나인 LSTM(Long-Short Term Memory) 네트워크를 기반으로 정확한 댐유입량 예측을 수행하는 SWLSTM 모델을 제안하였다. SWLSM은 모델의 정확도를 개선하기 위해 세 가지 주요 아이디어를 채택하였다. (1) 통계적 속성 (PACF) 및 교차 상관 함수(CCF)를 사용하여 적절한 입력 변수와 시퀀스 길이를 결정하였다. (2) 선택된 입력 예측 변수 시계열을 웨이블릿 변환(WT)을 사용하여 하위 시계열로 분해한다. (3) k-folds cross validation 및 random search 기법을 사용하여 LSTM의 하이퍼 매개변수들을 효율적으로 최적화하고 검증한다. 제안된 SWLSTM의 효과는 한강 유역 5개 댐의 시단위/일단위/월단위 유입량을 예측하고 과거 자료와 비교함으로써 검증하였다. 모델의 정확도는 다양한 평가 메트릭(R2, NSE, MAE, PE)이 사용하였으며, SWLSTM은 모든 경우에서 LSTM 모델을 능가하였다. (평가 지표는 약 30 ~ 80 % 더 나은 성능을 보여줌). 본 연구의 결과로부터, 올바른 입력 변수와 시퀀스 길이의 선택이 모델 학습의 효율성을 높이고 노이즈를 줄이는 데 효과적임을 확인하였다. WT는 홍수 첨두와 같은 극단적인 값을 예측하는 데 도움이 된다. k-folds cross validation 및 random search 기법을 사용하면 모델의 하이퍼 매개변수를 효율적으로 설정할 수 있다. 본 연구로부터 댐 유입량을 정확하게 예측한다면 정책 입안자와 운영자가 저수지 운영, 계획 및 관리에 도움이 될 것이다.

  • PDF

전자의무기록 데이터에서의 적대적 생성 알고리즘 기반 결측값 대치 알고리즘 성능분석 (Performance Evaluation of an Imputation Method based on Generative Adversarial Networks for Electric Medical Record)

  • 조용연;정민영;황보율
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.879-881
    • /
    • 2019
  • 전자의무기록 (EMR)과 같은 의료 현장에서 수집되는 대용량의 데이터는 임상 해석적으로 잠재가치가 크고 활용도가 다양하나 결측값이 많아 희소성이 크다는 한계점이 있어 분석이 어렵다. 특히 EMR의 정보수집과정에서 발생하는 결측값은 무작위적이고 임의적이어서 분석 정확도를 낮추고 예측 모델의 성능을 저하시키는 주된 요인으로 작용하기 때문에, 결측치 대체는 필수불가결하다. 최근 통상적으로 활용되어지던 통계기반 알고리즘기반의 결측치 대체 알고리즘보다는 딥러닝 기술을 활용한 알고리즘들이 새로이 등장하고 있다. 본 논문에서는 Generative Adversarial Network를 기반한 최신 결측값 대치 알고리즘인 Generative Adversarial Imputation Nets을 적용하여 EMR에서의 성능을 분석해보고자 하였다.

딥러닝 기반 고속철도교량의 주행안전성 및 승차감 예측 (Running Safety and Ride Comfort Prediction for a Highspeed Railway Bridge Using Deep Learning)

  • 김민수;최상현
    • 한국전산구조공학회논문집
    • /
    • 제35권6호
    • /
    • pp.375-380
    • /
    • 2022
  • 고속철도 교량은 열차 하중에 의한 공진으로 인한 동적응답 증폭의 위험이 존재하므로 설계기준에 따른 동적해석을 통한 주행안전성 및 승차감 검토를 반드시 수행하여야 한다. 그러나 주행안전성 및 승차감 산정 절차는 열차의 종류별로 임계속도를 포함하여 설계속도의 110km/h까지 10km/h 간격으로 동적해석을 일일이 수행해야 하므로 많은 시간과 경비가 소요된다. 이 연구에서는 딥러닝 알고리즘을 활용하여 별도의 동적해석 없이 주행안전성 및 승차감을 사전에 예측할 수 있는 딥러닝 기반 예측 시스템 개발하였다. 제안된 시스템은 철도교량의 열차별, 속도별 동적해석 결과를 학습한 후 학습 완료된 신경망을 기반으로 한 예측 시스템이며, 열차속도, 교량 특성 등의 입력파라미터에 따른 주행안전성 및 승차감 산정 결과를 사전에 예측할 수 있다. 제안된 시스템의 성능을 확인하기 위하여 단경간 직선 단순보 교량을 대상으로 한 주행안전성 및 승차감 예측을 수행하였고, 주행안전성 및 승차감 산정을 위한 상판 연직변위 및 상판 연직가속도를 높은 정확도로 예측할 수 있음을 확인하였다.

인공 신경망 회귀 모델을 활용한 인버터 기반 태양광 발전량 예측 알고리즘 (Inverter-Based Solar Power Prediction Algorithm Using Artificial Neural Network Regression Model)

  • 박건하;임수창;김종찬
    • 한국전자통신학회논문지
    • /
    • 제19권2호
    • /
    • pp.383-388
    • /
    • 2024
  • 본 논문은 전라남도에서 측정한 태양광 발전 데이터를 기반으로 발전량 예측값을 도출하기 위한 연구이다. 발전량 측정을 위해 인버터에서 직류, 교류, 환경데이터와 같은 다변량 변수를 측정하였고, 측정값의 안정성과 신뢰성 확보를 위한 전처리 작업을 수행하였다. 상관관계 분석은 부분자기상관함수(PACF: Partial Autocorrelation Function)을 활용하여 시계열 데이터에서 발전량과 상관성이 높은 데이터만을 예측을 위해 사용하였다. 태양광 발전량 예측을 위해 딥러닝 모델을 이용하여 발전량을 측정했고, 예측 정확도를 높이기 위해 각 다변량 변수의 상관관계 분석 결과를 이용하였다. 정제된 데이터를 활용한 학습은 기존 데이터를 그대로 사용했을 때 보다 안정되었고, 상관관계 분석 결과를 반영하여 다변량 변수 중 상관성이 높은 변수만을 활용하여 태양광 발전량 예측 알고리즘을 개선하였다.

설비 이상탐지를 위한 딥러닝 알고리즘 개발 (Development of a Deep Learning Algorithm for Anomaly Detection of Manufacturing Facility)

  • 김민희;진교홍
    • 한국정보통신학회논문지
    • /
    • 제26권2호
    • /
    • pp.199-206
    • /
    • 2022
  • 제품을 생산하는 설비의 고장이나 이상 현상은 곧 제품의 결함 및 생산라인 가동 중단으로 이어져 제조 업체의 막대한 경제적 손실의 원인이 된다. 스마트팩토리 서비스의 확산으로 공장에서 많은 양의 데이터가 수집됨에 따라, 이를 활용하여 제조 현장의 효율이나 제조 설비의 고장 예측 및 진단을 위한 인공지능 기반의 연구가 활발히 이어지고 있다. 하지만 정상과 이상을 구분 짓는 레이블 정보가 명확하지 않고 이상에 대한 극심한 클래스 불균형을 가지는 제조 데이터의 특징으로 인하여 분류 모델이나 이상탐지 모델의 개발에는 큰 어려움이 존재한다. 본 논문에서는 딥러닝 모델의 재구성 손실값을 이용하여 제조 설비의 이상탐지를 위한 딥러닝 알고리즘을 제안하고 성능을 분석하였다. 해당 알고리즘은 이상 데이터를 제외한 설비의 제조 데이터, 즉 정상 데이터에만 의존하여 이상을 감지한다.

R기반의 딥 러닝을 이용한 데이터 예측 프로세스에 관한 연구 (A novel on Data Prediction Process using Deep Learning based on R)

  • 정세훈;김종찬;박홍준;소원호;심춘보
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2015년도 춘계학술대회
    • /
    • pp.421-422
    • /
    • 2015
  • 최근 신경망 분석의 향상된 성능을 보여주는 심화 신경망 기술인 딥 러닝(Deep learning)이 각광을 받고 있는 실정이다. 이에 본 논문에서는 딥 러닝을 기반으로 분석 시각화 툴인 R을 이용한 특정 변수의 오류율 검증과 빅 데이터 예측 프로세스 설계를 제안한다. 딥 러닝에 적용된 알고리즘은 RBM(Restricted Boltzmann Machine)을 적용하였다. 특정 입력 변수에 대한 종속 변수 구분 후 각 종속 변수의 가중치를 적용한다. RBM 알고리즘을 통해 최종 데이터의 검증 및 오류율 검출과정을 R 프로그래밍에 적용하여 설계한다.

  • PDF