• 제목/요약/키워드: time-series forecasting

검색결과 597건 처리시간 0.028초

LSTM 모형을 이용한 지하수위 예측 평가 (Evaluating the groundwater prediction using LSTM model)

  • 박창희;정일문
    • 한국수자원학회논문집
    • /
    • 제53권4호
    • /
    • pp.273-283
    • /
    • 2020
  • 지하수자원의 변동성 및 취약성 평가를 위한 지하수위의 정량적 예측은 매우 중요하다. 이를 위해 다양한 시계열 분석 기법과 머신러닝 기법 등이 사용되어 왔다. 본 연구에서는 제주도 한경면 지역에 설치된 11개 지하수위 관측정의 일 수위자료를 대상으로 인공신경망 알고리즘의 하나인 Long short term memory (LSTM)에 기반한 예측 모델을 개발하였다. 제주도의 지하수위는 일반적으로 조석에 의한 자기상관성이 높고 강수에 의한 영향이 잘 반영되는 것으로 알려져 있다. 이러한 자료 특성을 고려한 입출력 텐서를 구성하기 위해 각 지하수 관측정의 수위변동 관측 자료와 같은 기간의 강수량 자료를 추가 입력자료로 선택하였다. 4계절을 나타내는 초기 365일 자료를 이용하여 LSTM 모델을 학습시켰으며 나머지 자료를 검증에 활용하여 예측 모델의 적합도를 평가하였다. 모델의 개발은 Python기반 딥러닝 프레임워크인 Keras를 이용하였고, 학습속도를 향상시키고자 NVIDIA CUDA 아키텍처를 도입하였다. LSTM 모델을 이용하여 지하수위 변화를 학습시키고 검증한 결과 결정계수가 평균 0.98로 나타나 개발된 예측모델의 적합성이 매우 높은 것으로 확인되었다.

전력선통신 시스템을 위한 딥 러닝 기반 전력량 예측 기법 (Power Consumption Prediction Scheme Based on Deep Learning for Powerline Communication Systems)

  • 이동구;김수현;정호철;선영규;심이삭;황유민;김진영
    • 전기전자학회논문지
    • /
    • 제22권3호
    • /
    • pp.822-828
    • /
    • 2018
  • 최근 전력 사용량의 증가로 인한 대규모 블랙아웃 등 에너지 문제가 대두되고 있으며, 이 문제들로 인해 전력 소비량 예측에 대한 정확도를 개선할 필요성이 부각되었다. 본 연구에서는 딥 러닝 기반의 전력 사용량 예측 실험을 통해서 실제 전력 소비량과 예측된 전력 소비량의 차이를 계산하고, 이를 통해서 전력 예비율을 기존 대비 하향 조정할 수 있는 가능성에 대해서 살펴본다. 예비 전력은 사용하지 않으면 손실되는 전력으로, 본 논문에서의 딥 러닝 기반 전력 소비량 예측을 통해서 여분의 전력을 과도하게 생산하지 않도록 오차범위 내에서 전력 예비율을 감소시킬 수 있는 기반을 마련할 수 있다. 본 논문에서 사용하는 딥 러닝 기법은 시계열 데이터를 처리하는 Long-Short-Term-Memory(LSTM) 구조의 학습 모델을 이용한다. 컴퓨터 시뮬레이션에서는 임의 생성한 전력 소비 데이터를 토대로 모델을 학습시키고, 학습된 모델을 토대로 전력 사용 예측값을 구하고 실제 전력 소비량 간에 오차를 계산한 결과 오차율 21.37%를 얻을 수 있었다. 이는 최근의 전력 예비율 45.9%를 고려할 때, 본 연구에서 제안한 전력 소비량 예측 알고리즘을 적용하는 경우 20% 포인트 정도의 예비율 감축이 가능하다.

기상자료(氣象資料)를 이용(利用)한 산불발생확률모형(發生確率模型)의 개발(開發) (Developing Forest Fire Occurrence Probability Model Using Meteorological Characteristics)

  • 최관;한상열
    • 한국산림과학회지
    • /
    • 제85권1호
    • /
    • pp.15-23
    • /
    • 1996
  • 본격적인 산림자원조성시대를 대비하기 위해서는 가장 큰 피해를 주고 있는 산불에 대한 과학적이고 합리적인 산불발생에 관한 예측모형의 개발이 필수적이다. 따라서 본 연구는 이에 대한 현실적인 방안으로서 대구 경상북도지역을 대상으로 하여 기상요인을 이용한 산불발생확률모형을 개발하고자 수행하였다. 이를 위해 먼저 산불발생일의 모든 기상자료들을 검토하여 이들 기상요인과 산화발생빈도와의 함수관계를 파악하여 의미 있는 기상요인을 규명하고, 이와 병행하여 국지적(局地的) 차원(次元)의 기상자료 획득이 현실적으로 불가능하기 때문에, 각 시 군별 산불발생일의 유사정도를 적절한 통계적 기법에 이용하여 정량화(定量化)하고 이를 토대로 조사대상지역 범주화하였다. 그 결과 산불발생에 영향을 미치는 기상요인으로는 상대습도, 일조시간, 강우후 경과일로 밝혀졌으며, 조사대상지역은 대구를 중심으로 한 중남부지역, 안동을 중심으로 한 북부지역, 포항을 중심으로 한 동부해안지역으로 구분되었다. 따라서 구분된 각 지역의 시계열(時系列) 기상자료를 이용하여 logistic과 probit model을 기초로 한 산불발생확률모형이 개발되었다. 모의 실효성을 검정하기 위하여 과거 기상자료를 대입한 결과 상당한 정도의 예측능력이 확인되어, 이를 이용한 효율적인 감시활동과 진화장비의 배치 등 산불예방활동의 효율성을 제고할 수 있을 것으로 기대된다.

  • PDF

패턴 매칭과 자동 규칙 생성에 기반한 2단계 주식 트레이딩 시스템 (A Two-Phase Stock Trading System based on Pattern Matching and Automatic Rule Induction)

  • 이종우;김유섭;김성동;이재원;채진석
    • 정보처리학회논문지B
    • /
    • 제10B권3호
    • /
    • pp.257-264
    • /
    • 2003
  • 일반적인 동적 매매 환경에서의 금융 예측 시스템은 주어진 목적을 최적으로 만족시키는 매매 형태를 찾고자 한다. 본 논문은 수익률을 극대화시키기 위하여 추출과 여과라는 두개의 단계로 구성된 새로운 형태의 주식 매매 시스템을 제안한다. 주식 추출 단계에서는 특정 시계열 패턴에 부합하는 주식을 추출하는데, 이러한 시계열 패턴은 기술 지표 값들의 조합으로 표현된다. 그리고 여과 단계에서는 추출된 주식 집합에 여과 규칙들을 적용하여 실제 매매 대상이 되는 주식들을 골라내는데, 여과 규칙은 과거 주가 데이터로부터 자동으로 유도되었다. 이를 위하여, 우리는 먼저 방대한 과거 일별 주가 데이터로부터 기술 지표 값들을 계산하였다. 계산된 기술 지표 값들은 시계열 패턴을 추출하는데 사용되고 이 값들의 이산화 구간들의 분포가 양성 및 음성 데이터들에 대하여 계산된다. 본 논문에서는 독특한 분포를 보이는 구간에 존재하는 기술 지표 값들이 주가의 향후 움직임을 예측하는 데 도움을 준다는 가정을 하였다. 그리고 여과 규칙은 바로 이런 독특한 분포를 보이는 구간 내의 데이터 값들로부터 자동으로 유도되었다. 우리는 시뮬레이션을 통해, 본 논문에서 제시한 트레이딩 시스템이 시장 평균 수익률을 상회한다는 사실을 확인함으로써 위의 가정에 대한 검증을 할 수 있었다.

시계열 자료를 이용한 등유수요함수 추정 (Estimation of kerosene demand function using time series data)

  • 정동원;황병소;유승훈
    • 에너지공학
    • /
    • 제22권3호
    • /
    • pp.245-249
    • /
    • 2013
  • 본 논문에서는 1981년부터 2012년까지의 시계열 자료를 이용하여 등유수요함수를 추정하고자 한다. 등유수요함수는 수용가의 등유 수요행태에 대한 정보를 제공하여 가격과 같은 주요 정책변수의 효과를 사전적으로 진단하는 데, 그리고 수요예측을 하는 데 유용하게 활용된다. 수요함수의 모수에 대한 강건한 추정치를 얻기 위해 최소자승법 추정법 뿐만 아니라 최소절대편차법 및 LMS 추정법을 사용하였다. 단기 가격탄력성 및 소득탄력성은 각각 -0.468 및 0.409로 추정되었으며 유의수준 1%에서 통계적으로 유의하였다. 단기 가격탄력성은 가격에 비탄력적인 등유수요의 특징을 보여주고 있으며, 단기 소득탄력성 역시 비탄력적으로 추정되어 소득 증감에 따라 등유의 수요가 크게 변화지 않음을 알 수 있다. 반면, 장기 가격탄력성 및 소득탄력성은 각각 -4.560 및 3.990으로 나타나 탄력적임을 알 수 있다.

딥러닝 기법을 활용한 컨테이너선 운임 예측 모델 (Estimation Model for Freight of Container Ships using Deep Learning Method)

  • 김동균;최정석
    • 해양환경안전학회지
    • /
    • 제27권5호
    • /
    • pp.574-583
    • /
    • 2021
  • 해운 시황을 예측하는 것은 중요한 문제이다. 투자 방식의 결정, 선대 편성 방법, 운임 등을 결정하기 위한 판단 근거가 되며 이는 기업의 이익과 생존에 큰 영향을 미치기 때문이다. 이를 위해 본 연구에서는 기계학습 모델인 장단기 메모리 및 간소화된 장단기 메모리 구조의 Gated Recurrent Units를 활용하여 컨테이너선의 해상운임 예측 모델을 제안한다. 운임 예측 대상은 중국 컨테이너 운임지수(CCFI)이며, 2003년 3월부터 2020년 5월까지의 CCFI 데이터를 학습에 사용하였다. 각 모델에 따라 2020년 6월 이후의 CCFI를 예측한 후 실제 CCFI와 비교, 분석하였다. 실험 모델은 하이퍼 파라메터의 설정에 따라 총 6개의 모델을 설계하였다. 또한 전통적인 분석 방법과의 성능을 비교하기 위해 ARIMA 모델도 실험에 추가하였다. 최적 모델은 두 가지 방법에 따라 선정하였다. 첫 번째 방법으로 각 모델을 10회 반복 실험하여 얻은 RMSE의 평균값이 가장 작은 모델을 선정하는 것이다. 두 번째 방법으로는 모든 실험에서 가장 낮은 RMSE를 기록한 모델을 선정하는 것이다. 실험 결과 전통적 시계열 예측모델인 ARIMA 모델과 비교하여 딥러닝 모델의 정확도를 입증하였으며, 정확한 예측모델을 통해 운임 변동의 위험관리 능력을 제고시키는데 기여했다. 반면 코로나19와 같은 외부 효과에 따른 운임의 급격한 변화상황이 발생한 경우, 예측모델의 정확도가 감소하는 한계점을 나타냈다. 제안된 모델 중 GRU1 모델이 두 가지 평가 방법 모두에서 가장 낮은 RMSE(69.55, 49.35)를 기록하며 최적 모델로 선정되었다.

시도별 출산력 예측에 대한 연구 (A study on forecasting provinces-specific fertility for Korea)

  • 김순영;오진호
    • 응용통계연구
    • /
    • 제32권2호
    • /
    • pp.229-263
    • /
    • 2019
  • 우리나라 출산율은 2000년 이후 빠르게 감소하고 있으며, 시도별 출산율도 대체적으로 동일한 추이를 나타내고 있다. 특히 시도별 출산율은 지방자치단체에서 저출산 고령화 대책, 교육 및 복지 등의 지역정책을 마련하기 위한 필수 자료이다. KOSTAT (2017) 시도별 출산율 추계 방법은 최근 10년(5년)간 전국 평균 출산율 정보를 이용하고 있으므로 이질적인 시도별 추이를 반영하는데 한계점이 있다. 따라서 본 연구에서는 시도별 출산율 추계에서 중요한 연도별 안정적 패턴 유지와 시도 출산율 차별성을 동시에 고려하는 개선방안을 제시하고자 한다. 본 연구에서 제안한 방법(제안 1, 2)는 연도별 출산율의 시계열 자료를 활용함으로써 연령별로 과거부터 현재까지의 출산율의 변동추이 및 전국과 시도의 차이를 반영할 수 있는 장점이 있다. 또한 제안3은 전국과의 관계는 고려하지 않고 시도의 연령별로 출산율의 과거부터 현재까지의 독자적 추이를 반영한다. 연구결과 우리나라의 경우 전국 출산율과 시도 출산율 패턴이 유사하므로 제안1, 2와 같이 시도 출산율 예측시 전국과의 관계를 이용하는 게 바람직하다 볼 수 있다. 이런 제안은 연령별 출산율 추이에 안정성을 개선시켰다.

검색어 빈도 데이터를 반영한 코로나 19 확진자수 예측 딥러닝 모델 (Predicting the Number of Confirmed COVID-19 Cases Using Deep Learning Models with Search Term Frequency Data)

  • 정성욱
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권9호
    • /
    • pp.387-398
    • /
    • 2023
  • 코로나 19 유행은 인류 생활 방식과 패턴에 큰 영향을 주었다. 코로나 19는 침 방울(비말)은 물론 공기를 통해서도 감염되기 때문에 가능한 대면 접촉을 피하고 많은 사람이 가까이 모이는 장소는 피할 것을 권고하고 있다. 코로나 19 환자와 접촉했거나 코로나 19 환자가 발생한 장소에 있었던 사람이 코로나 19에 감염되었을 것을 염려한다면 구글에서 코로나 19 증상을 찾아볼 것이라고 충분히 예상해 볼 수 있다. 본 연구에서는 과거 독감 감시와 관리에 중요 역할을 했었던 구글 트렌드(Google Trends)를 다시 소환하고 코로나 19 확진자수 데이터와 결합하여 미래의 코로나 19 확진자수를 예측할 수 있을지 딥러닝 모델(DNN & LSTM)을 사용한 탐색적 데이터 분석을 실시하였다. 특히 이 연구에 사용된 검색어 빈도 데이터는 공개적으로 사용할 수 있으며 사생활 침해의 우려도 없다. 심층 신경망 모델(DNN model)이 적용되었을 때 한국에서 가장 많은 인구가 사는 서울(960만 명)과 두 번째로 인구가 많은 부산(340만 명)에서는 검색어 빈도 데이터를 포함하여 예측했을 때 더 낮은 오류율을 기록했다. 이와 같은 분석 결과는 검색어 빈도 데이터가 일정 규모 이상의 인구수를 가진 도시에서 중요한 역할을 할 수 있다는 것을 보여주는 것이다. 우리는 이와 같은 예측이 더 강력한 예방 조치의 실행이나 해제 같은 정책을 결정하는데 근거 자료로 충분히 사용될 수 있을 것으로 믿는다.

중기예보를 이용한 태양광 일사량 예측 연구 (A study on solar radiation prediction using medium-range weather forecasts)

  • 박수진;김효정;김삼용
    • 응용통계연구
    • /
    • 제36권1호
    • /
    • pp.49-62
    • /
    • 2023
  • 급속적으로 비중이 증가하고 있는 태양광 에너지는 지속적인 개발 및 투자가 이루어지고 있다. 신재생에너지 정책인 그린뉴딜과 가정용 태양광 패널의 설치가 증가함에 따라 국내 태양광 에너지 보급이 점차 확대되어 그에 맞추어 발전량의 정확한 수요 예측 연구가 활발하게 진행되고 있는 시점이다. 또한, 일사량 예측이 발전량 수요 예측에 가장 영향을 미치는 요소로 작용하고 있다는 점에서 일사량 예측의 중요성을 파악하였다. 덧붙여, 본 연구는 선행 연구들에서 사용되지 않은 중기예보 기상 데이터를 활용하여 일사량 예측을 하고자 하였다는 점에서 가장 큰 차이점을 확인할 수 있다. 본 논문에서는 서울, 인천, 수원, 춘천, 대구, 대전의 총 여섯 지역의 태양광 일사량 예측을 위하여 다중선형회귀모형, KNN, Random Forest 그리고 SVR 모형과 클러스터링 기법인 K-means 기법을 결합한 후, 클러스터별 확률밀도함수를 계산하여 시간별 일사량 예측을 진행하고자 하였다. 중기예보 데이터를 사용하기 전, 모형 예측 결과를 비교하기 위한 지표로서 MAE (mean absolute error)와 RMSE (root mean squared error)를 사용하였다. 데이터는 2017년 3월 1일부터 2022년 2월 28일까지의 시간별 원 관측 데이터를 중기예보 데이터 양식에 맞추어 일별 데이터로 변환하였다. 모형의 예측 성능 비교 결과, Random Forest로 일별 일사량을 예측한 후, K-means 클러스터링으로 기후요인이 유사한 날짜들을 분류한 뒤 클러스터별 일사량의 확률밀도함수를 계산하여 시간별 일사량 예측값을 나타낸 방법이 가장 우수한 성능을 보였다. 또한 이 방법론을 이용하여 중기예보 데이터에 모형 적합 후, 예측 결과를 확인하였을 때, 일자별로 예측 오류가 상승하는 것을 확인할 수 있었다. 이는 중기예보 기상데이터의 예측 오류로 인한 것으로 보인다. 향후 연구에서는 중기예보 데이터에서 활용할 수 있는 기상요인 중, 강수 여부와 같은 외생 변수를 추가하거나 시계열 클러스터링 기법을 적용한 연구가 이루어져야할 것으로 보인다.

한국(韓國)의 지류(紙類) 수요예측(需要豫測)에 관한 연구(硏究) (Forecasting of Demand for Papers in Korea)

  • 정일용;정영관
    • 한국산림과학회지
    • /
    • 제65권1호
    • /
    • pp.80-91
    • /
    • 1984
  • 1965~1981 년간(年間)의 시계열자료(時系列資料)를 이용(利用)하여 지류(紙類)의 국내수요함수(國內需要函數)를 추정(推定)하고 추정(推定)된 모형(模型)에 의하여 지류(紙類)의 장기국내수요(長期國內需要)를 예측(豫測)하였다. 지류(紙類)의 국내수요(國內需要)(DDP)는 GNP가 상승(上昇)함에 따라 증가(增加)하는 추세(趨勢)를 보였으며 증가율(增加率)은 실질(實質)GNP 연평균성장율(年平均成長率) 8.8%보다 높은 17.9:% 그리고 판지(板紙)는 무려 25.8% 수준(水準)으로 나타났다. 지류(紙類)의 국내수요(國內需要)에 영향(影響)을 미치는 주요변수(主要變數)는 1인당(人當) 실질국민총생산(實質國民總生産)(PG), 지류(紙類)의 실질도비가격지수(實質都費價格指數)(PWI), 지류수요산업(紙類需要産業)의 생산활동지수(生産活動指數(PDAV) 등이 있으며 이러한 제변수(諸變數)를 포함(包含)한 함수관계(函數關係)를 전대수회귀방정식(全對數回歸方程式)으로 표시(表示)하여 보통최소자승법(普通最少自乘法)으로 추정(推定)하였다. ${\ell}nDDP=2.452+1.986{\ell}nPG-0.844{\ell}nPWI$ $(33.397)^*\;(-6.149)^*\;R^2=0.997$ ${\ell}nDDP=6.468+0.827{\ell}nPDA$ $(17.403)^*\;R^2=0.950$ 이에 따른 지류(紙類)의 국내수요(國內需要)는 1인당(人當) GNP와 지류수요산업(紙類需要産業)의 생산활동지수(生産活動指數)에 대하여 부(負)의 상관(相關)을 그리고 1인당(人當) GNP가 설명변수(說明變數) 중에서 가장 탄력적(彈力的)이였으며 지류실질가격지수(紙類實質價格指數)에 대하여는 부(負)의 상관(相關)으로 나타났다. 이러한 결과(結果)는 통계적(統計的) 유의성(有意性) 인정(認定)되고 경제이론상(經齊理論上) 타당한 것으로 판명(判明)되었다. 1991 년도(年度) 지류(紙類)의 국내수요(國內需要)를 예측(豫測)한 결과(結果)는 3,152천(千)M/T 또는 4,470천(千)M/T에 달(達)할 것으로 추정(推定)되며, 1982~1991 년(年) 기간(期間)동안 연평증가율(年平增加率)은 5.0% 또는 12.4%로 나타났다. 또한 1991 년(年) 1인당(人當) 지류(紙類)의 국내수요(國內需要)는 69.1kg 또는98.0kg에 달(達)할 것으로 예측(豫測) 되었다.

  • PDF