• 제목/요약/키워드: 시계열 예측모델

검색결과 423건 처리시간 0.031초

수문 시계열 예측을 위한 LSTM의 다지점 통합 학습 방안 평가 (Evaluation of multi-basin integrated learning method of LSTM for hydrological time series prediction)

  • 최정현;원정은;정하은;김상단
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.366-366
    • /
    • 2022
  • 유역의 하천유량과 같은 수문 시계열을 모의 또는 예측하기 위한 수문 모델링에서 최근 기계 학습 방법을 활용한 연구가 활발하게 적용되고 있는 추세이다. 이러한 데이터 기반 모델링 접근법은 입출력 자료에서 관찰된 패턴을 학습하며, 특히, 장단기기억(Long Short-Term Memory, LSTM) 네트워크는 많은 연구에서 수문 시계열 예측에 대한 적용성이 검증되었으나, 장기간의 고품질 관측자료를 활용할 때 더 나은 예측성능을 보인다. 그러나 우리나라의 경우 장기간 관측된 고품질의 하천유량 자료를 확보하기 어려운 실정이다. 따라서 본 연구에서는 LSTM 네트워크의 학습 시 가용한 모든 유역의 자료를 통합하여 학습시켰을 때 하천유량 예측성능을 개선할 수 있는지 판단해보고자 하였다. 이를 위해, 우리나라 13개 댐 유역을 대상으로 대상 유역의 자료만을 학습한 모델의 예측성능과 모든 유역의 자료를 학습한 모델의 예측성능을 비교해 보았다. 학습은 2001년부터 2010년까지 기상자료(강우, 최저·최고·평균기온, 상대습도, 이슬점, 풍속, 잠재증발산)를 이용하였으며, 2011년부터 2020년에 대해 테스트 되었다. 다지점 통합학습을 통해 테스트 기간에 대해 예측된 각 유역의 일 하천유량의 KGE 중앙값이 0.74로 단일지점 학습을 통해 예측된 KGE(0.72)보다 다소 개선된 결과를 보여주었다. 다지점 통합학습이 하천유량 예측에 큰 개선을 달성하지는 못하였으며, 추가적인 가용 자료 확보와 LSTM 구성의 개선을 통해 추가적인 연구가 필요할 것으로 판단된다.

  • PDF

유동인구 예측을 위한 Global - Local 구조 기반의 시계열 Deep Learning 모델에 관한 연구 (A Study on Deep Learning Model Based on Global-Local Structure for Crowd Flow Prediction)

  • 고현모;박상현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.458-461
    • /
    • 2021
  • 유동인구 예측은 상권의 특성에 따른 점포의 입지 선정 및 고객 맞춤형 마케팅 등 민간 분야에서부터 교통망 등 사회 간접 자본 설계를 위한 공공 분야에 이르기까지 다양한 목적으로 연구되어 왔으며, 최근에는 Covid-19 의 확산에 따라 그 중요도가 더욱 높아지고 있다. 보다 정교한 예측을 위해서는 전체적인 유동 인구 뿐만 아니라 특성 별로 세분화된 하위 그룹에 대해서도 정확한 예측이 요구되나, 기존의 예측 모델들은 이러한 데이터의 계층 구조를 고려하지 않았다. 본 연구에서는 세분화된 하위 그룹 별 유동인구의 예측 정확도를 높이기 위해 전체 유동인구의 패턴을 동시에 활용하는 Global-Local 구조 기반의 Deep Learning 유동인구 분석 모델을 제안한다. 실험 결과 단일 시계열 데이터만을 사용하는 경우 대비 5.4%~52.6%의 예측 오류 감소 효과가 있음을 확인하였다.

유전자 알고리즘을 이용한 웨이블릿분석 및 인공신경망기법의 통합모형구축 (A Hybrid System of Wavelet Transformations and Neural Networks Using Genetic Algorithms: Applying to Chaotic Financial Markets)

  • Shin, Taek-Soo;Han, In-Goo
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 1999년도 춘계공동학술대회-지식경영과 지식공학
    • /
    • pp.271-280
    • /
    • 1999
  • 인공신경망을 시계열예측에 적용하는 경우에 고려되어야 할 문제중, 특히 모형에 적합한 입력변수의 생성이 중요시되고 있는데, 이러한 분야는 인공신경망의 모형생성과정에서 입력변수에 대한 전처리기법으로써 다양하게 제시되어 왔다. 가장 최근의 입력변수 전처리기법으로써 제시되고 있는 신호처리기법은 전통적 주기분할처리방법인 푸리에변환기법(Fourier transforms)을 비롯하여 이를 확장시킨 개념인 웨이블릿변환기법(wavelet transforms) 등으로 대별될 수 있다. 이는 기본적으로 시계열이 다수의 주기(cycle)들로 구성된 상이한 시계열들의 집합이라는 가정에서 출발하고 있다. 전통적으로 이러한 시계열은 전기 또는 전자공학에서 주파수영역분할, 즉 고주파 및 저주파수를 분할하기 위한 기법에 적용되어 왔다. 그러나, 최근에는 이러한 연구가 다양한 분야에 활발하게 응용되기 시작하였으며, 그 중의 대표적인 예가 바로 경영분야의 재무시계열에 대한 분석이다. 전통적으로 재무시계열은 장, 단기의사결정을 가진 시장참여자들간의 거래특성이 시계열에 각기 달리 가격으로 반영되기 때문에 이러한 상이한 집단들의 고요한 거래움직임으로 말미암아 예를 들어, 주식시장이 프랙탈구조를 가지고 있다고 보기도 한다. 이처럼 재무시계열은 다양한 사회현상의 집합체라고 볼 수 있으며, 그만큼 예측모형을 구축하는데 어려움이 따른다. 본 연구는 이러한 시계열의 주기적 특성에 기반을 둔 신호처리분석으로서 기존의 시계열로부터 노이즈를 줄여 주면서 보다 의미있는 정보로 변환시켜줄 수 있는 웨이블릿분석 방법론을 새로운 필터링기법으로 사용하여 현재 많은 연구가 진행되고 있는 인공신경망의 모형결합을 통해 기존연구과는 다른 새로운 통합예측방법론을 제시하고자 한다. 본 연구에서는 제시하는 통합방법론은 크게 2단계 과정을 거쳐 예측모형으로 완성이 된다. 즉, 1차 모형단계에서 원시 재무시계열은 먼저 웨이브릿분석을 통해서 노이즈가 필터링 되는 동시에, 과거 재무시계열의 프랙탈 구조, 즉 비선형적인 움직임을 보다 잘 반영시켜 주는 다차원 주기요소를 가지는 시계열로 분해, 생성되며, 이렇게 주기에 따라 장단기로 분할된 시계열들은 2차 모형단계에서 신경망의 새로운 입력변수로서 사용되어 최종적인 인공 신경망모델을 구축하는 데 반영된다. 기존의 주기분할방법론은 모형개발자입장에서 여러 가지 통계기준치중에서 최적의 기준치를 합리적으로 선택해야 하는 문제가 추가적으로 발생하며, 본 연구에서는 이상의 제반 문제들을 개선시키기 위해 통합방법론으로서 기존의 인공신경망모형을 구조적으로 확장시켰다. 이 모형에서 기존의 입력층 이전단계에 새로운 층이 정의된다. 이렇게 해서 생성된 새로운 통합모형은 기존모형에서 생성되는 기본적인 학습파라미터와 더불어, 본 연구에서 새롭게 제시된 주기분할층의 파라미터들이 모형의 학습성과를 높이기 위해 함께 고려된다. 한편, 이러한 학습과정에서 추가적으로 고려해야 할 파라미터 갯수가 증가함에 따라서, 본 모델의 학습성과가 local minimum에 빠지는 문제점이 발생될 수 있다. 즉, 웨이블릿분석과 인공신경망모형을 모두 전역적으로 최적화시켜야 하는 문제가 발생한다. 본 연구에서는 이 문제를 해결하기 위해서, 최근 local minimum의 가능성을 최소화하여 전역적인 학습성과를 높여 주는 인공지능기법으로서 유전자알고리즘기법을 본 연구이 통합모델에 반영하였다. 이에 대한 실증사례 분석결과는 일일 환율예측문제를 적용하였을 경우, 기존의 방법론보다 더 나운 예측성과를 타나내었다.

  • PDF

추가전용 데이터베이스에 대한 연속 마이닝 (Continuous Mining Over Append-Only Databases)

  • 김룡;이준욱;이양우;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.10-12
    • /
    • 2002
  • 최근에 많은 새로운 타입의 어플리케이션에서 정보 시스템들에 대한 사용의 증가로 인해 연속 질의들은 여러 연구 프로젝트들에서 초점이 되고 있으며 연구가 활발히 진행되고 있다. 특히 시계열에 대해서 미래의 값에 대한 예측 모델과 FFT(Fast Fourier Transform)을 이용하여 새로운 값이 입력될 때마다 신속하게 응답할 수 있는 이웃에 관한 연속 질의에 대해 이미 연구되었다. 그러나 이것은 이웃에 관한 질의이며 또한 방대한 데이터를 처리함에 있어서 매우 효율적이지 못하다. 이 논문에서는 시계열에 있어서 예측 모델을 이용하여 미래의 값을 예측한다. 다음 DFT(Discrete Fourier Transform)을 이용하여 변환한 후 R*-tree를 구성하고, 새로운 값이 입력될 때마다 신속하게 유사성 시계열들을 찾아서 응답하는 연속 범위 질의 과정과 시스템 구조에 대해 제안한다.

  • PDF

시계열 모델을 활용한 위치 데이터의 시간적 패턴 분석 (Analysis on Temporal Pattern of Location Data with Time Series Model)

  • 송하윤;정준우;이다솜
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.768-771
    • /
    • 2021
  • 시계열 분석은 이전 시점들의 데이터를 기반으로 미래 시점의 데이터를 예측하는 기술을 제공하며, SARIMA는 이러한 시계열 분석에서 활용되는 통계 모델의 일종이다. 본 연구는 직접 수집한 실시간 위치 데이터에 SARIMA를 적용하여 개인의 이동 패턴을 추출하고 이를 예측에 활용하는 전반적인 프로세스를 제작하였다. 첫째, DB에 업로드된 위치 데이터를 비지도 학습의 일종인 EM-clustering을 활용해 핵심 방문 장소들로부터의 거리에 따라 군집화했다. 둘째, 해당 장소에 입장하고 퇴장하는 시간 간격에 SARIMA를 적용해 주기성을 추출했다. 마지막으로, 이 주기성들을 군집의 중요도에 따라 순차적으로 분석하여 유의미한 예측 결과를 도출해냈다.

시계열 분석에 의한 어획량 예측 - 한국 근해산 갈치를 예로 하여 - (Forecasting of Hairtail (Trichiurus lepturus) Landings in Korean Waters by Times Series Analysis)

  • 유신재;장창익
    • 한국수산과학회지
    • /
    • 제26권4호
    • /
    • pp.363-368
    • /
    • 1993
  • 어획량의 단기 예측은 자원관리에 있어 중요한 항목이지만 전통적인 개체군 모델은 수산자원 관리에 있어 실제적으로 요구되는 예측력이 크게 부족하다. 다종 또는 생태계 모델도 요구되는 매개변수의 수가 많아 실제적 적용이 어렵다. 반면에 단변수 시계열 분석법은 시계열 자체에서 변동성에 관한 특성을 추정하여 이를 토대로 장래 변동성을 예측함으로 최소한의 자료를 가지고 비교적 정확한 단기예측이 가능하므로 유용성이 높다. 본 연구에서는 ARIMA 시계열 모델을 $1971{\sim}1988$년 간의 한국근해의 월별 갈치어획량 자료에 적용하였다. 여기서 나온 예측치와 분석에 포함되지 않았던 $1989{\sim}1990$년 간의 어획량과 비교하였다. 분석 결과 예측치와 실제어획량이 잘 일치하였으며(r=0.938) 평균상대오차는 $59.5\%$였다.

  • PDF

그린투어리즘 포텐셜 분석을 위한 관광마을 수준의 월별 방문객 추정 - 하회마을을 중심으로 - (Estimating Monthly Tourist Population for Analysis of Green Tourism Potential in Village Level - A Case Study of Hahoe Village -)

  • 고옥결;김대식;김용훈
    • 농촌계획
    • /
    • 제17권1호
    • /
    • pp.1-11
    • /
    • 2011
  • 본 연구에서는 ARIMA(Autoregressive Integrated Moving Average) 모델을 이용하여 농촌관광마을의 월별 관광객을 추정하였다. 단일 마을에 대한 시계열 자료를 경상북도 안동시에 위치한 하회마을을 대상으로 구축하였다. 월별 시계열 자료는 2000년부터 2010년까지 구성되었는데(2008년도 누락), 2000년에서 2007년까지 자료는 최적 모델의 도출에 나머지는 예측치의 검정에 사용되었다. 연구 결과 최적모델에 필요한 시계열 자료의 길이는 6년으로 나타났으며, 최적모델은 계절성을 고려한 SARIMA(2,1,1)(1,1,2)12로 나타났다. 최적 시계열 년수로 나타난 6년을 사용하여 2000-2005, 2001-2006, 그리고 2002-2007의 자료로부터 각각 SARIMA(2,1,1)(1,1,2)12를 도출하여, 차기년도들에 대한 예측결과를 비교한 결과, 높은 $R^2$값을 보였다.

궤도틀림 진전 예측을 위한 시계열 모델 적용 (Application of Time-Series Model to Forecast Track Irregularity Progress)

  • 정민철;김건우;김정훈;강윤석;공정식
    • 한국전산구조공학회논문집
    • /
    • 제25권4호
    • /
    • pp.331-338
    • /
    • 2012
  • 현재 국내에서 EM-120에 의해 검측된 틀림 데이터는 매우 불규칙적인 형태를 나타내며 데이터 분석 시 다양한 문제점을 가지고 있다. 본 연구에서는 궤도의 효율적인 유지관리를 위해 검측된 틀림데이터의 특징과 문제점을 분석하고, 이를 보완할 수 있는 효율적인 처리 기법을 개발하였으며, 정제된 데이터의 ARIMA 분석을 통해 검측데이터와 계절 변화의 상관관계 분석을 수행하였다. 또한 회귀모형, 지수평활법, ARIMA 모형 등 다양한 예측 모델의 적용을 통해 검측 데이터의 시계열 분석을 수행하고, 궤도 틀림 데이터의 예측 모델에 적합한 최적 모델 선정과 관련한 연구를 수행하였다.

유비쿼터스 컴퓨팅 환경에서 컨텍스트 예측을 위한 시계열 분석 기반 사용자 모델링 (User Modeling based Time-Series Analysis for Context Prediction in Ubiquitous Computing Environment)

  • 최영환;이상용
    • 한국지능시스템학회논문지
    • /
    • 제19권5호
    • /
    • pp.655-660
    • /
    • 2009
  • 기존의 예측 알고리즘들은 실시간 환경에서 학습 데이터 처리에서 오는 시간지연 문제, 구현의 어려움 등으로 개인화된 실시간 서비스를 제공하는 컨텍스트 인식 환경에서 사용하기에 적합하지 않다. 본 논문에서는 사용자 모델을 이용하여 컨텍스트 예측 알고리즘의 처리시간 단축과 예측 정확도를 향상시키기 위한 연구를 제안한다. 컨텍스트 예측을 위하여 사용자의 컨텍스트 중에서 이동경로를 사용한다. 이동경로를 기반으로 시계열 분석 방법을 통하여 사용자 모델을 생성하고, 생성된 사용자 모델을 시퀀스 매칭 방법을 이용하여 사용자의 컨텍스트를 예측한다. 기존 예측 알고리즘과 본 연구에서 제안한 예측 알고리즘을 시뮬레이션을 통하여 처리시간 및 예측 정확도를 비교한 결과, 실시간 서비스 환경에서 예측 정확도는 기존 예측 알고리즘들과 비슷한 결과를 보였고, 처리시간은 사용자 모델을 사용한 경우가 시퀀스 매칭을 사용한 경우보다 평균 40% 정도 감소시킬 수 있음을 알 수 있었다.

웨이브릿 시계열 신경망을 이용한 플라즈마 장비 센서 정보 모델링

  • 김유석;김병환;한정훈;서승훈;손종원
    • 한국반도체및디스플레이장비학회:학술대회논문집
    • /
    • 한국반도체및디스플레이장비학회 2006년도 추계학술대회 발표 논문집
    • /
    • pp.72-76
    • /
    • 2006
  • 본 연구에서는 웨이브릿과 신경망을 결합하여 플라즈마 고장을 감시하기 위한 시계열 모델을 개발하였다. 본 기법은 플라즈마 증착장비에 의해 수집된 18 개의 센서정보에 적용하여 평가하였다. 이산치 웨이브릿(Discrete Wavelet Transformation)은 장비에서 수집된 센서정보의 전 처리를 위해 이용되었다. 시계열 모델의 성능은 과거와 미래정보의 함수로 평가하였다. 수집된 18 개의 센서정보에 대한 모델성능 비교를 위해 표준화된 성능평가지표가 적용되었다. 평가결과, 본 기법에 의해 개발된 시계열 모델은 대략 4% 정도의 예측에러를 보였다.

  • PDF