• 제목/요약/키워드: 데이터 기반 예측

검색결과 2,788건 처리시간 0.038초

빅데이터 분석 및 예측을 위한 멀티모델 태풍 시뮬레이션 (Multi-model Typhoon Simulation for Big Data Analysis and Prediction)

  • 강지순;육진희;조민수
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2017년도 춘계 종합학술대회 논문집
    • /
    • pp.291-292
    • /
    • 2017
  • 한국과학기술정보연구원 융합기술연구본부 재난대응HPC연구센터에서는 초고성능컴퓨팅 기반의 풍수해 예측 및 피해 정보 생산기술을 연구개발하여 재난 재해에 대한 국가현안 대응 의사결정지원 시스템을 구축 중에 있다. HPC 기반의 풍수해 예측 시스템과 빅데이터 분석 기반의 피해 예측 시스템에 대한 연구를 독자적으로 진행하는 가운데, 최근 여러 분야에 적용되고 있는 빅데이터 분석 기술을 HPC 기반의 풍수해 예측 시스템에 적목시켜 더 정확하고 신속한 풍수해 예측 정보 생산에 기여하고자 한다. 본 연구는 빅데이터 분석을 위한 학습 데이터 생산을 목적으로 HPC 기반 태풍 예측의 주요 기상 인자들을 조정하여 서로 다른 성능의 예측 모델을 구축하고, 각 모델 별 태풍 시뮬레이션의 성능을 진단하였다. 향후 빅데이터 분석을 통한 예측 성능의 검증을 위해 HPC 기반 풍수해 예측 및 검증 데이터를 최대한 생산하고자 한다.

  • PDF

기온 데이터를 반영한 전력수요 예측 딥러닝 모델 (Electric Power Demand Prediction Using Deep Learning Model with Temperature Data)

  • 윤협상;정석봉
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권7호
    • /
    • pp.307-314
    • /
    • 2022
  • 최근 전력수요를 예측하기 위해 통계기반 시계열 분석 기법을 대체하기 위해 딥러닝 기법을 활용한 연구가 활발히 진행되고 있다. 딥러닝 기반 전력수요 예측 연구 결과를 분석한 결과, LSTM 기반 예측 모델의 성능이 우수한 것으로 규명되었으나 장기간의 지역 범위 전력수요 예측에 대해 LSTM 기반 모델의 성능이 충분하지 않음을 확인할 수 있다. 본 연구에서는 기온 데이터를 반영하여 24시간 이전에 전력수요를 예측하는 WaveNet 기반 딥러닝 모델을 개발하여, 실제 사용하고 있는 통계적 시계열 예측 기법의 정확도(MAPE 값 2%)보다 우수한 예측 성능을 달성하는 모델을 개발하고자 한다. 먼저 WaveNet의 핵심 구조인 팽창인과 1차원 합성곱 신경망 구조를 소개하고, 전력수요와 기온 데이터를 입력값으로 모델에 주입하기 위한 데이터 전처리 과정을 제시한다. 다음으로, 개선된 WaveNet 모델을 학습하고 검증하는 방법을 제시한다. 성능 비교 결과, WaveNet 기반 모델에 기온 데이터를 반영한 방법은 전체 검증데이터에 대해 MAPE 값 1.33%를 달성하였고, 동일한 구조의 모델에서 기온 데이터를 반영하지 않는 것(MAPE 값 2.31%)보다 우수한 전력수요 예측 결과를 나타내고 있음을 확인할 수 있다.

인공신경망 모델을 이용한 지천유입이 있는 대하천의 수질예측 (Prediction of Water Quality in Large Rivers with Tributary Input using Artificial Neural Network Model)

  • 서일원;윤세훈;정성현
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.45-45
    • /
    • 2018
  • 오염물의 혼합거동을 해석하기 위해 물리기반 모델을 이용하는 경우 모델을 구축하고 운용하는데 많은 시간과 재정이 소요되며 현장검증을 통한 검증이 반드시 필요하다. 하지만 데이터 기반 모델의 경우 축적된 데이터만으로도 예측을 수행할 수 있으며 물리기반모델에 비해 결정해야할 입력인자가 적어 모델운용이 용이하다는 장점이 있다. 다양한 데이터 모델 중 인공신경망(ANN) 모델은 데이터가 가지는 불확실성 및 비정상성, 복잡한 상호관련성에 효과적으로 대응할 수 있는 모델로 수자원 및 환경 분야에서 자주 사용되고 있다. 본 연구에서는 인공신경망 모델을 이용하여 지천유입이 있는 대하천의 수질인자 (pH, 전기전도도, DO, chl-a)를 예측하였다. 다른 데이터기반 모델과 같이 인공신경망 모델 또한 수집된 데이터 질에 크게 영향을 받으며, 내부 입력인자의 선택이 모델의 예측 결과에 큰 영향을 미친다. 이러한 인공신경망 모델의 특성을 바탕으로 예측모형의 정확도를 향상하기 위해서는 크게 데이터 처리부분과 모델구축 부분에서의 접근이 필요하다. 본 연구에서는 데이터 처리 과정에서 연구대상지점의 각각의 수질인자가 가지는 분포 특성을 유지하기 위해 층화표츨추출법을 이용하여 데이터를 구성하였다. 모델의 구축 과정에서는 초기가중치 값의 영향을 줄이기 위해 앙상블기법을 사용하였으며, 좀 더 견고하고 정확한 결과를 예측하기 위해 탄력적 역전파알고리즘을 추가하였다. 추가적으로 합류 후 본류의 미 계측지역 수질 예측 정확도 향상을 위해 본류의 수질인자뿐만 아니라 지류의 수질인자를 입력자료로 사용하여 모의를 수행하였다. 또한 동일 구간에서 수행한 현장추적자실험 자료를 이용하여 수질인자의 분포특성을 비교, 검증하였다. 개발된 모델을 이용하여 낙동강과 금호강 합류부 하류의 수질인자를 예측한 결과 지류의 수질인자를 입력자료로 추가한 경우 예측의 정확도가 증가하였으며, 현장실험 자료를 통해 밝혀진 오염물의 거동현상을 인공신경망 모델로도 동일하게 재현하는 것으로 나타났다. 본 연구에서 제안한 인공신경모델을 이용한다면 물리기반 수치모델을 대체하여 지천으로 유입된 오염물의 거동을 정확하고 효율적으로 파악할 수 있을 것이다.

  • PDF

유비쿼터스 컴퓨팅을 위한 지능적인 사용자 위치 이동 학습 및 예측

  • 유지오;김경중;조성배
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2004년도 추계학술대회
    • /
    • pp.139-148
    • /
    • 2004
  • 사용자의 지리적 위치에 따른 서비스를 제공하는 위치기반서비스는 유비쿼터스 컴퓨팅의 중요한 응용으로 여러 위치 감지기술과 다양한 시험 및 상용 서비스들이 개발되어 왔다. 하지만 기존의 위치기반서비스는 단순히 위치와 서비스를 정적으로 연결하는 기법에 그치고 있어 서비스의 유연성이 떨어지는 한계가 있다. 이를 개선하기 위해 위치 정보로부터 고수준 정보를 추론하여 보다 지능적인 서비스를 제공하려는 연구들이 이루어지고 있다. 본 논문에서는 사용자의 위치이동 데이터를 학습하여 미래의 위치 이동 경로를 예측하는 기법을 제안한다. GPS(Global Positioning System)를 사용하여 수집된 시퀸스 데이터를 시퀸스 데이터 처리에 특화된 RSOM (Recurrent Self Organizing Map)을 사용하여 클러스터링하고 이를 마르코브 모델을 사용하여 학습하여 각 위치 이동 패턴 모델을 구축한다. 현재의 위치이동 패턴을 구축된 각 이동패턴 모델들과 비교하여 가장 유사한 위치 이동패턴으로 미래의 사용자이동을 예측한다. 제안한 위치이동 예측 기법을 평가하기 위해 실제 대학생의 생활을 기반으로 하여 GPS 데이터를 대학 캠퍼스 상에서 수집하고 이를 이용하여 제안한 방법의 학습 및 예측 성능을 평가한다. 그 결과 제안한 방법을 사용하여 사용자의 미래의 위치이동경로를 예측하는 것이 가능하고 불확실한 상황에서도 유연하게 예측을 수행함을 확인하였다.

  • PDF

랜덤포레스트기법을 이용한 분변성대장균 예측모델 개발 (Development of fecal coliform prediction model using random forest method)

  • 서일원;최수연
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.124-124
    • /
    • 2016
  • 하천에서의 분변성대장균은 분변성 오염 정도를 나타내는 지표로서, 이 농도가 높을수록 오염된 하천수와의 접촉을 통한 호흡기, 소화기 및 피부 관련 질병의 발발 확률이 높다고 알려져 있다. 따라서 하천에서의 수영, 수상스키 등과 같은 입수형 친수활동을 할 때, 분변성대장균 농도가 농도 기준 이하인지를 확인하고 이러한 정보를 친수활동에 이용할 필요가 있다. 그러나 분변성대장균의 경우, 현재 자동수질측정망에서 측정되고 있는 다른 수질인자들과는 달리 실시간 측정이 불가능하다고 알려져 있다. 분변성대장균을 측정하는데 있어 최소 18시간 이상이 필요하며, 이러한 분변성대장균 측정 방식은 하천 이용자들이 안전한 친수활동을 영위하는데 있어 적절한 수질 정보를 제공하지 못한다. 그러므로 분변성대장균을 예측하는 모델을 개발하고, 이를 이용하여 실시간 분변성대장균 정보를 생성하여 하천 이용자들에게 제공할 필요가 있다. 본 연구에서는 친수활동이 활발하게 이루어지는 곳 중 하나인 북한강의 대성리 지점에 대해 데이터 기반 모델을 이용하여 분변성대장균을 예측하였다. 데이터 기반 모델은 물리 기반 모델에서 필요한 지형데이터나 비점오염원 등의 초기 오염물의 양에 대한 데이터를 필요로 하지 않고, 대신 독립변수로 사용되는 기상 및 수질데이터를 필요로 한다. 이러한 기상 및 수질데이터는 기존 기상관측소, 수질관측소에서 매일 자동으로 측정되기 때문에 데이터 기반 모델은 물리 기반 모델에 비해 입력데이터를 구성하기가 쉽다는 장점을 지닌다. 이러한 데이터 기반 모델 중 분류 모델은 회귀 모델과 달리 분변성대장균 농도가 일정 수질기준 이상을 넘는지를 바로 예측할 수 있다. 본 연구에서는 분류 모델 중 높은 예측력을 가진다고 알려진 랜덤포레스트(random forest) 기법을 이용하여 분변성대장균 예측 모델을 개발하였다. 분변성대장균 예측 모델은 주어진 기상 및 수질 조건에 대해 분변성대장균이 200 CFU/100ml가 넘는지를 예측하였다. 예측된 분변성대장균이 기준을 넘는 경우를 2등급, 넘지 않는 경우를 1등급으로 명명하였다. 모델을 개발하기 위하여 북한강 대성리 인근 측정소에서 2010년부터 2015년까지 측정된 기상 및 수질데이터를 수집하였다. 수집한 데이터를 훈련 및 검증데이터로 샘플링하였으며, 이 때 샘플링한 데이터가 기존 데이터가 가지고 있던 등급별 비율을 유지하기 위하여 층화샘플링을 하였다. 본 연구에서는 샘플링에 의한 불확실성을 줄이기 위하여 랜덤하게 50번 샘플링된 각각의 훈련데이터에 대해 모델을 개발하였다. 50개의 모델의 검증 결과를 종합한 결과, 전체 예측률은 0.139로 나타났다.

  • PDF

주기적인 위치보고 이동체의 불확실 위치 처리 (Processing of uncertain position of regularly sampling moving objects)

  • 진희규;김동현;임덕성;홍봉희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.241-243
    • /
    • 2004
  • 위치기반서비스 응용 분야에서 위치 데이터를 저장하기 위하여 일반적으로 이동체의 위치 데이터를 주기적으로 수집한다. 주기적으로 수집된 위치 데이터는 보고 주기 사이의 위치 변화를 반영하지 못하기 때문에 시간에 대한 선형 함수를 이용하여 예측된 위치 데이터와 오차가 발생한다. 따라서 오차가 존재하는 불확실한 미래 위치 데이터로 인하여 미래 위치 색인에서 검색의 정확도가 떨어지는 문제점이 발생한다. 이 논문에서는 주기적인 위치보고 이동체에서 발생하는 불확실한 위치 데이터를 처리하기 위해서 예측된 위치 데이터에 예측 오차분을 반영한 불확실성 영역을 사용한다 그리고 이동체의 불확실성 영역을 설정하기 위하여 최근 예측 오차 가중치 기법과 칼만 필터 기법을 제안하고 이를 기반으로 하는 불확실 위치 처리 기법을 이동체 미래 위치 색인에서 구현하고 성능 비교 평가를 수행한다. 성능 평가 결과에 따르면 기존의 선형함수 기반 예측 기법보다 불확실 위치 처리 기법이 영역 검색의 정확도가 향상되는 장점을 가진다.

  • PDF

딥러닝 모델 기반 보행자 GPS 경로 예측 시스템 연구 (A study on the Deep Learning model-based pedestrian GPS trajectory prediction system)

  • 윤승원;이원희;이규철
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.89-92
    • /
    • 2022
  • 본 논문에서는 딥러닝 모델 기반 보행자의 GPS 경로를 예측하는 시스템을 제안한다. 다양한 경로 예측 방식들 중 본 논문은 GPS 데이터 기반 경로 예측 연구이다. 시계열 데이터인 보행자의 GPS 경로를 학습하여 다음 경로를 예측하도록 하는 딥러닝 모델 기반 연구이다. 본 논문에서는 보행자의 GPS 경로를 딥러닝 모델이 학습할 수 있도록 데이터 구성 방식을 제시하였으며, 예측 범위에 큰 제약이 없는 예측 딥러닝 모델을 제안한다. 본 논문의 딥러닝 모델에 적합한 파라메터들을 제시하였으며, 우수한 예측 성능을 보이는 결과를 제시한다.

  • PDF

ARIMA 모델을 이용한 데이터 흐름 예측 기법 (Data Flow Prediction Scheme using ARIMA Model)

  • 김동현;김민우;이병준;김경태;윤희용
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2018년도 제58차 하계학술대회논문집 26권2호
    • /
    • pp.141-142
    • /
    • 2018
  • 기존 데이터의 패턴 예측에는 통계를 기반으로 한 수학적 모델이 주로 사용되었으나 새로운 데이터에 대한 피드백이 부족하기 때문에 장기간의 데이터 예측에 한계가 있다. 또한 데이터의 특성이 다양하고 복잡한 경우에는 수학적 모델의 결합 및 계산과정이 어려워진다. 따라서 본 논문에서는 데이터의 학습 및 예측에 기존 정적 모델이 아닌 기계학습 중 시계열 데이터 분석 (Time Series Analysis) 을 기반으로 연구를 진행하였다. 기계학습은 복잡한 특성을 가진 데이터를 학습하여 미래의 데이터 값을 예측하거나 분류하는데 있어서 정확도 및 처리시간 측면에서의 성능을 향상시킬 수 있다.

  • PDF

네트워크 커버리지 기반 센서 레지스트리 시스템의 경로 예측 정확성 평가 (Accuracy Evaluation of Path Prediction for Network Coverage-based Sensor Registry System)

  • 정현준;정동원;이석훈;백두권
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.1242-1243
    • /
    • 2015
  • 센서 레지스트리 시스템(Sensor Registry System, SRS)은 이기종 환경에서 센서 네트워크 환경에서 센서 데이터의 즉각적 활용 및 끊김 없는 해석을 위해 사용자에게 센서 메타데이터를 제공한다. SRS에서 센서 메타데이터를 안정적으로 송신하기 위하여 경로 예측 기반 센서 레지스트리 시스템을 제안한다. 하지만 네트워크 연결이 지원되지 않거나 신호가 불안정한 경우에 센서 메타데이터를 안정적으로 제공할 수 없다. 이 문제를 해결하기 위하여 네트워크 커버리지 기반 센서 레지스트리 시스템을 제안한다. 이 논문에서는 네트워크 커버리지 기반 센서 레지스트리 시스템과 경로 예측 기반 센서 레지스트리 시스템을 비교평가 한다. 또한 통신사별로 경로예측 정확도를 측정한다. 성능 측정의 통계적 신뢰도를 높이기 위하여 실험 데이터를 10-묶음 교차검증을 수행한다.

전 방향 참조 경로 탐사 패턴을 이용한 웹 문서 예측 (Web document prediction using forward reference path traversal patterns)

  • 김양규;손기락
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.112-114
    • /
    • 2004
  • 오늘날 웹을 이용하는 사용자들의 웹 검색 형태를 저장한 웹 로그 데이터들은 데이터 마이닝을 위한 중요한 자료가 되고 있다. 이들 웹 로그들로부터 사용자의 현재 행동을 기반으로 사용자가 다음에 요청할 요구를 예측할 수 있는 예측 모델을 만들 수 있다. 하지만 이들 웹 로그들은 크기가 매우 크고 분석하기가 어렵다. 이런 문제를 해결하기 위해 이미 않은 방법이 제안되었다. 그 중에서 효과적으로 예측할 수 있도록 제안된 순차적 분류 기반에 연관법칙을 적용한 예측 기법이 있다. 본 논문에서는 전방향 참조 경로 탐사 패턴 알고리즘을 적용하여 연관규칙에 기반 한 웹 문서 예측 기법을 향상시키는 모델을 제안한다.

  • PDF