• Title/Summary/Keyword: 데이터예측

Search Result 6,818, Processing Time 0.034 seconds

A Design of Behavioral Prediction through Diffusion Model-based Sensor Data Frequency Interpolation (Diffusion Model 기반 센서 데이터 주파수 보간을 통한 행동 예측 설계)

  • Jeong Hyeon Park;Jun Hyeok Go;Siung Kim;Nammee Moon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.05a
    • /
    • pp.633-635
    • /
    • 2023
  • 센서 데이터를 예측 또는 분석하여 시스템을 제어하거나 모니터링할 수 있다. 센서 데이터를 이용한 예측의 신뢰성을 확보하기 위해서는 데이터의 적절한 빈도수가 중요하다. 이를 위해 본 논문에서는 Diffusion Model을 사용한 센서 데이터 주파수 보간을 통해 행동을 예측하는 방법을 제시하고자 한다. 주파수 보간은 반려동물 행동별 25hz 센서 데이터로 학습된 Diffusion Model을 사용한다. 학습된 Diffusion Model에 1hz 센서 데이터와 가우시안 노이즈를 결합한 데이터를 입력으로 사용해 센서데이터를 보간한다. 제안한 방법은 CNN-LSTM 모델 학습 후 예측 성능 비교를 통해 검증한다.

A Study of improving reliability on prediction model by analyzing method Big data (빅데이터 분석방법을 이용한 예측모형의 신뢰도 향상에 관한 연구)

  • Song, Min-Gu;Kim, Sun-Bae
    • Journal of Digital Convergence
    • /
    • v.11 no.6
    • /
    • pp.103-112
    • /
    • 2013
  • Traditional method of establishing prediction model is usually using formal data stored in Data Base. However, nowadays advent of "smart" era brought by ground-breaking development of communication system makes informal data to dominate overall data, such 80% in total. Therefore, conventional method using formal data as establishing predicting model would be untrustworthy means in present. In other words, it is indispensible to make prediction model credible including informal data(SNS, image, video) and semi-formal data(log data). In this study, we increase credibility of predicting model adapting Bigdata method and comparing reliability of conventional measurement to real-data.

Stock Price Prediction Using Backpropagation Neural Network (역전파 신경망을 이용한 주가 예측)

  • 박사준;이상훈;고삼일;김기태
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.328-330
    • /
    • 2002
  • 본 논문에서는 역전파 신경망(Backpropagation Neural Network)을 시계열 데이터인 주가 데이터를 이용한 주가 예측의 정확도를 향상시키기 위한 학습 방법으로 적용하였다. 실제 증권거래소의 종목 데이터에서 비교적 등락폭이 안정적인 각 산업분야별 5개 기업의 5일 이동평균선 데이터 240개를 훈련 데이터로, 20개는 테스트 데이터로 이용하였다. 선정된 입력 데이터를 은닉층의 개수와 은닉 노드의 개수 등을 달리 하면서 10,000번의 훈련을 통해서 실험 하였으며, 그 결과 1개의 은닉층을 사용한 네트워크1은 20개의 테스트 데이터 사이의 19개의 신호 중 14개를 예측하였고, 2개의 은닉층을 사용한 네트워크 2는 16개를 예측하였다. 시험 결과를 통해서 보듯이 은닉층을 2개 사용하였을 때 보다 좋은 실험 결과를 얻을 수 있었으며, 역전파 신경망 모델이 주가 예측에 적합하다는 것이 증명되었다.

  • PDF

Analysis of the relationship between regional economic growth and obesity by using Lasso Regression (Lasso Regression을 이용한 지역 경제 성장과 비만율의 상관관계 분석)

  • Kil, Eungyu;OH, Sujin;Kim, Ung-Mo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.10a
    • /
    • pp.565-568
    • /
    • 2018
  • 본 연구에서는 Lasso Regression을 기반으로 하여 지역 경제 성장과 비만율을 예측한다. 연구는 3단계로 나누어 진행된다. 우선 지역성장을 대변할 수 있는 가상의 GDP 수치를 구한다. 그 다음 가상의 GDP 수치와 비만율 데이터를 이용하여 학습모델을 만든다. 마지막으로 이전의 데이터를 이용하여 앞으로의 성장을 예측하고 학습모델에 적용하여 비만율을 예측한다. 본 연구의 데이터는 학습데이터와 실험데이터를 구성된다. 학습데이터로는 국내의 8도 중 하나인 강원도의 데이터를 이용하며 실험데이터로는 강릉과 원주의 데이터를 이용한다. 평가 비교 대상으로는 과거의 흐름을 반영하는 최소자승법 예측기법을 선정하여 비교한다. 연구 결과 강릉의 경우 비교 데이터와의 오차율 평균은 1.22%로 큰 차이가 없음을 알 수 있다. 따라서 본 연구에서 제안하는 방법이 과거의 흐름을 기반으로 작성됨을 알 수 있다. 하지만 단순히 과거의 흐름만을 통해 예측하는 것은 여러 요소가 복합적으로 작용하는 비만율 예측에 알맞지 않기 때문에 본 연구 방법이 유의미하다고 여겨진다.

Mitigating Data Imbalance in Credit Prediction using the Diffusion Model (Diffusion Model을 활용한 신용 예측 데이터 불균형 해결 기법)

  • Sangmin Oh;Juhong Lee
    • Smart Media Journal
    • /
    • v.13 no.2
    • /
    • pp.9-15
    • /
    • 2024
  • In this paper, a Diffusion Multi-step Classifier (DMC) is proposed to address the imbalance issue in credit prediction. DMC utilizes a Diffusion Model to generate continuous numerical data from credit prediction data and creates categorical data through a Multi-step Classifier. Compared to other algorithms generating synthetic data, DMC produces data with a distribution more similar to real data. Using DMC, data that closely resemble actual data can be generated, outperforming other algorithms for data generation. When experiments were conducted using the generated data, the probability of predicting delinquencies increased by over 20%, and overall predictive accuracy improved by approximately 4%. These research findings are anticipated to significantly contribute to reducing delinquency rates and increasing profits when applied in actual financial institutions.

A New Prediction Model for Power Consumption with Local Weather Information (지역 기상 정보를 활용한 단기 전력 수요 예측 모델)

  • Tak, Haesung;Kim, Taeyong;Cho, Hwan-Gue;Kim, Heeje
    • The Journal of the Korea Contents Association
    • /
    • v.16 no.11
    • /
    • pp.488-498
    • /
    • 2016
  • Much of the information is stored as data, research has been activated for analyzing the data and predicting the special circumstances. In the case of power data, the studies, such as research of renewable energy utilization, power prediction depending on site characteristics, smart grid, and micro-grid, is actively in progress. In this paper, we propose a power prediction model using the substation environment data. In this case, we try to verify the power prediction result to reflect the multiple arguments on the power and weather data, rather than a simple power data. The validation process is the effect of multiple factors compared to other two methods, one of power prediction result considering power data and the other result using power pattern data that have been made in the similar weather data. Our system shows that it can achieve max prediction error of less than 15%.

Prediction of Water Quality in Large Rivers with Tributary Input using Artificial Neural Network Model (인공신경망 모델을 이용한 지천유입이 있는 대하천의 수질예측)

  • Seo, Il Won;Yun, Se Hun;Jung, Sung Hyun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2018.05a
    • /
    • pp.45-45
    • /
    • 2018
  • 오염물의 혼합거동을 해석하기 위해 물리기반 모델을 이용하는 경우 모델을 구축하고 운용하는데 많은 시간과 재정이 소요되며 현장검증을 통한 검증이 반드시 필요하다. 하지만 데이터 기반 모델의 경우 축적된 데이터만으로도 예측을 수행할 수 있으며 물리기반모델에 비해 결정해야할 입력인자가 적어 모델운용이 용이하다는 장점이 있다. 다양한 데이터 모델 중 인공신경망(ANN) 모델은 데이터가 가지는 불확실성 및 비정상성, 복잡한 상호관련성에 효과적으로 대응할 수 있는 모델로 수자원 및 환경 분야에서 자주 사용되고 있다. 본 연구에서는 인공신경망 모델을 이용하여 지천유입이 있는 대하천의 수질인자 (pH, 전기전도도, DO, chl-a)를 예측하였다. 다른 데이터기반 모델과 같이 인공신경망 모델 또한 수집된 데이터 질에 크게 영향을 받으며, 내부 입력인자의 선택이 모델의 예측 결과에 큰 영향을 미친다. 이러한 인공신경망 모델의 특성을 바탕으로 예측모형의 정확도를 향상하기 위해서는 크게 데이터 처리부분과 모델구축 부분에서의 접근이 필요하다. 본 연구에서는 데이터 처리 과정에서 연구대상지점의 각각의 수질인자가 가지는 분포 특성을 유지하기 위해 층화표츨추출법을 이용하여 데이터를 구성하였다. 모델의 구축 과정에서는 초기가중치 값의 영향을 줄이기 위해 앙상블기법을 사용하였으며, 좀 더 견고하고 정확한 결과를 예측하기 위해 탄력적 역전파알고리즘을 추가하였다. 추가적으로 합류 후 본류의 미 계측지역 수질 예측 정확도 향상을 위해 본류의 수질인자뿐만 아니라 지류의 수질인자를 입력자료로 사용하여 모의를 수행하였다. 또한 동일 구간에서 수행한 현장추적자실험 자료를 이용하여 수질인자의 분포특성을 비교, 검증하였다. 개발된 모델을 이용하여 낙동강과 금호강 합류부 하류의 수질인자를 예측한 결과 지류의 수질인자를 입력자료로 추가한 경우 예측의 정확도가 증가하였으며, 현장실험 자료를 통해 밝혀진 오염물의 거동현상을 인공신경망 모델로도 동일하게 재현하는 것으로 나타났다. 본 연구에서 제안한 인공신경모델을 이용한다면 물리기반 수치모델을 대체하여 지천으로 유입된 오염물의 거동을 정확하고 효율적으로 파악할 수 있을 것이다.

  • PDF

Electric Power Demand Prediction Using Deep Learning Model with Temperature Data (기온 데이터를 반영한 전력수요 예측 딥러닝 모델)

  • Yoon, Hyoup-Sang;Jeong, Seok-Bong
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.11 no.7
    • /
    • pp.307-314
    • /
    • 2022
  • Recently, researches using deep learning-based models are being actively conducted to replace statistical-based time series forecast techniques to predict electric power demand. The result of analyzing the researches shows that the performance of the LSTM-based prediction model is acceptable, but it is not sufficient for long-term regional-wide power demand prediction. In this paper, we propose a WaveNet deep learning model to predict electric power demand 24-hour-ahead with temperature data in order to achieve the prediction accuracy better than MAPE value of 2% which statistical-based time series forecast techniques can present. First of all, we illustrate a delated causal one-dimensional convolutional neural network architecture of WaveNet and the preprocessing mechanism of the input data of electric power demand and temperature. Second, we present the training process and walk forward validation with the modified WaveNet. The performance comparison results show that the prediction model with temperature data achieves MAPE value of 1.33%, which is better than MAPE Value (2.33%) of the same model without temperature data.

Sequential Bayesian Evolutionary Computations for Time Series Prediction (순차적 베이지안 진화 연산을 이용한 시계열 예측)

  • 조동연;장병탁
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.311-313
    • /
    • 2000
  • 본 논문에서는 시간이 흐름에 따라 관측되는 시계열 데이터에 대한 예측을 위한 순차적 베이지안 진화 연산기법을 제안한다. 이 방법에서는 이전 세대의 모델을 바탕으로 예측을 수행하고 새로운 데이터가 주어지면 현재의 예측 모델을 평가하여 더 좋은 모델을 생성하도록 한다. 제안된 방법을 시계열 데이터에 적용한 결과 기조의 방법보다 데이터에 적합한 모델을 학습하고 성공적인 예측을 수행함을 확인하였다.

  • PDF

Performance Improvement of data Mining by Input Data Discrimination (입력자료 판별에 의한 데이터 마이닝의 성능개선)

  • 이재식;이진천
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2000.04a
    • /
    • pp.293-303
    • /
    • 2000
  • 데이터 마이닝의 수행 예측 오차를 줄이기 위한 방법으로 하나의 문제를 여러 기법들을 결합하여 해결하고 있다. 본 연구에서는 새로운 결합 모델을 제시하고 이를 통해 예측 오차를 감소시킬 수 있는 가능성을 제시한다. 제시된 결합모델의 성능을 검증하기 위해서 국내 자동차보험 회사의 고객데이터를 바탕으로 고객이탈 예측문제를 다루었다. 결합모델의 예측결과를 의사결정나무, 사례기반추론 그리고 인공신경망 중 하나의 기법만을 사용하여 예측한 결과와 비교 평가하였다. 평가 결과, 결합 모델의 예측 적중률이 개별 기법의 예측 적중률보다 우수했다.

  • PDF