• 제목/요약/키워드: mean integrated absolute error

검색결과 23건 처리시간 0.026초

단변량 시계열 모형들의 단순 결합의 예측 성능 (Performance for simple combinations of univariate forecasting models)

  • 이선홍;성병찬
    • 응용통계연구
    • /
    • 제35권3호
    • /
    • pp.385-393
    • /
    • 2022
  • 본 논문에서는 시계열 예측 분야에서 잘 알려져 있는 단변량 시계열 모형들을 이용하여, 그들의 단순 조합이 어떤 예측력을 보여주는지 연구한다. 고려된 단변량 시계열 모형으로는, 지수평활 및 ARIMA(autoregressive integrated moving average) 모형들과 그들의 확장된 형태인 모형들 그리고 예측의 벤치마크 모형으로 자주 사용되는 비계절 및 계절 랜덤워크 모형이다. 단순 조합의 방법은 중앙값과 평균을 이용하였으며, 검증을 위하여 사용된 데이터셋은 3,003개의 시계열 자료로 구성된 M3-competition 자료이다. 예측 성능을 sMAPE(symmetric mean absolute percentage error)와 MASE(mean absolute scaled error)로 평가한 결과, 단변량 시계열 모형들의 단순 조합이 아주 우수한 예측력을 가지고 있음을 확인하였다.

국소 선형 복합 분위수 회귀에서의 평활계수 선택 (Selection of bandwidth for local linear composite quantile regression smoothing)

  • 전명식;강종경;방성완
    • 응용통계연구
    • /
    • 제30권5호
    • /
    • pp.733-745
    • /
    • 2017
  • 국소복합분위수 회귀모형을 활용한 비모수적 함수 추정방법이 높은 효율성과 더불어 활발히 연구되고 있다. 이러한 추정과정에 커널을 사용한 자료 평활방법이 대표적으로 사용되고 있으며, 그 성능은 커널보다는 평활계수의 선택 크게 의존한다. 한편, 회귀함수 추정방법의 성능을 평가하는 기준으로는 통상적으로 $L_2$-노름이 사용되어 평균제곱오차 또는 평균적분제곱오차를 최소화하는 평활계수의 선택에 대한 많은 연구가 진행되어 왔다. 본 논문에서는 국소선형 복합 분위수 회귀방법을 활용한 비모수 회귀모형 추정량의 성능을 결정하는 평활계수 선택의 최적성에 관해 연구하였다. 특히, 여러 장점을 가졌으나 수리적 어려움으로 연구가 미흡한 평균절대오차 및 평균적분절대오차를 최적의 기준으로 삼아 최적의 평활계수를 구하고 그 유일성에 관해 연구하였다. 나아가 기존의 평가기준인 평균제곱오차 및 평균적분제곱오차를 사용한 선택과의 관계를 파악하고 그 성능을 비교하였다. 이러한 과정에서 다양한 상황에서의 모의실험을 통해 제안한 방법의 특성을 규명하였다.

Exploiting Neural Network for Temporal Multi-variate Air Quality and Pollutant Prediction

  • Khan, Muneeb A.;Kim, Hyun-chul;Park, Heemin
    • 한국멀티미디어학회논문지
    • /
    • 제25권2호
    • /
    • pp.440-449
    • /
    • 2022
  • In recent years, the air pollution and Air Quality Index (AQI) has been a pivotal point for researchers due to its effect on human health. Various research has been done in predicting the AQI but most of these studies, either lack dense temporal data or cover one or two air pollutant elements. In this paper, a hybrid Convolutional Neural approach integrated with recurrent neural network architecture (CNN-LSTM), is presented to find air pollution inference using a multivariate air pollutant elements dataset. The aim of this research is to design a robust and real-time air pollutant forecasting system by exploiting a neural network. The proposed approach is implemented on a 24-month dataset from Seoul, Republic of Korea. The predicted results are cross-validated with the real dataset and compared with the state-of-the-art techniques to evaluate its robustness and performance. The proposed model outperforms SVM, SVM-Polynomial, ANN, and RF models with 60.17%, 68.99%, 14.6%, and 6.29%, respectively. The model performs SVM and SVM-Polynomial in predicting O3 by 78.04% and 83.79%, respectively. Overall performance of the model is measured in terms of Mean Absolute Error (MAE), Mean Absolute Percentage Error (MAPE) and the Root Mean Square Error (RMSE).

Modeling and Forecasting Saudi Stock Market Volatility Using Wavelet Methods

  • ALSHAMMARI, Tariq S.;ISMAIL, Mohd T.;AL-WADI, Sadam;SALEH, Mohammad H.;JABER, Jamil J.
    • The Journal of Asian Finance, Economics and Business
    • /
    • 제7권11호
    • /
    • pp.83-93
    • /
    • 2020
  • This empirical research aims to modeling and improving the forecasting accuracy of the volatility pattern by employing the Saudi Arabia stock market (Tadawul)by studying daily closed price index data from October 2011 to December 2019 with a number of observations being 2048. In order to achieve significant results, this study employs many mathematical functions which are non-linear spectral model Maximum overlapping Discrete Wavelet Transform (MODWT) based on the best localized function (Bl14), autoregressive integrated moving average (ARIMA) model and generalized autoregressive conditional heteroskedasticity (GARCH) models. Therefore, the major findings of this study show that all the previous events during the mentioned period of time will be explained and a new forecasting model will be suggested by combining the best MODWT function (Bl14 function) and the fitted GARCH model. Therefore, the results show that the ability of MODWT in decomposition the stock market data, highlighting the significant events which have the most highly volatile data and improving the forecasting accuracy will be showed based on some mathematical criteria such as Mean Absolute Percentage Error (MAPE), Mean Absolute Scaled Error (MASE), Root Means Squared Error (RMSE), Akaike information criterion. These results will be implemented using MATLAB software and R- software.

시계열 모델 기반의 계절성에 특화된 S-ARIMA 모델을 사용한 리튬이온 배터리의 노화 예측 및 분석 (Degradation Prediction and Analysis of Lithium-ion Battery using the S-ARIMA Model with Seasonality based on Time Series Models)

  • 김승우;이평연;권상욱;김종훈
    • 전력전자학회논문지
    • /
    • 제27권4호
    • /
    • pp.316-324
    • /
    • 2022
  • This paper uses seasonal auto-regressive integrated moving average (S-ARIMA), which is efficient in seasonality between time-series models, to predict the degradation tendency for lithium-ion batteries and study a method for improving the predictive performance. The proposed method analyzes the degradation tendency and extracted factors through an electrical characteristic experiment of lithium-ion batteries, and verifies whether time-series data are suitable for the S-ARIMA model through several statistical analysis techniques. Finally, prediction of battery aging is performed through S-ARIMA, and performance of the model is verified through error comparison of predictions through mean absolute error.

오차교정모형을 활용한 일간 벌크선 해상운임 분석과 예측 (Analysis and Forecasting of Daily Bulk Shipping Freight Rates Using Error Correction Models)

  • 고병욱
    • 한국항만경제학회지
    • /
    • 제39권2호
    • /
    • pp.129-141
    • /
    • 2023
  • 본 연구는 오차교정모형을 활용해 건화물선과 유조선 일간 해상운임의 동태적 특성과 예측 정확도를 분석한다. 공적분된 시계열 자료의 오차를 계산하기 위해 본 연구는 공통 확률적 추세 모형(Common Stochastic Trend Model, CSTM 모형)과 벡터오차교정모형(Vector Error Correction Model, VECM 모형)을 활용한다. 먼저, CSTM 모형의 오차를 사용한 오차교정모형이 VECM 모형의 경우보다 교정계수(adjustment speed coefficient)가 경제학적 이론에 더 부합하는 결과를 보인다. 나아가 조정결정계수(adjR2) 측면에서도 CSTM 모형의 경우가 VECM 모형에 비해 모형 적합도가 큰 것으로 나타난다. 둘째, 예측 정확도를 판단하는 지표인 평균 절대 오차와 평균 절대 척도 오차를 살펴보면, CSTM 모형의 오차를 이용한 모형이 VECM 모형의 오차를 이용한 모형보다 총 15가지 경우 중에 12가지 경우에서 예측 정확도가 높은 것을 확인할 수 있다. 미래 연구주제로서 1) 두 가지 오차를 모두 활용하는 분석 및 예측 과제, 2) 원자재 및 에너지 자원 시장의 데이터를 추가하는 과제, 3) 오차항의 부호에 따라 교정계수를 다르게 추정하는 과제 등을 제시한다.

가야금 안족의 위치에 따른 개선된 주파수 모델링 (An Improved Frequency Modeling Corresponding to the Location of the Anjok of the Gayageum)

  • 권순덕;조상진
    • 한국음향학회지
    • /
    • 제33권2호
    • /
    • pp.146-151
    • /
    • 2014
  • 본 논문은 기존의 가야금 안족 모델을 분석하고 안족의 위치에 따른 주파수 모델링을 개선하기 위한 방법에 대해서 기술한다. 기존의 모델은 안족의 위치별 기본 주파수의 변화를 지수 함수로 가정, 리키 적분기를 이용하여 이들 주파수를 적분한 후 선형 회귀 모델을 이용하여 주파수와 안족의 위치에 관한 수식의 파라미터를 구하였다. 이 모델은 평균적으로 2.5 Hz의 오차를 보였으나 낮은 주파수에 대해서는 최대 7.75 Hz의 오차를 보였다. 이에 제안하는 모델은 안족의 위치를 세부 구간으로 나누고 각 구간 내 누적 주파수에 대한 선형 회귀 모델을 적용하였고, 리키 적분기의 계수를 바꿔가며 안족 위치의 세부 구간 내 각 현의 기본 주파수와 계산된 주파수간 RMSE(Root Mean Square Error)가 최소가 되는 계수를 찾음으로써 최적의 파라미터를 구하였다. 이러한 과정을 통해 얻어진 모델은 기존의 오차를 최대 3배가량 줄일 수 있었다.

Predicting the Unemployment Rate Using Social Media Analysis

  • Ryu, Pum-Mo
    • Journal of Information Processing Systems
    • /
    • 제14권4호
    • /
    • pp.904-915
    • /
    • 2018
  • We demonstrate how social media content can be used to predict the unemployment rate, a real-world indicator. We present a novel method for predicting the unemployment rate using social media analysis based on natural language processing and statistical modeling. The system collects social media contents including news articles, blogs, and tweets written in Korean, and then extracts data for modeling using part-of-speech tagging and sentiment analysis techniques. The autoregressive integrated moving average with exogenous variables (ARIMAX) and autoregressive with exogenous variables (ARX) models for unemployment rate prediction are fit using the analyzed data. The proposed method quantifies the social moods expressed in social media contents, whereas the existing methods simply present social tendencies. Our model derived a 27.9% improvement in error reduction compared to a Google Index-based model in the mean absolute percentage error metric.

Traffic Emission Modelling Using LiDAR Derived Parameters and Integrated Geospatial Model

  • Azeez, Omer Saud;Pradhan, Biswajeet;Jena, Ratiranjan;Jung, Hyung-Sup;Ahmed, Ahmed Abdulkareem
    • 대한원격탐사학회지
    • /
    • 제35권1호
    • /
    • pp.137-149
    • /
    • 2019
  • Traffic emissions are the main cause of environmental pollution in cities and respiratory problems amongst people. This study developed a model based on an integration of support vector regression (SVR) algorithm and geographic information system (GIS) to map traffic carbon monoxide (CO) concentrations and produce prediction maps from micro level to macro level at a particular time gap in a day in a very densely populated area (Utara-Selatan Expressway-NKVE, Kuala Lumpur, Malaysia). The proposed model comprised two models: the first model was implemented to estimate traffic CO concentrations using the SVR model, and the second model was applied to create prediction maps at different times a day using the GIS approach. The parameters for analysis were collected from field survey and remote sensing data sources such as very-high-resolution aerial photos and light detection and ranging point clouds. The correlation coefficient was 0.97, the mean absolute error was 1.401 ppm and the root mean square error was 2.45 ppm. The proposed models can be effectively implemented as decision-making tools to find a suitable solution for mitigating traffic jams near tollgates, highways and road networks.

A Comparative Study Between Linear Regression and Support Vector Regression Model Based on Environmental Factors of a Smart Bee Farm

  • Rahman, A. B. M. Salman;Lee, MyeongBae;Venkatesan, Saravanakumar;Lim, JongHyun;Shin, ChangSun
    • 스마트미디어저널
    • /
    • 제11권5호
    • /
    • pp.38-47
    • /
    • 2022
  • Honey is one of the most significant ingredients in conventional food production in different regions of the world. Honey is commonly used as an ingredient in ethnic food. Beekeeping is performed in various locations as part of the local food culture and an occupation related to pollinator production. It is important to conduct beekeeping so that it generates food culture and helps regulate the regional environment in an integrated manner in preserving and improving local food culture. This study analyzes different types of environmental factors of a smart bee farm. The major goal of this study is to determine the best prediction model between the linear regression model (LM) and the support vector regression model (SVR) based on the environmental factors of a smart bee farm. The performance of prediction models is measured by R2 value, root mean squared error (RMSE), and mean absolute error (MAE). From all analysis reports, the best prediction model is the support vector regression model (SVR) with a low coefficient of variation, and the R2 values for Farm inside temperature, bee box inside temperature, and Farm inside humidity are 0.97, 0.96, and 0.44.