• 제목/요약/키워드: mape(mean absolute percentage error)

Search Result 110, Processing Time 0.028 seconds

선별적 데이터 학습 기반의 베이지안 네트워크를 이용한 단기차량속도 예측 (A Short-Term Vehicle Speed Prediction using Bayesian Network Based Selective Data Learning)

  • 박성호;유영중;문상호;김영호
    • 한국정보통신학회논문지
    • /
    • 제19권12호
    • /
    • pp.2779-2784
    • /
    • 2015
  • 정확한 교통정보의 예측은 출발지로부터 목적지까지의 최적경로를 제공할 수 있으며, 이로 인해 시간과 비용의 절감 효과를 얻을 수 있다. 본 논문에서는 다양한 교통정보 예측 방법 중 확률 모델을 기반으로 교통정보를 예측하는 베이지안 네트워크 방법을 이용한다. 기존 연구에서는 베이지안 네트워크 예측 방법이 모든 시간대에서의 데이터를 학습에 사용하는 것과는 달리, 본 논문에서는 예측하고자 하는 시간대와 동일한 요일과 시간에 해당하는 데이터만을 선별적으로 학습에 사용한다. 서로 다른 두 가지 학습방법에 따른 예측 결과의 정확도는 일반적으로 많이 사용되는 MAPE(Mean Absolute Percentage Error)로 검증하였으며, 서울 시내 14개의 링크 구간에 대해 실험을 진행하였다. 실험결과는 본 논문에서 제안한 방법이 모든 시간대의 데이터를 학습에 사용한 방법에 비해 MAPE의 관점에서 더 높은 정확도를 가진 교통 예측 값을 계산할 수 있음을 보여준다.

웨이블릿 변환과 기계 학습 접근법을 이용한 수위 데이터의 노이즈 제거 비교 분석 (Comparative analysis of wavelet transform and machine learning approaches for noise reduction in water level data)

  • 황유관;임경재;김종건;신민환;박윤식;신용철;지봉준
    • 한국수자원학회논문집
    • /
    • 제57권3호
    • /
    • pp.209-223
    • /
    • 2024
  • 4차 산업혁명 시대에 접어들어 데이터 기반의 의사결정이 보편화되고 있다. 하지만 데이터 품질이 확보되지 않은 채 수행되는 데이터 분석은 왜곡된 결과를 낳을 가능성이 존재한다. 수자원 관리의 기초가 되는 수위 데이터도 마찬가지로 결측, 스파이크, 잡음 등 다양한 품질 문제를 가진다. 본 연구에서는 잡음으로 인해 발생하는 데이터 품질 문제를 해결하고자 하였다. 잡음은 데이터의 트렌드 분석을 어렵게 하고 비정상적인 이상치를 생성할 가능성이 있다. 본 연구는 이러한 문제를 해결하기 위해 Wavelet Transform을 이용한 잡음 제거 접근 방안을 제안한다. Wavelet Transform은 신호처리에 주로 사용되는 방법으로 잡음 제거에 효과적인 것으로 알려져 있으며 수집된 데이터의 정답 데이터(True value) 수집을 요구하지 않으므로 시간과 비용을 줄일 수 있다는 점에서 적용이 용이한 편이다. 본 연구는 Wavelet Transform의 성능 평가를 위해 대표적인 머신러닝 기반 잡음 제거 방법인 Denoising Autoencoder와 성능 비교를 수행하였다. 그 결과 Wavelet Transform 중 Coiflets 함수는, Denoising Autoencoder에 비해 Mean Absolute Error, Mean Absolute Percentage Error, Mean Squared Error 등 모든 측면에서 우수한 성능을 보이는 것으로 나타났다. 이러한 결과는 환경에 맞는 적절한 웨이블릿 함수의 선택을 통한 잡음 문제를 효과적으로 해결할 수 있음을 시사한다. 본 연구는 수위 데이터의 품질을 향상시켜 수자원 관리 결정의 신뢰성에 기여하는 강력한 도구로서 Wavelet Transform의 잠재력을 확인한 의의가 있다.

계절변동의 함수적 예측 (Functional Forecasting of Seasonality)

  • 이긍희
    • 응용통계연구
    • /
    • 제28권5호
    • /
    • pp.885-893
    • /
    • 2015
  • 통계청과 한국은행 등 통계작성기관에서 이용되고 있는 계절조정은 연간 경제통계 작성시 시계열을 예측한 후 계절조정방법을 적용하여 1년 후 계절변동을 예측하고 원통계 작성시 원통계에서 이를 제거하여 계절조정계열을 작성하고 있다. 이 경우 계절변동을 효과적으로 예측하는 것이 계절조정계열의 품질 향상을 위해 무엇보다 중요하다. 계절변동은 1년 단위로 비슷한 함수적 형태를 지니면서 변하므로 계절변동은 일종의 함수적 시계열이다. 함수적 시계열은 함수적 주성분분석을 바탕으로 한 함수적 시계열모형으로 예측할 수 있다. 본 연구에서는 함수적 시계열 모형을 이용하여 향후 1년간 계절변동을 예측하는 방안을 마련하고 X-11 방식 등 기존의 예측방법과 비교하여 유용성을 파악하였다.

ARIMA 모델을 이용한 항공운임예측에 관한 연구 (A Study of Air Freight Forecasting Using the ARIMA Model)

  • 서상석;박종우;송광석;조승균
    • 유통과학연구
    • /
    • 제12권2호
    • /
    • pp.59-71
    • /
    • 2014
  • Purpose - In recent years, many firms have attempted various approaches to cope with the continual increase of aviation transportation. The previous research into freight charge forecasting models has focused on regression analyses using a few influence factors to calculate the future price. However, these approaches have limitations that make them difficult to apply into practice: They cannot respond promptly to small price changes and their predictive power is relatively low. Therefore, the current study proposes a freight charge-forecasting model using time series data instead a regression approach. The main purposes of this study can thus be summarized as follows. First, a proper model for freight charge using the autoregressive integrated moving average (ARIMA) model, which is mainly used for time series forecast, is presented. Second, a modified ARIMA model for freight charge prediction and the standard process of determining freight charge based on the model is presented. Third, a straightforward freight charge prediction model for practitioners to apply and utilize is presented. Research design, data, and methodology - To develop a new freight charge model, this study proposes the ARIMAC(p,q) model, which applies time difference constantly to address the correlation coefficient (autocorrelation function and partial autocorrelation function) problem as it appears in the ARIMA(p,q) model and materialize an error-adjusted ARIMAC(p,q). Cargo Account Settlement Systems (CASS) data from the International Air Transport Association (IATA) are used to predict the air freight charge. In the modeling, freight charge data for 72 months (from January 2006 to December 2011) are used for the training set, and a prediction interval of 23 months (from January 2012 to November 2013) is used for the validation set. The freight charge from November 2012 to November 2013 is predicted for three routes - Los Angeles, Miami, and Vienna - and the accuracy of the prediction interval is analyzed using mean absolute percentage error (MAPE). Results - The result of the proposed model shows better accuracy of prediction because the MAPE of the error-adjusted ARIMAC model is 10% and the MAPE of ARIMAC is 11.2% for the L.A. route. For the Miami route, the proposed model also shows slightly better accuracy in that the MAPE of the error-adjusted ARIMAC model is 3.5%, while that of ARIMAC is 3.7%. However, for the Vienna route, the accuracy of ARIMAC is better because the MAPE of ARIMAC is 14.5% and the MAPE of the error-adjusted ARIMAC model is 15.7%. Conclusions - The accuracy of the error-adjusted ARIMAC model appears better when a route's freight charge variance is large, and the accuracy of ARIMA is better when the freight charge variance is small or has a trend of ascent or descent. From the results, it can be concluded that the ARIMAC model, which uses moving averages, has less predictive power for small price changes, while the error-adjusted ARIMAC model, which uses error correction, has the advantage of being able to respond to price changes quickly.

강제환기식 돈사의 환기량 추정을 위한 회귀모델의 비교 (Comparison of Regression Models for Estimating Ventilation Rate of Mechanically Ventilated Swine Farm)

  • 조광곤;하태환;윤상후;장유나;정민웅
    • 한국농공학회논문집
    • /
    • 제62권1호
    • /
    • pp.61-70
    • /
    • 2020
  • To estimate the ventilation volume of mechanically ventilated swine farms, various regression models were applied, and errors were compared to select the regression model that can best simulate actual data. Linear regression, linear spline, polynomial regression (degrees 2 and 3), logistic curve, generalized additive model (GAM), and gompertz curve were compared. Overfitting models were excluded even when the error rate was small. The evaluation criteria were root mean square error (RMSE) and mean absolute percentage error (MAPE). The evaluation results indicated that degree 3 exhibited the lowest error rate; however, an overestimation contradiction was observed in a certain section. The logistic curve was the most stable and superior to all the models. In the estimation of ventilation volume by all of the models, the estimated ventilation volume of the logistic curve was the smallest except for the model with a large error rate and the overestimated model.

더미변수(Dummy Variable)를 포함하는 다변수 시계열 모델을 이용한 단기부하예측 (Short-Term Load Forecasting Using Multiple Time-Series Model Including Dummy Variables)

  • 이경훈;김진오
    • 대한전기학회논문지:전력기술부문A
    • /
    • 제52권8호
    • /
    • pp.450-456
    • /
    • 2003
  • This paper proposes a multiple time-series model with dummy variables for one-hour ahead load forecasting. We used 11 dummy variables that were classified by day characteristics such as day of the week, holiday, and special holiday. Also, model specification and selection of input variables including dummy variables were made by test statistics such as AIC(Akaike Information Criterion) and t-test statistics of each coefficient. OLS (Ordinary Least Squares) method was used for estimation and forecasting. We found out that model specifications for each hour are not identical usually at 30% of optimal significance level, and dummy variables reduce the forecasting error if they are classified properly. The proposed model has much more accurate estimates in forecasting with less MAPE (Mean Absolute Percentage Error).

개별차량 주행정보를 이용한 차로별 구간대표통행시간 산출기법 (A Novel Method for Estimating Representative Section Travel Times Using Individual Vehicle Trajectory Data)

  • 임희섭;오철;강경표
    • 한국ITS학회 논문지
    • /
    • 제8권6호
    • /
    • pp.23-35
    • /
    • 2009
  • 유비쿼터스 환경을 기반으로 하여 돌발상황 발생 시 신뢰성 있는 통행시간 예측을 위해 새로운 개념의 노드-링크 설정 기법을 활용한 대표통행시간 산출기법을 연구하였다. 본 연구에서 제시한 방법론은 교통류의 특성에 따라 링크를 구분하여 개별적인 통행시간을 산출하는 기법이며, 개별차량의 특성을 반영하기 위해 일정 속도단위로 차량분류군을 구분하여 통행시간을 산출하는 방법을 제시하였다. 사고영향권과 사고영향권 상류부, 사고영향권 하류부를 독립적인 링크로 설정 하였으며, 돌발상황 발생 시 나타나는 차로별 통행시간의 특성을 반영하기 위해 통행시간 제공 방법을 차로별로 독립적인 통행시간 제공으로 설정하고, 차로별 통행시간을 산출하였다. 제안된 방법론의 정확도를 MAPE (Mean Absolute Percentage Error)를 이용하여 평가하였고, 프로브차량비율(Percentage of Probe Vehicles: PPV)에 따른 정확도의 변화를 분석하였다. 분석 결과 PPV가 20%이상 확보될 경우 오차율 10% 미만의 정확도를 가지는 것으로 분석되었다. 본 연구는 도래하는 유비쿼터스 교통환경에서 보다 신뢰성 있고, 실시간성 있는 교통정보 생성에 도움이 될 것으로 판단된다.

  • PDF

Micro-Grid 시스템에서 Peak-Shaving을 이용한 PV+ 시스템의 최적 운영 방법 (Optimal Operating Method of PV+ Storage System Using the Peak-Shaving in Micro-Grid System)

  • 이지환;이강원
    • 산업경영시스템학회지
    • /
    • 제43권2호
    • /
    • pp.1-13
    • /
    • 2020
  • There are several methods of peak-shaving, which reduces grid power demand, electricity bought from electricity utility, through lowering "demand spike" during On-Peak period. An optimization method using linear programming is proposed, which can be used to perform peak-shaving of grid power demand for grid-connected PV+ system. Proposed peak shaving method is based on the forecast data for electricity load and photovoltaic power generation. Results from proposed method are compared with those from On-Off and Real Time methods which do not need forecast data. The results also compared to those from ideal case, an optimization method which use measured data for forecast data, that is, error-free forecast data. To see the effects of forecast error 36 error scenarios are developed, which consider error types of forecast, nMAE (normalizes Mean Absolute Error) for photovoltaic power forecast and MAPE (Mean Absolute Percentage Error) for load demand forecast. And the effects of forecast error are investigated including critical error scenarios which provide worse results compared to those of other scenarios. It is shown that proposed peak shaving method are much better than On-Off and Real Time methods under almost all the scenario of forecast error. And it is also shown that the results from our method are not so bad compared to the ideal case using error-free forecast.

LSTM을 이용한 한반도 근해 이상수온 예측모델 (Abnormal Water Temperature Prediction Model Near the Korean Peninsula Using LSTM)

  • 최혜민;김민규;양현
    • 대한원격탐사학회지
    • /
    • 제38권3호
    • /
    • pp.265-282
    • /
    • 2022
  • 해수면 온도(Sea surface temperature, SST)는 지구시스템에서 해양의 순환과 생태계에 큰 영향을 주는 요소이다. 지구온난화로 한반도 근해 해수면 온도에 변화가 생기면서 이상 수온(고수온, 저수온) 현상이 발생하여 해양생태계와 수산업 피해를 지속적으로 발생시키고 있다. 따라서 본 연구는 한반도 근해 해수면 온도를 예측하여 이상 수온 현상 예측으로 피해를 예방하는 방법론을 제안한다. 연구 지역은 한반도 근해로 설정하여 동시간대 해수면 온도 데이터를 사용하기 위해 Europe Centre for Medium-Range Weather Forecasts (ECMWF)의 ERA5 자료를 사용하였다. 연구방법으로는 해수면 온도 데이터의 시계열 특징을 고려하여 딥러닝 모델 중 시계열 데이터 예측에 특화된 Long Short-Term Memory (LSTM) 알고리즘을 이용하였다. 예측 모델은 1~7일 이후 한반도 근해 해수면 온도를 예측하고 고수온(High water temperature, HWT) 혹은 저수온(Low water temperature, LWT) 현상을 예측한다. 해수면 온도 예측 정확도 평가를 위해 결정계수(Coefficient of determination, R2), 평균제곱근 편차(Root Mean Squared Error, RMSE), 평균 절대 백분율 오차(Mean Absolute Percentage Error, MAPE) 지표를 사용하였다. 예측 모델의 여름철(JAS) 1일 예측 결과는 R2=0.996, RMSE=0.119℃, MAPE=0.352% 이고, 겨울철(JFM) 1일 예측 결과는 R2=0.999, RMSE=0.063℃, MAPE=0.646% 이었다. 예측한 해수면 온도를 이용하여 이상 수온 예측 정확도 평가를 F1 Score로 수행하였다(여름철(2021/08/05) 고수온 예측 결과 F1 Score=0.98, 겨울철(2021/02/19) 저수온 예측 결과 F1 Score=1.0). 예측 기간이 증가하면서 예측 모델이 해수면 온도를 과소추정하는 경향을 보여주었고, 이로 인해 이상 수온 예측 정확도 또한 낮아졌다. 따라서, 향후 예측 모델의 과소추정 원인을 분석하고 예측 정확도 향상을 위한 연구가 필요할 것으로 판단된다.

SUNSPOT AREA PREDICTION BASED ON COMPLEMENTARY ENSEMBLE EMPIRICAL MODE DECOMPOSITION AND EXTREME LEARNING MACHINE

  • Peng, Lingling
    • 천문학회지
    • /
    • 제53권6호
    • /
    • pp.139-147
    • /
    • 2020
  • The sunspot area is a critical physical quantity for assessing the solar activity level; forecasts of the sunspot area are of great importance for studies of the solar activity and space weather. We developed an innovative hybrid model prediction method by integrating the complementary ensemble empirical mode decomposition (CEEMD) and extreme learning machine (ELM). The time series is first decomposed into intrinsic mode functions (IMFs) with different frequencies by CEEMD; these IMFs can be divided into three groups, a high-frequency group, a low-frequency group, and a trend group. The ELM forecasting models are established to forecast the three groups separately. The final forecast results are obtained by summing up the forecast values of each group. The proposed hybrid model is applied to the smoothed monthly mean sunspot area archived at NASA's Marshall Space Flight Center (MSFC). We find a mean absolute percentage error (MAPE) and a root mean square error (RMSE) of 1.80% and 9.75, respectively, which indicates that: (1) for the CEEMD-ELM model, the predicted sunspot area is in good agreement with the observed one; (2) the proposed model outperforms previous approaches in terms of prediction accuracy and operational efficiency.