• 제목/요약/키워드: mape(mean absolute percentage error)

검색결과 110건 처리시간 0.026초

k-Nearest Neighbor 알고리즘을 이용한 도심 내 주요 도로 구간의 교통속도 단기 예측 방법 (Short-Term Prediction of Vehicle Speed on Main City Roads using the k-Nearest Neighbor Algorithm)

  • 모하메드 아리프 라시이디;김정민;류광렬
    • 지능정보연구
    • /
    • 제20권1호
    • /
    • pp.121-131
    • /
    • 2014
  • 교통속도는 교통 문제를 해결하기 위한 중요한 지표 중 하나이다. 이를 이용하여 교통혼잡 탐지, 주행 시간 예측, 도로 설계와 같은 다양한 문제 해결에 활용할 수 있다. 따라서 정확한 교통속도 예측은 지능형 교통 시스템의 개발에 있어 필수적인 요소라고 할 수 있다. 본 논문에서는 대한민국 부산시의 특정 도로를 대상으로 교통 속도에 대한 분석 및 예측을 수행하였다. 과거 연구에서는 대상 도로의 속도 예측을 위해 과거 대상 도로의 교통속도 이력 데이터만을 사용하였다. 그러나 실제 대상 도로의 교통 상황은 인접한 도로의 교통 상황의 영향을 받게 된다. 따라서 본 논문에서는 실제 부산시의 과거 교통속도 이력 데이터를 기반으로 대상 도로와 인접 도로를 모두 고려하여 교통속도 예측 모델의 학습을 위한 속성을 추출하였다. 이와 같이 후보 속성들을 추출 한 후 선형 회귀 (linear regression), 모델 트리 (model tree) 및 k-nearest neighbor (k-NN) 기법을 이용하여 속성의 부분집합 선택 (feature subset selection)과 교통속도 예측 모델 생성을 수행하였다. 실험 결과 주어진 교통 데이터에서 k-NN 기법은 선형 회귀 및 모델 트리 기법에 비해 평균절대백분율오차 (mean absolute percent error, MAPE)와 제곱근평균제곱오차 (root mean squared error, RMSE) 측면에서 더 나은 성능을 보임을 확인하였다.

다층 퍼셉트론을 이용한 인버터의 효율 감소 진단 모델에 관한 연구 (Research on Model to Diagnose Efficiency Reduction of Inverters using Multilayer Perceptron)

  • 정하영;홍석훈;전재성;임수창;김종찬;박철영
    • 한국멀티미디어학회논문지
    • /
    • 제25권10호
    • /
    • pp.1448-1456
    • /
    • 2022
  • This paper studies a model to diagnose efficiency reduction of inverter using Multilayer Perceptron(MLP). In this study, two inverter data which started operation at different day was used. A Multilayer Perceptron model was made to predict photovoltaic power data of the latest inverter. As a result of the model's performance test, the Mean Absolute Percentage Error(MAPE) was 4.1034. The verified model was applied to one-year-old and two-year-old data after old inverter starting operation. The predictive power of one-year-old inverter was larger than the observed power by 724.9243 on average. And two-year-old inverter's predictive value was larger than the observed power by 836.4616 on average. The prediction error of two-year-old inverter rose 111.5572 on a year. This error is 0.4% of the total capacity. It was proved that the error is meaningful difference by t-test. The error is predicted value minus actual value. Which means that PV system actually generated less than prediction. Therefore, increasing error is decreasing conversion efficiency of inverter. Finally, conversion efficiency of the inverter decreased by 0.4% over a year using this model.

웨이블렛 신경회로망을 이용한 상품 수요 예측 모형에 관한 연구 (A Study for Sales and Demand Forecasting Model Using Wavelet Neural Networks)

  • 이재현
    • 한국전자통신학회논문지
    • /
    • 제9권1호
    • /
    • pp.131-136
    • /
    • 2014
  • 본 논문에서는 패션 상품 수요 예측을 위하여 ARIMA 모형과 웨이블렛 신경회로망 모형을 결합한 상품 수요 예측 알고리즘을 개발하였다. 제시된 방법을 검증하기 위하여 2008년에서 2012년까지의 H사의 패션 상품 데이터를 바탕으로 다양한 알고리즘을 축하고 제안한 방법의 정확도를 분석하였다. 실험 결과 ARIMA 모형은 MAPE가 5.179%, 웨이블렛 신경회로망은 4.553%, 제안한 ARIMA + 웨이블렛 신경회로망 모형은 4.448%로 나타나 성능이 우수한 것으로 나타났다. 따라서 제안된 방법을 사용할 경우 패션 상품 수요 예측을 위해 유용하게 활용할 수 있음을 보였다.

열화상 이미지와 환경변수를 이용한 콘크리트 균열 깊이 예측 머신 러닝 분석 (Comparison Analysis of Machine Learning for Concrete Crack Depths Prediction Using Thermal Image and Environmental Parameters)

  • 김지형;장아름;박민재;주영규
    • 한국공간구조학회논문집
    • /
    • 제21권2호
    • /
    • pp.99-110
    • /
    • 2021
  • This study presents the estimation of crack depth by analyzing temperatures extracted from thermal images and environmental parameters such as air temperature, air humidity, illumination. The statistics of all acquired features and the correlation coefficient among thermal images and environmental parameters are presented. The concrete crack depths were predicted by four different machine learning models: Multi-Layer Perceptron (MLP), Random Forest (RF), Gradient Boosting (GB), and AdaBoost (AB). The machine learning algorithms are validated by the coefficient of determination, accuracy, and Mean Absolute Percentage Error (MAPE). The AB model had a great performance among the four models due to the non-linearity of features and weak learner aggregation with weights on misclassified data. The maximum depth 11 of the base estimator in the AB model is efficient with high performance with 97.6% of accuracy and 0.07% of MAPE. Feature importances, permutation importance, and partial dependence are analyzed in the AB model. The results show that the marginal effect of air humidity, crack depth, and crack temperature in order is higher than that of the others.

SARIMA 모델을 이용한 태양광 발전량 예측연구 (A Research of Prediction of Photovoltaic Power using SARIMA Model)

  • 정하영;홍석훈;전재성;임수창;김종찬;박형욱;박철영
    • 한국멀티미디어학회논문지
    • /
    • 제25권1호
    • /
    • pp.82-91
    • /
    • 2022
  • In this paper, time series prediction method of photovoltaic power is introduced using seasonal autoregressive integrated moving average (SARIMA). In order to obtain the best fitting model by a time series method in the absence of an environmental sensor, this research was used data below 50% of cloud cover. Three samples were extracted by time intervals from the raw data. After that, the best fitting models were derived from mean absolute percentage error (MAPE) with the minimum akaike information criterion (AIC) or beysian information criterion (BIC). They are SARIMA (1,0,0)(0,2,2)14, SARIMA (1,0,0)(0,2,2)28, SARIMA (2,0,3)(1,2,2)55. Generally parameter of model derived from BIC was lower than AIC. SARIMA (2,0,3)(1,2,2)55, unlike other models, was drawn by AIC. And the performance of models obtained by SARIMA was compared. MAPE value was affected by the seasonal period of the sample. It is estimated that long seasonal period samples include atmosphere irregularity. Consequently using 1 hour or 30 minutes interval sample is able to be helpful for prediction accuracy improvement.

퇴적토 배출을 수반한 연직수문의 수리특성에 관한 실험적 연구 (An Experimental Study for the Hydraulic Characteristics of Vertical lift Gates with Sediment Transport)

  • 최승제;이지행;최흥식
    • Ecology and Resilient Infrastructure
    • /
    • 제5권4호
    • /
    • pp.246-256
    • /
    • 2018
  • 하단배출 형태의 연직수문에서의 퇴적토사 이동을 수반한 유량계수, 수력도약 높이, 수력도약 길이의 수리특성을 분석하기 위해 수리 모형실험과 차원해석을 수행하였다. Froude 수와 수리특성의 상관관계를 퇴적토 이동 유무에 따라 도식화하고, 무차원 매개변수와 수리특성의 상관성을 분석하고 다중회귀분석식을 개발하였다. 퇴사의 이동을 수반한 수리특성은 퇴적토의 이동이 없을 경우와는 다른 양상을 확인하여 퇴적토 이동을 특성을 나타낼 수 있는 변수의 도입이 필요함을 확인하였다. 유량계수, 수력도약 높이와 수력도약 길이에 대한 각 다중회귀분석식의 결정계수는 유량계수 0.749, 수력도약 높이 0.896, 수력도약 길이 0.955로 높게 나타났다. 개발한 수리특성식의 적용성을 평가하기 위해 실제 측정값과 회귀분석식에 의해 계산된 값의 95%의 예측구간 분석을 수행하였고, 유량계수, 수력도약 높이와 길이에 대한 예측의 정확도 분석차원의 NSE (Nash-Sutcliffe Efficiency), RMSE (root mean square)와 MAPE (mean absolute percentage error)는 적절한 것으로 판단되었다.

고속국도에서의 연평균일교통량에 따른 N번째 고순위 시간교통량 추정모형 개발에 관한 연구 (Development of Nth Highest Hourly Traffic Volume Forecasting Models)

  • 오주삼
    • 한국도로학회논문집
    • /
    • 제9권3호
    • /
    • pp.13-20
    • /
    • 2007
  • 일반적으로 도로의 차로수 산출시에 30번째 혹은 100번째의 설계시간교통량을 활용하게 된다. 이러한 설계시간교통량은 설계시간계수에 연평균일교통량을 곱하여 산출하고 있다. 본 논문에서 고속국도에서 운영 중인 34개소의 상시교통량 조사 자료를 기초하여 연평균일교통량 5만대를 기준으로 하여 30번째와 100번째의 시간교통량을 추정할 수 있는 회귀모형을 각각 구축하였다. 30, 100번째 순위의 시간교통량의 추정능력을 평가지표 MAPE(Mean Absolute Percentage Error)를 활용하여 기존방법과 비교 평가했을 때, 30번째 시간교통량을 추정에서 5만대 이하 모형에서는 추정오차가 기존방법에 비해서 11.83% 감소하고 5만대 이상에서는 22.17% 감소하는 것으로 분석되었다. 또한 100번째 시간교통량 추정능력 평가에서는 5만대 이하일 때는 추정오차가 기존방법에 비해서 8.16%감소하고 5만대 이상에서는 15.25% 감소하는 것으로 평가되었다.

  • PDF

데이터 마이닝 기반 스마트 공장 에너지 소모 예측 모델 (An Energy Consumption Prediction Model for Smart Factory Using Data Mining Algorithms)

  • ;이명배;임종현;김유빈;신창선;박장우;조용윤
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권5호
    • /
    • pp.153-160
    • /
    • 2020
  • 산업용 에너지 소비 예측은 에너지 수요와 공급에 동적이고 계절적인 변화가 있기 때문에 에너지 관리 및 제어 시스템에서 중요한 위치를 차지한다. 본 논문은 철강 산업의 에너지 소비 예측 모델을 제시하고 논의한다. 사용되는 데이터에는 후행 및 선도적인 전류 반응 전력, 후행 및 선도적인 전류 동력 계수, 이산화탄소(TCO2) 배출 및 부하 유형이 포함된다. 테스트 세트에서는 (a) 선형 회귀(LR), (b) 방사형 커널(SVM RBF), (c) Gradient Boosting Machine (GBM), (d) 무작위 포리스트(RF). 평균 제곱 오차(RMSE), 평균 절대 오차(MAE) 및 평균 절대 백분율 오차(ME)의 네 가지 통계 모델을 사용하여 예측하고 평가한다. 회귀 설계의 효율성 모든 예측 변수를 사용할 때 최상의 모델 RF는 테스트 세트에서 RMSE 값 7.33을 제공할 수 있다.

A Proposal for a Predictive Model for the Number of Patients with Periodontitis Exposed to Particulate Matter and Atmospheric Factors Using Deep Learning

  • Septika Prismasari;Kyuseok Kim;Hye Young Mun;Jung Yun Kang
    • 치위생과학회지
    • /
    • 제24권1호
    • /
    • pp.22-28
    • /
    • 2024
  • Background: Particulate matter (PM) has been extensively observed due to its negative association with human health. Previous research revealed the possible negative effect of air pollutant exposure on oral health. However, the predictive model between air pollutant exposure and the prevalence of periodontitis has not been observed yet. Therefore, this study aims to propose a predictive model for the number of patients with periodontitis exposed to PM and atmospheric factors in South Korea using deep learning. Methods: This study is a retrospective cohort study utilizing secondary data from the Korean Statistical Information Service and the Health Insurance Review and Assessment database for air pollution and the number of patients with periodontitis, respectively. Data from 2015 to 2022 were collected and consolidated every month, organized by region. Following data matching and management, the deep neural networks (DNN) model was applied, and the mean absolute percentage error (MAPE) value was calculated to ensure the accuracy of the model. Results: As we evaluated the DNN model with MAPE, the multivariate model of air pollution including exposure to PM2.5, PM10, and other atmospheric factors predict approximately 85% of the number of patients with periodontitis. The MAPE value ranged from 12.85 to 17.10 (mean±standard deviation=14.12±1.30), indicating a commendable level of accuracy. Conclusion: In this study, the predictive model for the number of patients with periodontitis is developed based on air pollution, including exposure to PM2.5, PM10, and other atmospheric factors. Additionally, various relevant factors are incorporated into the developed predictive model to elucidate specific causal relationships. It is anticipated that future research will lead to the development of a more accurate model for predicting the number of patients with periodontitis.

세계 유선인터넷 서비스에 대한 확산모형의 예측력 비교 (Comparative Evaluation of Diffusion Models using Global Wireline Subscribers)

  • 민의정;임광선
    • Journal of Information Technology Applications and Management
    • /
    • 제21권4_spc호
    • /
    • pp.403-414
    • /
    • 2014
  • Forecasting technology in economic activity is a quite intricate procedure so researchers should grasp the point of the data to use. Diffusion models have been widely used for forecasting market demand and measuring the degree of technology diffusion. However, there is a question that a model, explaining a certain market with goodness of fit, always shows good performance with markets of different conditions. The primary aim of this paper is to explore diffusion models which are frequently used by researchers, and to help readers better understanding on those models. In this study, Logistic, Gompertz and Bass models are used for forecasting Global Wireline Subscribers and the performance of models is measured by Mean Absolute Percentage Error. Logistic model shows better MAPE than the other two. A possible extension of this study may verify which model reflects characteristics of industry better.