• Title/Summary/Keyword: mean squared prediction error

검색결과 154건 처리시간 0.024초

FitRec 기반 달리기 심박수 예측 시스템 (Prediction System of Running Heart Rate based on FitRec)

  • 김진욱;김광현;선준호;이승우;김수현;김진영
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권6호
    • /
    • pp.165-171
    • /
    • 2022
  • 사람의 심박수는 운동 강도 측정의 기준으로 사용되는 중요한 지표이다. 만약 심박수를 예측한다면 운동 중 운동 강도를 미리 조절하여 효율적으로 운동할 수 있다. 본 논문에서는 FitRec 기반 달리기 운동을 수행하는 사용자의 심박수를 예측하는 모델을 제안한다. 학습을 위해 Endomondo의 데이터를 사용하여 예측 모델에 적용한다. 성능 비교를 위해 시계열 데이터 처리 알고리즘 LSTM(long short term memory)과 GRU(gated recurrent unit)를 사용하였다. FitRec에 유산소 운동 중 달리기 데이터만 학습한 결과 여러 유산소 운동 데이터를 모두 학습한 모델보다 MAE(mean absolute error)와 RMSE(root mean squared error) 둘 다 성능이 향상됨을 확인하였다.

원인균별 식중독 발생 건수 예측 (Prediction of the Number of Food Poisoning Occurrences by Microbes)

  • 여인권
    • 응용통계연구
    • /
    • 제26권6호
    • /
    • pp.923-932
    • /
    • 2013
  • 이 논문에서는 우리나라에서 발생하는 원인균별 식중독 발생건수를 예측하는 방법을 제안한다. 우리나라에서 보고되는 주별 식중독 발생 건수를 원인균로 나누면 자료에 많은 0의 관측값이 포함되어 있으며 식중독 발생 간에 종속성을 가진다. 이 현상을 모형화하기 위해 이 논문에서는 전체 식중독 건수를 자기회귀모형으로 예측하고 원인균별 식중독 발생 확률을 다범주 로짓모형으로 추정한다. 예측된 식중독 건수와 추정된 원인균별 식중독 발생 확률을 곱하여 원인균별 식중독 발생건수를 예측한다. 제안된 방법의 타당성을 확인하기 위해 평균제곱오차와 평균절대편차를 이용하여 제안 방법과 영과잉모형을 비교해 본다.

Soft computing based mathematical models for improved prediction of rock brittleness index

  • Abiodun I. Lawal;Minju Kim;Sangki Kwon
    • Geomechanics and Engineering
    • /
    • 제33권3호
    • /
    • pp.279-289
    • /
    • 2023
  • Brittleness index (BI) is an important property of rocks because it is a good index to predict rockburst. Due to its importance, several empirical and soft computing (SC) models have been proposed in the literature based on the punch penetration test (PPT) results. These models are very important as there is no clear-cut experimental means for measuring BI asides the PPT which is very costly and time consuming to perform. This study used a novel Multivariate Adaptive regression spline (MARS), M5P, and white-box ANN to predict the BI of rocks using the available data in the literature for an improved BI prediction. The rock density, uniaxial compressive strength (σc) and tensile strength (σt) were used as the input parameters into the models while the BI was the targeted output. The models were implemented in the MATLAB software. The results of the proposed models were compared with those from existing multilinear regression, linear and nonlinear particle swarm optimization (PSO) and genetic algorithm (GA) based models using similar datasets. The coefficient of determination (R2), adjusted R2 (Adj R2), root-mean squared error (RMSE) and mean absolute percentage error (MAPE) were the indices used for the comparison. The outcomes of the comparison revealed that the proposed ANN and MARS models performed better than the other models with R2 and Adj R2 values above 0.9 and least error values while the M5P gave similar performance to those of the existing models. Weight partitioning method was also used to examine the percentage contribution of model predictors to the predicted BI and tensile strength was found to have the highest influence on the predicted BI.

신경 망의 지도 학습을 위한 로그 간격의 학습 자료 구성 방식과 손실 함수의 성능 평가 (Performance Evaluation of Loss Functions and Composition Methods of Log-scale Train Data for Supervised Learning of Neural Network)

  • 송동규;고세헌;이효민
    • Korean Chemical Engineering Research
    • /
    • 제61권3호
    • /
    • pp.388-393
    • /
    • 2023
  • 지도 학습 기반의 신경 망을 활용한 공학적 자료의 분석은 화학공학 공정 최적화, 미세 먼지 농도 추정, 열역학적 상평형 예측, 이동 현상 계의 물성 예측 등 다양한 분야에서 활용되고 있다. 신경 망의 지도 학습은 학습 자료를 요구하며, 주어진 학습 자료의 구성에 따라 학습 성능이 영향을 받는다. 빈번히 관찰되는 공학적 자료 중에는 DNA의 길이, 분석 물질의 농도 등과 같이 로그 간격으로 주어지는 자료들이 존재한다. 본 연구에서는 넓은 범위에 분포된 로그 간격의 학습 자료를 기계 학습으로 처리하는 경우, 사용 가능한 손실 함수들의 학습 성능을 정량적으로 평가하였으며, 적합한 학습 자료 구성 방식을 연구하였다. 이를 수행하고자, 100×100의 가상 이미지를 활용하여 기계 학습의 회귀 과업을 구성하였다. 4개의 손실 함수들에 대하여 (i) 오차 행렬, (ii) 최대 상대 오차, (iii) 평균 상대 오차로 정량적 평가하여, mape 혹은 msle가 본 연구에서 다룬 과업에 대해 최적의 손실 함수가 됨을 알아내었다. 또한, 학습 자료의 값이 넓은 범위에 걸쳐 분포하는 경우, 학습 자료의 구성을 로그 간격 등을 고려하여 균등 선별하는 방식이 높은 학습 성능을 보임을 밝혀내었다. 본 연구에서 다룬 회귀 과업은 DNA의 길이 예측, 생체 유래 분자 분석, 콜로이드 용액의 농도 추정 등의 공학적 과업에 적용 가능하며, 본 결과를 활용하여 기계 학습의 성능과 학습 효율의 증대를 기대할 수 있을 것이다.

앙상블 지역 파랑예측시스템 구축 및 검증 (Development and Evaluation of an Ensemble Forecasting System for the Regional Ocean Wave of Korea)

  • 박종숙;강기룡;강현석
    • 한국해안·해양공학회논문집
    • /
    • 제30권2호
    • /
    • pp.84-94
    • /
    • 2018
  • 해양파랑 예측에 있어 단일 수치모델의 불확실성을 보완하기 위하여 앙상블 기법을 적용한 지역 파랑예측시스템을 구축하였다. 기상청 전지구 대기 수치모델의 확률예측시스템에서 생산되는 24개 앙상블 해상풍을 입력자료로 이용, 87시간까지 파랑 예측자료를 생산하였으며, 기상청 계류부이 관측자료와 다양한 통계방법을 적용하여 검증을 수행하였다. 2일예측 이후의 앙상블 예측평균의 평균제곱근오차(RMSE)는 단일모델예측에 비하여 향상된 결과를 보였으며, 특히 3일예측의 경우 단일모델예측 대비 RMSE가 약 15% 정도 향상되었다. 이것은 앙상블 기법이 수치모델의 불확실성을 감소시켜 예측정확도 향상에 크게 기여한 것으로 보인다. ROC(Relative Operating Characteristic) 분석결과, 전체 예측시간에 대하여 ROC 영역이 모두 0.9 이상을 보여 확률예측 성능이 뛰어남을 보였으며, 앙상블 파랑예측 결과가 해상 확률예보에 유용하게 활용될 수 있을 것으로 판단된다.

Predicting blast-induced ground vibrations at limestone quarry from artificial neural network optimized by randomized and grid search cross-validation, and comparative analyses with blast vibration predictor models

  • Salman Ihsan;Shahab Saqib;Hafiz Muhammad Awais Rashid;Fawad S. Niazi;Mohsin Usman Qureshi
    • Geomechanics and Engineering
    • /
    • 제35권2호
    • /
    • pp.121-133
    • /
    • 2023
  • The demand for cement and limestone crushed materials has increased many folds due to the tremendous increase in construction activities in Pakistan during the past few decades. The number of cement production industries has increased correspondingly, and so the rock-blasting operations at the limestone quarry sites. However, the safety procedures warranted at these sites for the blast-induced ground vibrations (BIGV) have not been adequately developed and/or implemented. Proper prediction and monitoring of BIGV are necessary to ensure the safety of structures in the vicinity of these quarry sites. In this paper, an attempt has been made to predict BIGV using artificial neural network (ANN) at three selected limestone quarries of Pakistan. The ANN has been developed in Python using Keras with sequential model and dense layers. The hyper parameters and neurons in each of the activation layers has been optimized using randomized and grid search method. The input parameters for the model include distance, a maximum charge per delay (MCPD), depth of hole, burden, spacing, and number of blast holes, whereas, peak particle velocity (PPV) is taken as the only output parameter. A total of 110 blast vibrations datasets were recorded from three different limestone quarries. The dataset has been divided into 85% for neural network training, and 15% for testing of the network. A five-layer ANN is trained with Rectified Linear Unit (ReLU) activation function, Adam optimization algorithm with a learning rate of 0.001, and batch size of 32 with the topology of 6-32-32-256-1. The blast datasets were utilized to compare the performance of ANN, multivariate regression analysis (MVRA), and empirical predictors. The performance was evaluated using the coefficient of determination (R2), mean absolute error (MAE), mean squared error (MSE), mean absolute percentage error (MAPE), and root mean squared error (RMSE)for predicted and measured PPV. To determine the relative influence of each parameter on the PPV, sensitivity analyses were performed for all input parameters. The analyses reveal that ANN performs superior than MVRA and other empirical predictors, andthat83% PPV is affected by distance and MCPD while hole depth, number of blast holes, burden and spacing contribute for the remaining 17%. This research provides valuable insights into improving safety measures and ensuring the structural integrity of buildings near limestone quarry sites.

Prediction Acidity Constant of Various Benzoic Acids and Phenols in Water Using Linear and Nonlinear QSPR Models

  • Habibi Yangjeh, Aziz;Danandeh Jenagharad, Mohammad;Nooshyar, Mahdi
    • Bulletin of the Korean Chemical Society
    • /
    • 제26권12호
    • /
    • pp.2007-2016
    • /
    • 2005
  • An artificial neural network (ANN) is successfully presented for prediction acidity constant (pKa) of various benzoic acids and phenols with diverse chemical structures using a nonlinear quantitative structure-property relationship. A three-layered feed forward ANN with back-propagation of error was generated using six molecular descriptors appearing in the multi-parameter linear regression (MLR) model. The polarizability term $(\pi_1)$, most positive charge of acidic hydrogen atom $(q^+)$, molecular weight (MW), most negative charge of the acidic oxygen atom $(q^-)$, the hydrogen-bond accepting ability $(\epsilon_B)$ and partial charge weighted topological electronic (PCWTE) descriptors are inputs and its output is pKa. It was found that properly selected and trained neural network with 205 compounds could fairly represent dependence of the acidity constant on molecular descriptors. For evaluation of the predictive power of the generated ANN, an optimized network was applied for prediction pKa values of 37 compounds in the prediction set, which were not used in the optimization procedure. Squared correlation coefficient $(R^2)$ and root mean square error (RMSE) of 0.9147 and 0.9388 for prediction set by the MLR model should be compared with the values of 0.9939 and 0.2575 by the ANN model. These improvements are due to the fact that acidity constant of benzoic acids and phenols in water shows nonlinear correlations with the molecular descriptors.

신경 회로망과 통계적 기법을 이용한 종합주가지수 예측 모형의 개발 (Development of the KOSPI (Korea Composite Stock Price Index) forecast model using neural network and statistical methods))

  • 이은진;민철홍;김태선
    • 전자공학회논문지CI
    • /
    • 제45권5호
    • /
    • pp.95-101
    • /
    • 2008
  • 주가지수는 경제 및 정치적 상황을 포함한 다양한 주변 환경에 영향을 받는 관계로 정확한 주가지수 예측모형의 개발은 매우 어려운 문제로 여겨지고 있다. 본 논문에서는, 신경회로망과 통계적인 방법을 이용하여 종합주가지수(KOSPI)를 예측하는 에이전트 시스템 기법을 제안한다. 예측오차의 평균 및 편차를 최소화하기 위해서, 에이전트시스템은 특징추출, 변수선정, 예측 엔진선정 및 분석을 위한 부(sub)에이전트 모듈들을 포함하고 있다. KOSPI(Korea Composite Stock Price Index) 예측을 위한 에이전트시스템 구현의 첫 번째 단계로서, 주성분분석을 이용하여 22개의 표준기본경제지표에서 12개의 경제지표를 추출하였다. 열두 개의 추출된 경제지표들은 예측하고자하는 예측일에 따라 최량부분적합법을 이용하여 다시 한 번 입력 변수들을 선정하게 된다. 성능평가를 위해 주가지수의 변동폭이 다른 두 종류의 실험데이터를 대상으로 예측을 진행한 결과 30일의 연속적인 종합주가지수예측에 있어 11.92포인트의 평균오차율을 보였다. 또한, 예측시점에 따라 관련이 높은 기본지표의 종류 및 개수가 다르게 나타나므로 제안한 주가예측 에이전트시스템 구조가 유용함을 보였다.

지구통계 기법을 이용한 토양오염 분포 예측 오차 최적화 및 머신러닝 알고리즘 기반의 영향인자 해석 (Optimization of Soil Contamination Distribution Prediction Error using Geostatistical Technique and Interpretation of Contributory Factor Based on Machine Learning Algorithm)

  • 한호상;서장원;최요순
    • 자원환경지질
    • /
    • 제56권3호
    • /
    • pp.331-341
    • /
    • 2023
  • 지구통계 기법을 기반으로 토양오염지도를 작성하는 경우 예측 오차가 발생하며 이에 영향을 미치는 다양한 원인이 존재한다. 본 연구에서는 정규 크리깅을 활용하여 폐광산지역의 토양 내 중금속 농도 샘플링 데이터로부터 격자형 기반의 토양오염지도를 작성하였다. 해당 지도의 예측 오차에 영향을 미친다고 판단된 5개 인자를 선정하고, Leave-one-out 기법을 기반으로 인자의 옵션과 설정값의 변화에 따른 예측값과 실측값 간의 평균제곱근오차(root mean square error, RMSE) 변화를 분석하였다. 이후 머신러닝 알고리즘을 이용하여 RMSE에 영향을 미치는 상위 3개 인자를 도출하였다. 그 결과, Standard interpolation에서는 Variogram Model, Minimum Neighbors, Anisotropy 인자가 RMSE에 가장 큰 영향을 미치는 것으로 분석되었다. 베리오그램 모델에서는 Spherical 모델이 가장 낮은 RMSE를 보였으며, Minimum Neighbors는 3에서 최젓값을 보인 후 값이 증가함에 따라 증가하였다. Anisotropy의 경우 이방성을 고려하지 않는 것이 더 적합한 것으로 나타났다. 본 연구에서는 지구통계와 머신러닝의 복합 활용을 통해 지역 규모에서 높은 신뢰성을 갖는 토양오염지도를 작성할 수 있었고, 적은 수의 토양 샘플링 데이터의 보간 작업 시 어떠한 요인들이 큰 영향을 미치는지 파악할 수 있었다.

제주 감귤 과수원에서의 이슬지속시간 예측 모델 평가 (Evaluating the prediction models of leaf wetness duration for citrus orchards in Jeju, South Korea)

  • 박준상;서윤암;김규랑;하종철
    • 한국농림기상학회지
    • /
    • 제20권3호
    • /
    • pp.262-276
    • /
    • 2018
  • 2016년부터 2017년까지 제주 감귤과수원 11개 지점에서 관측한 기상 및 이슬 자료를 이용하여 이슬지속시간 예측 모델을 평가하였다. 이슬지속시간 모델의 민감도와 예측 정확도 평가에는 4 가지 모델(Number of Hours of Relative Humidity, Classification And Regression Tree/Stepwise Linear Discriminant, Penman-Monteith, Deep-learning Neural Network)이 사용되었다. 모델의 민감도는 강우와 계절 변화에 따라 평가하였다. 전체 자료에서 강우일 자료를 제외하면 이슬지속시간 모델들은 평균 오차(평균제곱근오차 약 1.5 hours)가 적게 나타났다. 기계학습 모델은 겨울을 제외한 계절별 오차가 비슷한 크기(평균제곱근오차 약 3 hours)로 나타났다. 나머지 모델들은 여름에 오차(평균제곱근오차 약 9.6 hours)가 가장 크고 겨울에 가장 작은 것(평균제곱근오차 약 3.3 hours)으로 나타났다. 모델 예측 정확도 평가 방법은 통계적 오차 분석 방법과 평균 제곱 편차 회귀 분석 방법을 사용하였다. 통계오차를 통한 모델 성능은 DNN 모델이 가장 우수한 반면에 CART/SLD 모델은 예측 정확도가 가장 낮게 나타났다. 평균제곱 편차(MSD)는 모델의 선형성을 세 가지(제곱 바이어스(SB), 비균일성 기울기(NU), 상관관계 부족(LC)) 구성요소로 구분하여 분석하는 방법이다. 모델 성능이 우수할수록 SB와 LC는 감소하였고 NU는 증가하는 경향이 나타났다. MSD 분석 결과 DNN 모델이 가장 우수하였으며 다음으로 PM, NHRH, CART/SLD 순으로 나타났다. 본 연구에서 활용된 기계학습 모델은 기상 정보를 이용한 다른 농업정보 생산의 정확도 개선에 크게 기여할 것으로 판단된다.