• Title/Summary/Keyword: mean squared prediction error

Search Result 150, Processing Time 0.023 seconds

NHPP소프트웨어 신뢰도 성장모형에서 베이지안 모수추정과 예측 (Bayesian parameter estimation and prediction in NHPP software reliability growth model)

  • 장인홍;정덕환;이승우;송광윤
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권4호
    • /
    • pp.755-762
    • /
    • 2013
  • 본 논문은 NHPP 소프트웨어 신뢰성모형에서 모수추정과 고장시간에 대한 예측을 다루고자 한다. 소프트웨어 신뢰성모형 Goel-Okumoto모형에서 평균값 함수에 대한 최우추정과 경험적 사전분포를 가정한 공액사전분포에서 베이지안 추정을 다루었다. 실제 자료에서 두 가지 추정법에 의한 모수 추정값을 제공하였으며, 모형의 적합성을 판정하고, 고장수에 대한 예측값을 비교하였다.

앙상블 머신러닝 모형을 이용한 하천 녹조발생 예측모형의 입력변수 특성에 따른 성능 영향 (Effect of input variable characteristics on the performance of an ensemble machine learning model for algal bloom prediction)

  • 강병구;박정수
    • 상하수도학회지
    • /
    • 제35권6호
    • /
    • pp.417-424
    • /
    • 2021
  • Algal bloom is an ongoing issue in the management of freshwater systems for drinking water supply, and the chlorophyll-a concentration is commonly used to represent the status of algal bloom. Thus, the prediction of chlorophyll-a concentration is essential for the proper management of water quality. However, the chlorophyll-a concentration is affected by various water quality and environmental factors, so the prediction of its concentration is not an easy task. In recent years, many advanced machine learning algorithms have increasingly been used for the development of surrogate models to prediction the chlorophyll-a concentration in freshwater systems such as rivers or reservoirs. This study used a light gradient boosting machine(LightGBM), a gradient boosting decision tree algorithm, to develop an ensemble machine learning model to predict chlorophyll-a concentration. The field water quality data observed at Daecheong Lake, obtained from the real-time water information system in Korea, were used for the development of the model. The data include temperature, pH, electric conductivity, dissolved oxygen, total organic carbon, total nitrogen, total phosphorus, and chlorophyll-a. First, a LightGBM model was developed to predict the chlorophyll-a concentration by using the other seven items as independent input variables. Second, the time-lagged values of all the input variables were added as input variables to understand the effect of time lag of input variables on model performance. The time lag (i) ranges from 1 to 50 days. The model performance was evaluated using three indices, root mean squared error-observation standard deviation ration (RSR), Nash-Sutcliffe coefficient of efficiency (NSE) and mean absolute error (MAE). The model showed the best performance by adding a dataset with a one-day time lag (i=1) where RSR, NSE, and MAE were 0.359, 0.871 and 1.510, respectively. The improvement of model performance was observed when a dataset with a time lag up of about 15 days (i=15) was added.

수질자료의 특성을 고려한 앙상블 머신러닝 모형 구축 및 설명가능한 인공지능을 이용한 모형결과 해석에 대한 연구 (Development of ensemble machine learning model considering the characteristics of input variables and the interpretation of model performance using explainable artificial intelligence)

  • 박정수
    • 상하수도학회지
    • /
    • 제36권4호
    • /
    • pp.239-248
    • /
    • 2022
  • The prediction of algal bloom is an important field of study in algal bloom management, and chlorophyll-a concentration(Chl-a) is commonly used to represent the status of algal bloom. In, recent years advanced machine learning algorithms are increasingly used for the prediction of algal bloom. In this study, XGBoost(XGB), an ensemble machine learning algorithm, was used to develop a model to predict Chl-a in a reservoir. The daily observation of water quality data and climate data was used for the training and testing of the model. In the first step of the study, the input variables were clustered into two groups(low and high value groups) based on the observed value of water temperature(TEMP), total organic carbon concentration(TOC), total nitrogen concentration(TN) and total phosphorus concentration(TP). For each of the four water quality items, two XGB models were developed using only the data in each clustered group(Model 1). The results were compared to the prediction of an XGB model developed by using the entire data before clustering(Model 2). The model performance was evaluated using three indices including root mean squared error-observation standard deviation ratio(RSR). The model performance was improved using Model 1 for TEMP, TN, TP as the RSR of each model was 0.503, 0.477 and 0.493, respectively, while the RSR of Model 2 was 0.521. On the other hand, Model 2 shows better performance than Model 1 for TOC, where the RSR was 0.532. Explainable artificial intelligence(XAI) is an ongoing field of research in machine learning study. Shapley value analysis, a novel XAI algorithm, was also used for the quantitative interpretation of the XGB model performance developed in this study.

ARIMA를 이용한 항공기 수리부속의 수요 예측 (A Demand Forecasting for Aircraft Spare Parts using ARMIA)

  • 박영진;전건욱
    • 한국국방경영분석학회지
    • /
    • 제34권2호
    • /
    • pp.79-101
    • /
    • 2008
  • 신형/장기 운영 무기체계 수리부속의 불균형적 수요발생에 따른 항공기 불가동을 해소하기 위한 수요예측기법 개선의 필요성이 대두되고 있다. 항공기 수리부품들은 고단가이고, 청구에 소요되는 기간이 길어 사전에 예측하지 못한다면 작전지원에 문제가 발생하게 된다. 신뢰성 있는 수요 예측은 과보유로 인한 재고비용을 줄일 수 있으며, 수요를 예측하기 위한 방법은 회귀분석, 단/다변량 시 계열분석, 데이터 마이닝 기법 등이 있다. 항공기 부품의 수요 예측은 그 부품의 수가 8만 가지 이상이며 각 부품간의 관계를 분석하기에 어려움이 있어 시간에 종속적인 단변량 시계열 분석을 통해 수요예측을 실시하였다. 본 연구에서는 이러한 문제점을 해결하기 위하여 첫째, 자료를 기존 AMMIS 체계에서 고장 자료를 실수요로 가정하여 수집하였다. 고장이나 주기 검사, 시한성 기술지시 등으로 부품을 장 탈착하게 되면 정비부서에서 이를 전산프로그램인 AMMIS에 입력하도록 하고 있다. 따라서 실제 정비부서에서 부품을 사용한 현황을 실수요라고 인정할 수 있다. 둘째, 1999년 1월부터 2007년 2월까지의 월별 자료(98개)를 수집하였다. 자료의 수가 충분하므로 예측 정확성 향상을 위하여 ARIMA기법에 적용이 가능하다. 고장빈도가 높은 부품 50여개를 추출하여 Box-Jenkins의 ARIMA기법을 적용하여 예측을 실시하였다 실시 결과 적합한 모형식을 도출하였으며, 현용기법보다 예측 정확성이 높다는 결론을 얻었다.

다중연결 해양부유체의 모형시험 구조응답 예측정확도 향상을 위한 유전알고리즘을 이용한 센서배치 최적화 (Optimal Sensor Placement for Improved Prediction Accuracy of Structural Responses in Model Test of Multi-Linked Floating Offshore Systems Using Genetic Algorithms)

  • 심기찬;이강수
    • 한국전산구조공학회논문집
    • /
    • 제37권3호
    • /
    • pp.163-171
    • /
    • 2024
  • 본 논문에서는 다목적 구조물인 다중연결 해양부유체를 대상으로 변형 기반 모드 차수축소법을 적용하고 차수축소모델의 구조응답 예측 성능을 향상시키기 위해 유전 알고리즘 기반의 센서 배치 최적화를 수행하였다. 다중연결 해양부유체의 차수축소모델 생성에 필요한 변형 기반 모드 데이터를 얻기 위해 다양한 규칙파랑하중조건에 대한 유체-구조 연성 수치해석을 수행하고 변형 기반 모드의 직교성, 자기상관계수를 이용하여 주요 변형 기반 모드를 선정하였다. 다중연결 해양부유체의 경우 차수축소모델의 구조응답 예측 성능이 계측 및 예측 구조응답 위치에 따라 민감하기 때문에 유전 알고리즘 기반의 최적화를 수행하여 최적의 센서 배치를 도출하였다. 최적화 결과, 모든 센서 배치 조합에 대한 차수축소모델 생성 및 예측 성능 평가 대비 약 8배의 계산 비용을 절감하였으며, 예측 성능 평가 지표인 평균 제곱근 오차가 초기 센서 배치보다 84% 감소하였다. 또한, 다중연결 해양부유체 모형시험 결과를 이용하여 불규칙파랑하중에 대한 최적화된 센서 배치의 차수축소모델의 구조응답 예측 성능을 평가 및 검증하였다.

Application of artificial neural networks to predict total dissolved solids in the river Zayanderud, Iran

  • Gholamreza, Asadollahfardi;Afshin, Meshkat-Dini;Shiva, Homayoun Aria;Nasrin, Roohani
    • Environmental Engineering Research
    • /
    • 제21권4호
    • /
    • pp.333-340
    • /
    • 2016
  • An Artificial Neural Network including a Radial Basis Function (RBF) and a Time Delay Neural Network (TDNN) was used to predict total dissolved solid (TDS) in the river Zayanderud. Water quality parameters in the river for ten years, 2001-2010, were prepared from data monitored by the Isfahan Regional Water Authority. A factor analysis was applied to select the inputs of water quality parameters, which obtained total hardness, bicarbonate, chloride and calcium. Input data to the neural networks were pH, $Na^+$, $Mg^{2+}$, Carbonate ($CO{_3}^{-2}$), $HCO{_3}^{-1}$, $Cl^-$, $Ca^{2+}$ and Total hardness. For learning process 5-fold cross validation were applied. In the best situation, the TDNN contained 2 hidden layers of 15 neurons in each of the layers and the RBF had one hidden layer with 100 neurons. The Mean Squared Error and the Mean Bias Error for the TDNN during the training process were 0.0006 and 0.0603 and for the RBF neural network the mentioned errors were 0.0001 and 0.0006, respectively. In the RBF, the coefficient of determination ($R^2$) and the index of agreement (IA) between the observed data and predicted data were 0.997 and 0.999, respectively. In the TDNN, the $R^2$ and the IA between the actual and predicted data were 0.957 and 0.985, respectively. The results of sensitivity illustrated that $Ca^{2+}$ and $SO{_4}^{2-}$ parameters had the highest effect on the TDS prediction.

기계학습과 GloSea5를 이용한 장기 농업기상 예측 : 고랭지배추 재배 지역을 중심으로 (The long-term agricultural weather forcast methods using machine learning and GloSea5 : on the cultivation zone of Chinese cabbage.)

  • 김준석;양미연;윤상후
    • 디지털융복합연구
    • /
    • 제18권4호
    • /
    • pp.243-250
    • /
    • 2020
  • 농작물 재배에 있어 가장 큰 위험 요소는 날씨이므로 재배지의 장기 농업 기상정보를 얻을 수 있다면 정식과 수확 시기 등을 예측할 수 있다. 따라서 체계적인 농작업을 기획하여 관리할 수 있으며 이는 농가의 안정적인 수확으로 이어질 것으로 기대한다. 본 연구는 GloSea5와 기계학습을 이용하여 효과적인 고랭지배추의 재배를 위한 장기 농업기상정보 예측 방법을 제시하였다. GloSea5는 계절예측시스템으로 최대 240일까지의 기상을 예측한다. 심층신경망과 공간랜덤포레스트를 이용하여 장기 일 평균기온을 예측한 결과 심층신경망이 공간랜덤포레스트에 비해 장기예측성능이 우수하였다. 하지만 공간랜덤포레스트는 강원도 전역의 기온을 짧은 시간에 예측하는 장점이 있다. 공간랜덤포레스트로 분석한 결과 여름철과 해발고도가 낮은 지역의 장기 일 평균기온이 잘 예측되었다.

기후변화시나리오 데이터 누락지역의 강수자료 보완을 위한 최적 공간보간기법 선정 (Determination of the Optimal Spatial Interpolation Methods for Estimating Missing Precipitation Data in Not Covered Area by Climate Change Scenario)

  • 장동우;박효선;최진탁
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2015년도 학술발표회
    • /
    • pp.14-14
    • /
    • 2015
  • 공간보간기법은 미계측지역의 강수예측을 위해 통상적으로 사용되는 방법 중의 하나이다. 이 연구에서는 기상청에서 제공하고 있는 RCP 8.5 시나리오에 의한 남한상세 강수자료 중 지형이 복잡한 도서지역에서 제공되지 않는 데이터 누락격자에 대하여 최적의 공간보간기법을 선정하여 강수자료를 생성할 수 있도록 하였다. 적합한 보간기법을 선정하기 위해 데이터 누락지역에 대한 분석을 수행하였고, 최신 행정구역도에 맞추어 $1km{\times}1km$ 격자를 한반도 전체지역에 맞추어 생성된 격자를 사용하였다. ESRI사의 ArcGIS 프로그램을 이용하여 공간보간기법을 적용하였다. 사용된 보간법은 역거리가중치법(IDW), 정규크리깅(Ordinary Kriging), 보편크리깅(Universal Kriging), 스플라인(Spline)이며 가장 적합한 공간보간기법을 선정하기 위해 기후변화시나리오에 의한 데이터 중 해안선 주변 특정격자에서의 값을 누락시켜 공간보간기법을 통해 생성된 값과 기후변화 시나리오에 의한 값을 정량적으로 비교하였다. 공간보간기법의 적합도 평가를 위해 MAE(Mean Absolute Error), MSE(Mean Squared Error), PBIAS(Percent of BIAS), G(goodness of prediction) 분석을 수행하였고, 산점도 분석을 통해 실제값과 보간값의 오차율 평가를 병행하여 최적 공간보간기법을 결정하였다. 사용된 강수데이터는 RCP 8.5 시나리오에서 2015~2019년 중 강수가 높게 나타난 8월 자료를 이용하였다. 해안선 지역의 강수량 추정시 역거리 가중치법과 크리깅방법은 일부 지점에서 과다 추정되는 경향이 있고, 스플라인 방법이 전체적인 총 강수량이 기후변화시나리오에 의한 실제값과 유사한 것으로 나타났다. 실제값과 보간값의 교차검증을 수행한 결과 정규크리깅 기법이 가장 높은 정확도를 보였으며, 전체적으로 실제값과 유사한 범위내의 강수량이 생성되는 것으로 나타났다.

  • PDF

광주광역시 아파트 매매가 영향요인 분석 (An Analysis of the Key Factors Affecting Apartment Sales Price in Gwangju, South Korea)

  • 임성연;고창완;정영선
    • 스마트미디어저널
    • /
    • 제11권3호
    • /
    • pp.62-73
    • /
    • 2022
  • 국내 아파트 매매가 예측에 관한 연구는 현재까지 지속적으로 수행되어 왔지만, 아파트 가격은 다양한 특성이 복합적으로 작용하기 때문에 예측하는데 어려움을 겪고 있다. 아파트 매매가를 예측하는데 앞서 정확도를 높이기 위해서는 주요 변수 선정 및 영향요인 분석이 무엇보다 중요하다. 이에 본 연구는 현재 꾸준한 상승률을 보이는 광주광역시를 대상으로 아파트 매매가에 영향을 주는 요인을 분석해보고자 한다. 이를 위해 6년간의 광주광역시 아파트 실거래가와 각종 사회적 요인 데이터를 토대로, 다중회귀분석, 랜덤 포레스트, 심층인공신경망 알고리즘을 적용하여 각 모델에서 주요 영향요인을 파악하였으며, 모델의 성능은 평균 제곱근 오차, 평균 절대 오차 그리고 결정계수를 통해 비교 분석하였다. 본 연구에서는 딥러닝의 일종인 심층인공신경망의 성능이 가장 우수함을 보였고, 매매가에 영향을 미치는 주요 요인으로 건축경과연수, 계약연도, 적용면적, 양도성예금증서, 주택담보대출금리, 선행지수, 생산자물가지수, 동행지수 등이 도출되었다.

Data-driven prediction of compressive strength of FRP-confined concrete members: An application of machine learning models

  • Berradia, Mohammed;Azab, Marc;Ahmad, Zeeshan;Accouche, Oussama;Raza, Ali;Alashker, Yasser
    • Structural Engineering and Mechanics
    • /
    • 제83권4호
    • /
    • pp.515-535
    • /
    • 2022
  • The strength models for fiber-reinforced polymer (FRP)-confined normal strength concrete (NC) cylinders available in the literature have been suggested based on small databases using limited variables of such structural members portraying less accuracy. The artificial neural network (ANN) is an advanced technique for precisely predicting the response of composite structures by considering a large number of parameters. The main objective of the present investigation is to develop an ANN model for the axial strength of FRP-confined NC cylinders using various parameters to give the highest accuracy of the predictions. To secure this aim, a large experimental database of 313 FRP-confined NC cylinders has been constructed from previous research investigations. An evaluation of 33 different empirical strength models has been performed using various statistical parameters (root mean squared error RMSE, mean absolute error MAE, and coefficient of determination R2) over the developed database. Then, a new ANN model using the Group Method of Data Handling (GMDH) has been proposed based on the experimental database that portrayed the highest performance as compared with the previous models with R2=0.92, RMSE=0.27, and MAE=0.33. Therefore, the suggested ANN model can accurately capture the axial strength of FRP-confined NC cylinders that can be used for the further analysis and design of such members in the construction industry.