• 제목/요약/키워드: mean squared prediction error

검색결과 150건 처리시간 0.031초

Optimize rainfall prediction utilize multivariate time series, seasonal adjustment and Stacked Long short term memory

  • Nguyen, Thi Huong;Kwon, Yoon Jeong;Yoo, Je-Ho;Kwon, Hyun-Han
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.373-373
    • /
    • 2021
  • Rainfall forecasting is an important issue that is applied in many areas, such as agriculture, flood warning, and water resources management. In this context, this study proposed a statistical and machine learning-based forecasting model for monthly rainfall. The Bayesian Gaussian process was chosen to optimize the hyperparameters of the Stacked Long Short-term memory (SLSTM) model. The proposed SLSTM model was applied for predicting monthly precipitation of Seoul station, South Korea. Data were retrieved from the Korea Meteorological Administration (KMA) in the period between 1960 and 2019. Four schemes were examined in this study: (i) prediction with only rainfall; (ii) with deseasonalized rainfall; (iii) with rainfall and minimum temperature; (iv) with deseasonalized rainfall and minimum temperature. The error of predicted rainfall based on the root mean squared error (RMSE), 16-17 mm, is relatively small compared with the average monthly rainfall at Seoul station is 117mm. The results showed scheme (iv) gives the best prediction result. Therefore, this approach is more straightforward than the hydrological and hydraulic models, which request much more input data. The result indicated that a deep learning network could be applied successfully in the hydrology field. Overall, the proposed method is promising, given a good solution for rainfall prediction.

  • PDF

DEA기반 순위선정 절차를 활용한 주력전차의 기술예측방법 비교연구 (A Comparative Study of Technological Forecasting Methods with the Case of Main Battle Tank by Ranking Efficient Units in DEA)

  • 김재오;김재희;김승권
    • 한국국방경영분석학회지
    • /
    • 제33권2호
    • /
    • pp.61-73
    • /
    • 2007
  • 본 연구의 목적은 미래 기술예측에 사용되는 TFDEA(Technological Forecasting with Data Envelopment Analysis)의 문제점을 살펴보고 이의 개선방향을 찾아 주력전차의 기술예측 문제에 적용해 보는 것이다. 기존의 TFDEA는 복수의 DMU(Decison Making Unit)를 효율적 DMU로 판정하는 DEA(Data Envelopment Analysis)의 특성상 실제로는 그다지 효율적이지 않은 DMU까지 포함해서 기슬예측을 수행함으로써 예측 결과의 정확도가 저하될 수 있다. 본 연구에서는 DEA의 확장된 개념을 적용하여 평가 대상 DMU에 대한 순위를 산정한 후 이를 토대로 기술 예측을 시행하는 방법을 검토해 보았다. 이를 위해 일반적인 DEA기반의 순위선정 방법 중 대표적인 Super-efficiency, Cross-efficiency, CCCA(Constrained Canonical Correlation Analysis)을 TFDEA에 결합 적용하고 이들을 비교해 보았다. 제시된 방법을 주력 전차의 미래 기술 예측 문제에 적용한 결과 CCCA를 이용한 순위선정방법이 실제 실현된 기술 수준과 비교했을 때 통계적으로 가장 작은 오차율을 보였다.

중죤단위와 중력모형을 이용한 택지개발사업의 통행분포 예측방법에 관한 연구 (A Study on Forecasting Trip Distribution of Land Development Project Using Middle Zone Size And Gravity Model)

  • 정창용;손의영;김도경
    • 대한교통학회지
    • /
    • 제27권6호
    • /
    • pp.19-28
    • /
    • 2009
  • 새로운 대규모의 택지개발사업을 시행하는 경우에는 유발되는 교통량을 해결하기 위하여 적정규모의 교통시설이 건설 되어야 하며, 이를 위해서는 무엇보다도 정확한 유발교통량의 예측이 이루어져야 한다. 유발교통량은 통행발생과 통행분포 단계를 통해 추정되는데 통행발생 단계에서는 택지개발사업 내의 시설별 교통유발원단위를 이용함으로써 자세한 발생량의 예측이 가능하다. 반면에 통행분포 단계에서는 대부분의 경우 사업이 위치하는 지역의 사업시행전 통행분포 비율이 시행된 후에도 같다고 가정하는 방법을 사용되고 있다. 하지만 이 방법은 해당지역의 공간적 범위에 대한 명확한 기준이 없기 때문에 범위설정에 있어 분석가의 주관적인 의견이 반영될 우려가 있다. 이에 본 연구에서는 해당지역의 공간적 범위를 대죤, 중죤, 소죤 단위로 분석하였으며, 분석결과를 통해 위치 차이가 크게 나타나지 않으면서도 안정적인 통행발생량의 분포를 파악할수 있는 중죤 단위의 통행분포를 이용하는 방법을 제시하였다. 하지만 이러한 중죤 단위의 통행분포도 실제 통행분포와 비교하면 어느 정도의 차이가 발생하기 때문에 중죤 단위의 통행분포에서 중죤과 택지개발사업의 위치 차이를 유출제약중력모형(Production - constrained gravity model)으로 보정하는 방법을 제시하였으며, 보정의 효과는 평균제곱오차(Mean Squared Error)를 사용하여 검토하였다. 본 논문에서 제시한 방법은 수집이 용이한 자료만으로 분석이 가능하면서도 정확한 통행분포의 예측이 가능하여 향후 택지개발사업의 통행분포 예측에 큰 도움이 될 것으로 판단된다.

한국 최대 전력량 예측을 위한 통계모형 (Statistical Modeling for Forecasting Maximum Electricity Demand in Korea)

  • 윤상후;이영생;박정수
    • Communications for Statistical Applications and Methods
    • /
    • 제16권1호
    • /
    • pp.127-135
    • /
    • 2009
  • 한국의 경제규모가 꾸준히 커감에 따라 가정, 건물, 공장 등에서 필요로 하는 전력량이 지속적으로 증가하고 있다. 전력공급의 안정화를 위해서는 최대전력량보다 전력공급능력이 높아야 한다. 월별 최대전력량을 잘 설명할 수 있는 통계모형을 찾기 위해 Winters 모형, 분해 시계열모형, ARMA 모형, 설명 변수를 통해 추세성분과 계절성분을 교정한 모형을 살펴보았다. 모형의 예측력 비교 기준으로 모형적합으로부터 구한 RMSE와 MAPE가 사용되었다. 여름철 최대전력량을 예측하기 위해 평균기온과 열대야 일수를 설명 변수로 갖는 시계열 모형이 가장 우수하였다. 아울러 외부요인을 갖는 극단분포 모형을 이용한 분석을 시도하였다.

반응표면방법론에서의 강건한 실험계획 (A Robust Design of Response Surface Methods)

  • 임용빈;오만숙
    • 응용통계연구
    • /
    • 제15권2호
    • /
    • pp.395-403
    • /
    • 2002
  • 반응표면방법론에서의 세번째 단계에서는 일차모형이 가정되고, 반응표면의 곡선효과는 중앙점과 2수준 부분실시법에서의 실험을 통해서 검토된다. 참모형이 2차 모형인 경우를 가정하자. 최적실험계획을 선택하기 위해서 Box와 Draper(1959)는 관심영역에서 예측치 y(x)의 평균제곱오차를 적분한 값인 가중평균제곱오차(AMSE)를 최소화 시키는 최적실험계획 기준을 제안하였다. AMSE는 예측치의 가중분산과 가중제곱편의 량의 합으로 분할될 수 있다. AMSE는 실험계획 적률과 참모형의 회귀계수들의 값에 종속되어서 가중평균제곱오차를 최 소화하는 실험 계획을 찾기는 불가능하다. 실용적인 대안으로 Box와 Draper(1959)는 가중제곱편의 량을 최소화하는 실험계획을 제안했고, 이 실험계획의 상자점들이 중앙점을 향해서 축소됨을 보였다. 이 논문에서는 표준화된 회귀계수들의 값에 대해서 실험계획의 최소효율을 최대화하는 강건한 실험계획을 제안한다.

중기예보를 이용한 태양광 일사량 예측 연구 (A study on solar radiation prediction using medium-range weather forecasts)

  • 박수진;김효정;김삼용
    • 응용통계연구
    • /
    • 제36권1호
    • /
    • pp.49-62
    • /
    • 2023
  • 급속적으로 비중이 증가하고 있는 태양광 에너지는 지속적인 개발 및 투자가 이루어지고 있다. 신재생에너지 정책인 그린뉴딜과 가정용 태양광 패널의 설치가 증가함에 따라 국내 태양광 에너지 보급이 점차 확대되어 그에 맞추어 발전량의 정확한 수요 예측 연구가 활발하게 진행되고 있는 시점이다. 또한, 일사량 예측이 발전량 수요 예측에 가장 영향을 미치는 요소로 작용하고 있다는 점에서 일사량 예측의 중요성을 파악하였다. 덧붙여, 본 연구는 선행 연구들에서 사용되지 않은 중기예보 기상 데이터를 활용하여 일사량 예측을 하고자 하였다는 점에서 가장 큰 차이점을 확인할 수 있다. 본 논문에서는 서울, 인천, 수원, 춘천, 대구, 대전의 총 여섯 지역의 태양광 일사량 예측을 위하여 다중선형회귀모형, KNN, Random Forest 그리고 SVR 모형과 클러스터링 기법인 K-means 기법을 결합한 후, 클러스터별 확률밀도함수를 계산하여 시간별 일사량 예측을 진행하고자 하였다. 중기예보 데이터를 사용하기 전, 모형 예측 결과를 비교하기 위한 지표로서 MAE (mean absolute error)와 RMSE (root mean squared error)를 사용하였다. 데이터는 2017년 3월 1일부터 2022년 2월 28일까지의 시간별 원 관측 데이터를 중기예보 데이터 양식에 맞추어 일별 데이터로 변환하였다. 모형의 예측 성능 비교 결과, Random Forest로 일별 일사량을 예측한 후, K-means 클러스터링으로 기후요인이 유사한 날짜들을 분류한 뒤 클러스터별 일사량의 확률밀도함수를 계산하여 시간별 일사량 예측값을 나타낸 방법이 가장 우수한 성능을 보였다. 또한 이 방법론을 이용하여 중기예보 데이터에 모형 적합 후, 예측 결과를 확인하였을 때, 일자별로 예측 오류가 상승하는 것을 확인할 수 있었다. 이는 중기예보 기상데이터의 예측 오류로 인한 것으로 보인다. 향후 연구에서는 중기예보 데이터에서 활용할 수 있는 기상요인 중, 강수 여부와 같은 외생 변수를 추가하거나 시계열 클러스터링 기법을 적용한 연구가 이루어져야할 것으로 보인다.

A Comparative Study on the Prediction of KOSPI 200 Using Intelligent Approaches

  • Bae, Hyeon;Kim, Sung-Shin;Kim, Hae-Gyun;Woo, Kwang-Bang
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제3권1호
    • /
    • pp.7-12
    • /
    • 2003
  • In recent years, many attempts have been made to predict the behavior of bonds, currencies, stock or other economic markets. Most previous experiments used the neural network models for the stock market forecasting. The KOSPI 200 (Korea Composite Stock Price Index 200) is modeled by using different neural networks and fuzzy logic. In this paper, the neural network, the dynamic polynomial neural network (DPNN) and the fuzzy logic employed for the prediction of the KOSPI 200. The prediction results are compared by the root mean squared error (RMSE) and scatter plot, respectively. The results show that the performance of the fuzzy system is little bit worse than that of the DPNN but better than that of the neural network. We can develop the desired fuzzy system by optimization methods.

비파괴충격파 시험법을 이용한 동탄성계수 평가 (Evaluation of the Dynamic Modulus by using the Impact Resonance Testing Method)

  • 김도완;장병관;문성호
    • 한국도로학회논문집
    • /
    • 제16권3호
    • /
    • pp.35-41
    • /
    • 2014
  • PURPOSES : The dynamic modulus for a specimen can be determined by using either the non-destructed or destructed testing method. The Impact Resonance Testing (IRT) is the one of the non-destructed testing methods. The MTS has proved the source credibility and has the disadvantages which indicate the expensive equipment to operate and need a lot of manpower to manufacture the specimens because of the low repeatability with an experiment. To overcome these shortcomings from MTS, the objective of this paper is to compare the dynamic modulus obtained from IRT with MTS result and prove the source credibility. METHODS : The dynamic modulus obtained from IRT could be determined by using the Resonance Frequency (RF) from the Frequency Response Function (FRF) that derived from the Fourier Transform based on the Frequency Analysis of the Digital Signal Processing (DSP)(S. O. Oyadigi; 1985). The RF values are verified from the Coherence Function (CF). To estimate the error, the Root Mean Squared Error (RMSE) method could be used. RESULTS : The dynamic modulus data obtained from IRT have the maximum error of 8%, and RMSE of 2,000MPa compared to the dynamic modulus measured by the Dynamic Modulus Testing (DMT) of MTS testing machine. CONCLUSIONS : The IRT testing method needs the prediction model of the dynamic modulus for a Linear Visco-Elastic (LVE) specimen to improve the suitability.

LSTM을 이용한 한반도 근해 이상수온 예측모델 (Abnormal Water Temperature Prediction Model Near the Korean Peninsula Using LSTM)

  • 최혜민;김민규;양현
    • 대한원격탐사학회지
    • /
    • 제38권3호
    • /
    • pp.265-282
    • /
    • 2022
  • 해수면 온도(Sea surface temperature, SST)는 지구시스템에서 해양의 순환과 생태계에 큰 영향을 주는 요소이다. 지구온난화로 한반도 근해 해수면 온도에 변화가 생기면서 이상 수온(고수온, 저수온) 현상이 발생하여 해양생태계와 수산업 피해를 지속적으로 발생시키고 있다. 따라서 본 연구는 한반도 근해 해수면 온도를 예측하여 이상 수온 현상 예측으로 피해를 예방하는 방법론을 제안한다. 연구 지역은 한반도 근해로 설정하여 동시간대 해수면 온도 데이터를 사용하기 위해 Europe Centre for Medium-Range Weather Forecasts (ECMWF)의 ERA5 자료를 사용하였다. 연구방법으로는 해수면 온도 데이터의 시계열 특징을 고려하여 딥러닝 모델 중 시계열 데이터 예측에 특화된 Long Short-Term Memory (LSTM) 알고리즘을 이용하였다. 예측 모델은 1~7일 이후 한반도 근해 해수면 온도를 예측하고 고수온(High water temperature, HWT) 혹은 저수온(Low water temperature, LWT) 현상을 예측한다. 해수면 온도 예측 정확도 평가를 위해 결정계수(Coefficient of determination, R2), 평균제곱근 편차(Root Mean Squared Error, RMSE), 평균 절대 백분율 오차(Mean Absolute Percentage Error, MAPE) 지표를 사용하였다. 예측 모델의 여름철(JAS) 1일 예측 결과는 R2=0.996, RMSE=0.119℃, MAPE=0.352% 이고, 겨울철(JFM) 1일 예측 결과는 R2=0.999, RMSE=0.063℃, MAPE=0.646% 이었다. 예측한 해수면 온도를 이용하여 이상 수온 예측 정확도 평가를 F1 Score로 수행하였다(여름철(2021/08/05) 고수온 예측 결과 F1 Score=0.98, 겨울철(2021/02/19) 저수온 예측 결과 F1 Score=1.0). 예측 기간이 증가하면서 예측 모델이 해수면 온도를 과소추정하는 경향을 보여주었고, 이로 인해 이상 수온 예측 정확도 또한 낮아졌다. 따라서, 향후 예측 모델의 과소추정 원인을 분석하고 예측 정확도 향상을 위한 연구가 필요할 것으로 판단된다.

k-Nearest Neighbor 알고리즘을 이용한 도심 내 주요 도로 구간의 교통속도 단기 예측 방법 (Short-Term Prediction of Vehicle Speed on Main City Roads using the k-Nearest Neighbor Algorithm)

  • 모하메드 아리프 라시이디;김정민;류광렬
    • 지능정보연구
    • /
    • 제20권1호
    • /
    • pp.121-131
    • /
    • 2014
  • 교통속도는 교통 문제를 해결하기 위한 중요한 지표 중 하나이다. 이를 이용하여 교통혼잡 탐지, 주행 시간 예측, 도로 설계와 같은 다양한 문제 해결에 활용할 수 있다. 따라서 정확한 교통속도 예측은 지능형 교통 시스템의 개발에 있어 필수적인 요소라고 할 수 있다. 본 논문에서는 대한민국 부산시의 특정 도로를 대상으로 교통 속도에 대한 분석 및 예측을 수행하였다. 과거 연구에서는 대상 도로의 속도 예측을 위해 과거 대상 도로의 교통속도 이력 데이터만을 사용하였다. 그러나 실제 대상 도로의 교통 상황은 인접한 도로의 교통 상황의 영향을 받게 된다. 따라서 본 논문에서는 실제 부산시의 과거 교통속도 이력 데이터를 기반으로 대상 도로와 인접 도로를 모두 고려하여 교통속도 예측 모델의 학습을 위한 속성을 추출하였다. 이와 같이 후보 속성들을 추출 한 후 선형 회귀 (linear regression), 모델 트리 (model tree) 및 k-nearest neighbor (k-NN) 기법을 이용하여 속성의 부분집합 선택 (feature subset selection)과 교통속도 예측 모델 생성을 수행하였다. 실험 결과 주어진 교통 데이터에서 k-NN 기법은 선형 회귀 및 모델 트리 기법에 비해 평균절대백분율오차 (mean absolute percent error, MAPE)와 제곱근평균제곱오차 (root mean squared error, RMSE) 측면에서 더 나은 성능을 보임을 확인하였다.