• Title/Summary/Keyword: 평균회귀

Search Result 2,326, Processing Time 0.032 seconds

Performance Improvement of General Regression Neural Network Using Principal Component Analysis (주요성분분석에 의한 일반회귀 신경망의 성능개선)

  • Cho, Yong-Hyun
    • The Transactions of the Korea Information Processing Society
    • /
    • v.7 no.11
    • /
    • pp.3408-3416
    • /
    • 2000
  • This paper proposes an efficient method for improving the performance of a general regression neural network by using the feature to the independent variables as the center for partern-layer neurons. The adaptive principal component analysis is applied for extracting, efficiently the fcarures by reducing the dimension of given independent variables. In can acluevc a supertor property of the principal component analysis that converts input data into set of statistically independent features and the general regression neuralnetwork, espedtively. The proposed general regression neural network has been applied to regress the Solow's economy(2-independent variable set) and the wie elephone(1-independent vanable set). The simulation results show that the proposed meural networks have better performances of the regressionfor the lest data, in comparison with those using the means or the weighted means of independent variables. Also,it is affected less by the number of neurons and the scope of the smoothing factor.

  • PDF

The effect of adding the summed univariate data to the bivariate data in regression model (회귀모형에서 이변량 자료에 합산된 일변량 자료를 첨가시킬 때의 효과)

  • 박래현;이석훈;김노만
    • The Korean Journal of Applied Statistics
    • /
    • v.12 no.2
    • /
    • pp.573-584
    • /
    • 1999
  • 본 연구는 이변량 회귀모형을 이변량 자료에 적용할 때 이변량 자료(분리형 자료) 이외에 이변량 자료를 합산한 일변량 자료(통합형 자료)를 동시에 사용하는 문제를 고찰하였다. 특징을 파악하기 위하여 설명변수가 하나인 경우를 다루었는데 통합형 자료의 첨가효과를 회귀계수의 추정량의 평균제곱오차의 크기로서 측정하면서 효과와 이변량 모형과의 관계를 조사하였다. 최대우도 추장량의 특성으로부터 대표본의 성질을 추출하고 또한 모의실험을 통하여 소표본에서도 대표본의 성질이 만족하는지 조사하였고 끝으로 실제 자료에 적용하여 보았다.

  • PDF

A Comparison of Estimation Procedures in a Nested Error Components Regression Model (내포오차성분을 가정한 패널회귀모형에서 추정량의 효율에 관한 비교)

  • 송석헌;전명식;정병철
    • The Korean Journal of Applied Statistics
    • /
    • v.13 no.1
    • /
    • pp.55-70
    • /
    • 2000
  • 본 논문에서는 내포오차성분을 가지는 패널회귀모형에서 회귀계수에 대하여 다양한 추정량들을 유도하고, 추정량들의 효율성을 모의실험을 통하여 평균제곱오차의 기준에서 비교하였다. 모의실험 결과, 제안된 FGLS 추정량들은 GLS추정량과 효율성에서 서로 큰 차이를 보이지 않았으며, 계산상 더욱 복잡한 ML, REML 추정량 및 MIVQUE와 거의 비슷한 효율성을 보여주었다.

  • PDF

A comparison of formulas to predict a team's winning percentage in Korean pro-baseball (한국프로야구에서 승률 추정방법들의 비교)

  • Lee, Jang Taek
    • Journal of the Korean Data and Information Science Society
    • /
    • v.27 no.6
    • /
    • pp.1585-1592
    • /
    • 2016
  • Estimation of winning percentage in baseball has always been particularly interesting to many baseball fans. We have fitted models including linear regression and Pythagorean formula to the Korean baseball data of seasons from 1982 to 2015. Using RMSE criterion for both the linear formula and the Pythagorean formula, we compared two models in predicting the actual winning percentage. Pythagorean expectation is superior to linear formula when there is either high or low winning percentage. Two methods yield very similar efficiencies when the actual winning percentage is about 50%. To understand and use for estimating winning percentage, it is easier linear formula as estimated equations.

Forecasting Korean housing price index: application of the independent component analysis (부동산 매매지수와 전세지수 예측: 독립성분분석을 활용한 분석)

  • Pak, Ro Jin
    • The Korean Journal of Applied Statistics
    • /
    • v.30 no.2
    • /
    • pp.271-280
    • /
    • 2017
  • Real-estate values and related economics are often the first read newspaper category. We are concerned about the opinions of experts on the forecast for real estate prices. The Box-Jenkins ARIMA model is a commonly used statistical method to predict housing prices. In this article, we tried to predict housing prices by combining independent component analysis (ICA) in multivariate data analysis and the Box-Jenkins ARIMA model. The two independent components for both the selling price index and the long-term rental price index were extracted and used to predict the future values of both indices. In conclusion, it has been shown that the actual indices and the forecast indices using ICA are more comparable to the forecasts of the ARIMA model alone.

Development of a Daily Snowmelt Depth Model using Multiple Linear Regression (다중회귀모형을 활용한 일 단위 융설 깊이 예측 모형 개발)

  • Oh, Yeoung Rok;Lee, Gyumin;Shin, Hyungjin;Jun, Kyung Soo
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2021.06a
    • /
    • pp.374-374
    • /
    • 2021
  • 최근 우리나라에도 대설로 인한 피해가 발생하고 있으며, 피해의 대부분은 강설 발생 이후 남아 있는 적설량이 주된 원인이 되고 있다. 적설량에 대한 예측은 대설피해에 대응하기 위한 중요한 정보이다. 따라서 본 연구에서는 융설량에 영향을 미칠것으로 판단되는 적설량, 기온, 습도, 일사량을 반영하여 일일 융설량을 모의하는 다중회귀모형을 구성하였다. 모형은 2000년부터 2020년까지의 강설 사상을 대상으로 구축하였으며, 2021년에 발생한 광주, 대관령, 목포, 서산, 전주 지역의 강설 사상에 적용하였다. 분석 대상 지역의 평균 적설량은 7.41 cm로 나타났으며, 평균 RMSE는 1.64 cm가 발생하였다. 오차의 원인으로는 적설량이 1 cm 미만 감소했을 경우, 바람이나 승화의 영향이 상대적으로 크게 작용할 수 있으나, 본 연구에 이용된 함수는 바람과 증발산 등이 고려되지 않았다. 또한, 회귀계수 결정에서 급격한 온도 변화를 능동적으로 반영하기 어려워 급상승한 온도나 매우 낮은 온도에 오차가 더 크게 나타난다. 따라서, 본 함수를 통하여 융설 깊이를 예측하기 위해서는 매우 높은 온도나, 매우 낮은 온도에서의 영향을 통제할 수 있는 변수 또는 상수를 추가할 필요가 있는 것으로 판단된다. 또한 초기 강설 당시의 기온과 습도 등에 따라, 눈의 결정이 달라지고, 이에 따라 융설에도 영향을 미칠 수 있다는 점을 이해하여, 초기 적설에 대한 변수도 고려되어야 할 것이다.

  • PDF

Longevity Bond Pricing by a Cohort-based Stochastic Mortality (코호트 사망률을 이용한 장수채권 가격산출)

  • Jho, Jae Hoon;Lee, Kangsoo
    • The Korean Journal of Applied Statistics
    • /
    • v.28 no.4
    • /
    • pp.703-719
    • /
    • 2015
  • We propose an extension of the Lee and Jho (2015) mean reverting the two factor mortality model by incorporating a period-specific cohort effect. We found that the consideration of cohort effect improves the mortality fit of Korea male data above age 65. Parameters are estimated by the weighted least squares method and Metropolis algorithm. We also emphasize that the cohort effect is necessary to choose the base survival index to calculate longevity bond issue price. A key contribution of the article is the proposal and development of a method to calculate the longevity bond price to hedge the longevity risk exposed to Korea National Pension Services.

Analyzing Significant Variables from a Linear Regression-Based Prediction Model for Rice Prices (선형 회귀를 이용한 쌀 가격 예측 모델의 유의미한 변수 추출)

  • Seo, Jin-kyeong;Choi, Da-jeong;Ko, Kwang-Ho;Paik, Juryon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.39-42
    • /
    • 2022
  • 쌀을 주식으로 하는 우리나라에서, 쌀의 가격에 영향을 미치는 변수를 찾는 것은 유의미한 연구이다. 본 논문에서는 쌀 가격을 예측하는 모델에 포함되는 여러 변수 가운데 상대적인 중요도가 낮은 변수를 제거하고 유의미한 변수만을 남기고자 한다. 이를 위해 기상, 수확량, 소비자물가의 10년 치 정보를 수집하고 정제한 결과 총 2460일, 7개 지역에서 추출된 17,219개의 데이터를 이용하였다. 모델 평가 결과, 모든 변수를 포함한 모델의 RMSE는 166.0759, 단계적으로 계수가 작은 9개의 변수를 제거한 최종적인 모델의 RMSE는 168.5576으로 유의미한 차이를 보이지 않았다. 최종적으로 남은 변수는 총 10개로 평균 기온, 평균 풍속, 합계 일사, 평균 지면 온도, 0.5M 평균 습도, 4.0M 평균 습도, 10CM 일 토양 수분, 30CM 일 토양 수분, 50CM 일 토양 수분, 전년도 생산량이 포함된다.

  • PDF

Development of Naïve-Bayes classification and multiple linear regression model to predict agricultural reservoir storage rate based on weather forecast data (기상예보자료 기반의 농업용저수지 저수율 전망을 위한 나이브 베이즈 분류 및 다중선형 회귀모형 개발)

  • Kim, Jin Uk;Jung, Chung Gil;Lee, Ji Wan;Kim, Seong Joon
    • Journal of Korea Water Resources Association
    • /
    • v.51 no.10
    • /
    • pp.839-852
    • /
    • 2018
  • The purpose of this study is to predict monthly agricultural reservoir storage by developing weather data-based Multiple Linear Regression Model (MLRM) with precipitation, maximum temperature, minimum temperature, average temperature, and average wind speed. Using Naïve-Bayes classification, total 1,559 nationwide reservoirs were classified into 30 clusters based on geomorphological specification (effective storage volume, irrigation area, watershed area, latitude, longitude and frequency of drought). For each cluster, the monthly MLRM was derived using 13 years (2002~2014) meteorological data by KMA (Korea Meteorological Administration) and reservoir storage rate data by KRC (Korea Rural Community). The MLRM for reservoir storage rate showed the determination coefficient ($R^2$) of 0.76, Nash-Sutcliffe efficiency (NSE) of 0.73, and root mean square error (RMSE) of 8.33% respectively. The MLRM was evaluated for 2 years (2015~2016) using 3 months weather forecast data of GloSea5 (GS5) by KMA. The Reservoir Drought Index (RDI) that was represented by present and normal year reservoir storage rate showed that the ROC (Receiver Operating Characteristics) average hit rate was 0.80 using observed data and 0.73 using GS5 data in the MLRM. Using the results of this study, future reservoir storage rates can be predicted and used as decision-making data on stable future agricultural water supply.

Estimation of surface nitrogen dioxide mixing ratio in Seoul using the OMI satellite data (OMI 위성자료를 활용한 서울 지표 이산화질소 혼합비 추정 연구)

  • Kim, Daewon;Hong, Hyunkee;Choi, Wonei;Park, Junsung;Yang, Jiwon;Ryu, Jaeyong;Lee, Hanlim
    • Korean Journal of Remote Sensing
    • /
    • v.33 no.2
    • /
    • pp.135-147
    • /
    • 2017
  • We, for the first time, estimated daily and monthly surface nitrogen dioxide ($NO_2$) volume mixing ratio (VMR) using three regression models with $NO_2$ tropospheric vertical column density (OMIT-rop $NO_2$ VCD) data obtained from Ozone Monitoring Instrument (OMI) in Seoul in South Korea at OMI overpass time (13:45 local time). First linear regression model (M1) is a linear regression equation between OMI-Trop $NO_2$ VCD and in situ $NO_2$ VMR, whereas second linear regression model (M2) incorporates boundary layer height (BLH), temperature, and pressure obtained from Atmospheric Infrared Sounder (AIRS) and OMI-Trop $NO_2$ VCD. Last models (M3M & M3D) are a multiple linear regression equations which include OMI-Trop $NO_2$ VCD, BLH and various meteorological data. In this study, we determined three types of regression models for the training period between 2009 and 2011, and the performance of those regression models was evaluated via comparison with the surface $NO_2$ VMR data obtained from in situ measurements (in situ $NO_2$ VMR) in 2012. The monthly mean surface $NO_2$ VMRs estimated by M3M showed good agreements with those of in situ measurements(avg. R = 0.77). In terms of the daily (13:45LT) $NO_2$ estimation, the highest correlations were found between the daily surface $NO_2$ VMRs estimated by M3D and in-situ $NO_2$ VMRs (avg. R = 0.55). The estimated surface $NO_2$ VMRs by three modelstend to be underestimated. We also discussed the performance of these empirical modelsfor surface $NO_2$ VMR estimation with respect to otherstatistical data such asroot mean square error (RMSE), mean bias, mean absolute error (MAE), and percent difference. This present study shows a possibility of estimating surface $NO_2$ VMR using the satellite measurement.