• Title/Summary/Keyword: 다중회귀 모형

Search Result 708, Processing Time 0.028 seconds

Comparison of Different Multiple Linear Regression Models for Real-time Flood Stage Forecasting (실시간 수위 예측을 위한 다중선형회귀 모형의 비교)

  • Choi, Seung Yong;Han, Kun Yeun;Kim, Byung Hyun
    • KSCE Journal of Civil and Environmental Engineering Research
    • /
    • v.32 no.1B
    • /
    • pp.9-20
    • /
    • 2012
  • Recently to overcome limitations of conceptual, hydrological and physics based models for flood stage forecasting, multiple linear regression model as one of data-driven models have been widely adopted for forecasting flood streamflow(stage). The objectives of this study are to compare performance of different multiple linear regression models according to regression coefficient estimation methods and determine most effective multiple linear regression flood stage forecasting models. To do this, the time scale was determined through the autocorrelation analysis of input data and different flood stage forecasting models developed using regression coefficient estimation methods such as LS(least square), WLS(weighted least square), SPW(stepwise) was applied to flood events in Jungrang stream. To evaluate performance of established models, fours statistical indices were used, namely; Root mean square error(RMSE), Nash Sutcliffe efficiency coefficient (NSEC), mean absolute error (MAE), adjusted coefficient of determination($R^{*2}$). The results show that the flood stage forecasting model using SPW(stepwise) parameter estimation can carry out the river flood stage prediction better in comparison with others, and the flood stage forecasting model using LS(least square) parameter estimation is also found to be slightly better than the flood stage forecasting model using WLS(weighted least square) parameter estimation.

Prediction of damages induced by Snow using Multiple-linear regression and Artificial Neural Network model (다중선형회귀 및 인공신경망 모형을 이용한 대설피해에 따른 피해액 예측에 관한 연구)

  • Kwon, Soon Ho;Lee, Eui Hoon;Chung, Gunhui;Kim, Joong Hoon
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.20-20
    • /
    • 2017
  • 최근 기후변화 영향에 따라 전 세계적으로 인명피해 및 재산피해를 유발하는 자연재난이 지속적으로 증가하고 있으며, 그로 인한 자연재해의 규모가 점점 더 커지고 있다. 실제로 우리나라에서도 지난 1994 년에서 2013 년까지 지난 20 년간 자연재해에 의한 피해액은 12조 3천억 원으로 집계되었으며, 이 중 강우와 태풍에 의한 피해가 85 % 이고, 대설에 의한 피해는 약 13 % 로 자연재해 중 대부분의 피해는 강우 및 태풍에서 발생하지만, 폭설에 의한 피해도 적지 않은 것으로 나타났다. 이에 따라, 정확한 예측을 위해 신뢰도 높은 자료 구축을 통한 대설피해 예측에 관한 연구가 필요한 시점이다. 본 연구에서는 대설피해액 예측을 위해 우리나라의 63개 기상 관측소에서 관측한 적설심 자료 및 기상관측 자료와 사회 경제 자료 총 11개를 대설피해 예측을 위한 입력변수로 선정하고, 이를 기상관측소가 속한 도시의 면적에 따라 3개의 지역으로 구분하였다. 주성분분석을 활용하여 선정된 입력변수들을 4개의 주성분으로 구분하고, 인공신경망 및 다중선형 회귀 모형을 구성하여 각 지역별 대설피해 예측의 오차를 분석하였다. 적용결과, 인공신경망 모형을 이용한 대설피해 예측의 수정결정계수는 22.8 %~48.2 %를 나타냈고, 다중선형회귀 모형의 수정결정 계수는 9.2 %~39.7% 로 나타났다. 그러므로 인공신경망 모형이 다중회귀 모형보다 선택된 입력자료를 활용하여 대설피해를 예측하는 목적으로 조금 더 우수한 결과를 나타내었다. 향후 자료를 보완 및 모형의 고도화를 통해 보다 정확한 대설피해 예측 함수 개발이 가능할 것으로 기대된다.

  • PDF

Comments on the regression coefficients (다중회귀에서 회귀계수 추정량의 특성)

  • Kahng, Myung-Wook
    • The Korean Journal of Applied Statistics
    • /
    • v.34 no.4
    • /
    • pp.589-597
    • /
    • 2021
  • In simple and multiple regression, there is a difference in the meaning of regression coefficients, and not only are the estimates of regression coefficients different, but they also have different signs. Understanding the relative contribution of explanatory variables in a regression model is an important part of regression analysis. In a standardized regression model, the regression coefficient can be interpreted as the change in the response variable with respect to the standard deviation when the explanatory variable increases by the standard deviation in a situation where the values of the explanatory variables other than the corresponding explanatory variable are fixed. However, the size of the standardized regression coefficient is not a proper measure of the relative importance of each explanatory variable. In this paper, the estimator of the regression coefficient in multiple regression is expressed as a function of the correlation coefficient and the coefficient of determination. Furthermore, it is considered in terms of the effect of an additional explanatory variable and additional increase in the coefficient of determination. We also explore the relationship between estimates of regression coefficients and correlation coefficients in various plots. These results are specifically applied when there are two explanatory variables.

Semi-Markov 모형에 기초한 다중상태 생존자료의 준모수적 분석

  • 여성칠
    • Communications for Statistical Applications and Methods
    • /
    • v.5 no.3
    • /
    • pp.777-792
    • /
    • 1998
  • 병원의 임상연구실험에서 종종 환자들의 치료에 따른 병세의 호전상태를 여러단계로 분류하여 상이한 치료방법에 대한 치료효과간의 차이론 알고자 하는 경우가 있다. 이와 같이 다중상태의 생존자료를 분석하기 위해서 본 논문에서는 semi-Markov 모형에 Cox 회귀모형을 적용하여 회귀계수와 기저생존함수를 추정하고 이를 바탕으로 반응확률함수를 추정하였다. 그리고 본 논문의 결과를 실제 임상실험에서 얻어진 자료에 적용하여 분석하였다.

  • PDF

Development of Regression Models Resolving High-Dimensional Data and Multicollinearity Problem for Heavy Rain Damage Data (호우피해자료에서의 고차원 자료 및 다중공선성 문제를 해소한 회귀모형 개발)

  • Kim, Jeonghwan;Park, Jihyun;Choi, Changhyun;Kim, Hung Soo
    • KSCE Journal of Civil and Environmental Engineering Research
    • /
    • v.38 no.6
    • /
    • pp.801-808
    • /
    • 2018
  • The learning of the linear regression model is stable on the assumption that the sample size is sufficiently larger than the number of explanatory variables and there is no serious multicollinearity between explanatory variables. In this study, we investigated the difficulty of model learning when the assumption was violated by analyzing a real heavy rain damage data and we proposed to use a principal component regression model or a ridge regression model after integrating data to overcome the difficulty. We evaluated the predictive performance of the proposed models by using the test data independent from the training data, and confirmed that the proposed methods showed better predictive performances than the linear regression model.

Forecasting Technique of Downstream Water Level using the Observed Water Level of Upper Stream (수계 상류 관측 수위자료를 이용한 하류 홍수위 예측기법)

  • Kim, Sang Mun;Choi, Byungwoong;Lee, Namjoo
    • Ecology and Resilient Infrastructure
    • /
    • v.7 no.4
    • /
    • pp.345-352
    • /
    • 2020
  • Securing the lead time for evacuation is crucial to minimize flood damage. In this study, downstream water levels for heavy rainfall were predicted using measured water level observation data. Multiple regression analysis and artificial neural networks were applied to the Seom River experimental watershed to predict the water level. Water level observation data for the Seom River experimental watershed from 2002 to 2010 were used to perform the multiple regression analysis and to train the artificial neural networks. The water level was predicted using the trained model. The simulation results for the coefficients of determination of the artificial neural network level prediction ranged from 0.991 to 0.999, while those of the multiple regression analysis ranged from 0.945 to 0.990. The water level prediction model developed using an artificial neural network was better than the multiple-regression analysis model. This technique for forecasting downstream water levels is expected to contribute toward flooding warning systems that secure the lead time for streams.

Development of Multiple Linear Regression Model to Predict Agricultural Reservoir Storage based on Naive Bayes Classification and Weather Forecast Data (나이브 베이즈 분류와 기상예보자료 기반의 농업용 저수지 저수율 전망을 위한 저수율 예측 다중선형 회귀모형 개발)

  • Kim, Jin Uk;Jung, Chung Gil;Lee, Ji Wan;Kim, Seong Joon
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2018.05a
    • /
    • pp.112-112
    • /
    • 2018
  • 최근 이상기후로 인한 국부적인 혹은 광역적인 가뭄이 빈번하게 발생하고 있는 추세이며 발생횟수 뿐 아니라 가뭄 심도 및 지속기간이 과거보다 크게 증가하여 그에 따른 피해가 커질 것으로 예측되고 있다. 특히, 2014~2015년도의 유례없는 가뭄으로 인해 저수지 용수공급이 제한되면서 많은 농가들이 피해를 입었다. 본 연구의 목적은 전국 농업용 저수지를 대상으로 기상청 3개월 예보자료를 활용 할 수 있는 농업용 저수지 저수율 다중선형 회귀 모형을 개발하여 저수율 전망정보를 생산하는 것이다. 본 연구에서는 전국에 적용 가능한 저수율 다중선형 회귀 모형개발을 위해 5개의 기상요소(강수량, 최고기온, 최저기온, 평균기온, 평균풍속)와 관측 저수지 저수율을 활용했다. 기상자료는 2002년부터 2017년까지의 기상청 63개 지상관측소로부터 기상관측자료를 수집하였다. 본 연구에서는 저수율 전망 단계를 세 단계로 나누었다. 첫 번째 단계로 농어촌공사에서 전국 511개 용수구역을 대상으로 군집분석 및 의사결정나무 분석을 통해 제시한 65개 대표저수지를 대상으로 기상자료 및 관측 저수율 자료를 이용하여 다중선형 회귀분석을 실시하였다. 수집한 기상요소와 저수율을 독립변수로 하여 월별 회귀식을 산정한 결과 결정계수($R^2$)는 0.51~0.95로 나타났다. 두 번째 단계로 대표저수지의 회귀분석 결과를 전국의 저수지로 확대하기 위해 나이브 베이즈 분류법을 적용하여 전국 3098개의 저수지를 65의 군집으로 분류하고 각각의 군집에 해당되는 월별 회귀식을 산정하였다. 마지막으로 전국 저수지로 산정된 회귀식과 농업 가뭄 예측을 위해 기상청의 GS5(Global Seasonal Forecasting System 5) 3개월 예보자료를 수집하여 회귀식에 적용해 2017년 전국 저수지의 3개월 저수율 전망정보를 생산하였다. 본 연구의 전국 저수지 군집결과 기반의 저수율 전망기술은 2017년도 관측 저수율과 비교한 결과 유의한 상관성을 나타냈으며 이 결과는 추후 농업용 저수지의 물 공급 및 농업가뭄 전망 자료로서 이용이 가능할 것으로 판단된다.

  • PDF

Flood risk index optimization using multiple linear regression (다중선형회귀를 이용한 홍수위험지수 최적화)

  • Kim, Myojeong;Kim, Gwangseob
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2016.05a
    • /
    • pp.283-283
    • /
    • 2016
  • 기후변화의 지역적 영향으로 호우의 강도와 빈도가 증가하고 있는 상황에서 수재해 대응을 위하여 다양한 기술들이 필요하며 특히 홍수 취약성에 대한 분석과 평가가 선행되어야 한다. 본 연구에서는 기존의 PSR(Pressure-State-Response) 모형과 DPSIR(Driving force-Pressure-StateImpact-Response 모형을 다중선형회귀 기법을 사용하여 최적화하였다(Fig. 1). 대상기간은 2008년부터 2013년까지이며, mod 1에서는 연도별로 다중선형회귀기법을 사용하여 최적 가중치를 산정하였고, mod 2에서는 대상기간(2008 ~ 2013) 전체에 대해 다중선형회귀기법을 사용하여 최적 가중치를 산정하는 방법을 적용하였다.

  • PDF

A Multiple Regression Model for the Estimation of Monthly Runoff from Ungaged Watersheds (미계측 중소유역의 월유출량 산정을 위한 다중회귀모형 연구)

  • 윤용남;원석연
    • Water for future
    • /
    • v.24 no.3
    • /
    • pp.71-82
    • /
    • 1991
  • Methods of predicting water resources availiability of a river basin can be classified as empirical formula, water budget analysis and regression analysis. The purpose of this study is to develop a method to estimate the monthly runoff required for long-term water resources development project. Using the monthly runoff data series at gaging stations alternative multiple regression models were constructed and evaluated. Monthly runoff volume along with the meteorological and physiographic parameters of 48 gaging stations are used, those of 43 stations to construct the model and the remaining 5 stations to verify the model. Regression models are named to be Model-1, Model-2, Model-3 and Model-4 developing on the way of data processing for the multiple regressions. From the verification, Model-2 is found to be the best-fit model. A comparison of the selected regression model with the Kajiyama's formula is made based on the predicted monthly and annual runoff of the 5 watersheds. The result showed that the present model is fairly resonable and convinient to apply in practice.

  • PDF

Peak discharge prediction by multiple regression analysis using hourly precipitation data (시강우량 다중회귀분석에 의한 첨두유량 예측)

  • Park, Chang-Eon
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.380-380
    • /
    • 2017
  • 유역에서 발생되는 유출량의 크기를 예측하는 것은 홍수피해를 대비하기 위한 가장 기초적인 활동으로 이루어지며, 이를 위하여 많은 수문모형들이 개발되어 활용되어지고 있다. 이러한 수문모형의 적용을 위해서는 먼저 해당 유역을 재현할 수 있는 매개변수의 보정이 이루어져야 하며 적절한 정도 이상의 검정결과를 확보하여야만 적용이 가능하다. 그러나, 유역 내의 각종 수문특성을 모형의 매개변수로 자세히 나타내는 것은 쉬운 작업이 아니며, 특히 정해진 기간 내에 적용해야 하는 유역이 다수인 경우에는 더욱 힘든 작업이 될 수밖에 없다. 기후변화에 따라 예견되는 강우량 발생 시나리오를 바탕으로 남한 일대의 홍수영향을 지자체별로 평가하기 위한 작업에서는 각 지자체별 많은 소유역에서의 적절한 수문모형 매개변수를 개별적으로 찾아내는 것은 사실상 불가능할 것으로 예견되어, 기후변화 시나리오에서 주어지는 시간별 강우량 자료를 활용하여 첨두유량을 예측할 수 있는 통계적인 방법을 적용하였다. 홍수영향을 평가하기 위하여는 수문곡선 자체보다는 첨두유량의 크기가 더 중요할 것으로 판단되어, 홍수통제소에 제공하는 각 유량관측지점의 유량자료와 시간별 강우량자료로부터 단위 호우사상별 첨두유량과 일정 시간간격 강우량 사이의 다중회귀분석을 통하여 첨두유량 예측 가능성을 확인하였다. 다중회귀분석을 위한 시간간격별 강우량은 각 강우사상에 대하여 첨두유량 발생 직전의 1시간~12시간의 1시간 간격, 1일, 2일, 3일, 5일, 10일 등 17가지의 시간간격 동안의 강우량 자료를 찾아 다중회귀분석에 활용하였으며, 2006년부터 2015년까지 최근 10년 동안의 홍수통제소 자료를 활용하였다. 대상지역은 경기도 남부의 너부대교, 경안교, 복하교, 수직교 수위관측소지점으로 선정하였으며, 일정 크기 이상의 첨두유량 자료를 선별하여 해당 기간에 대한 강우량 자료를 준비하고, 유출량의 크기별로 분류하여 절반의 호우사상은 매개변수 보정에 그리고 나머지 절반의 호우사상은 모형의 검정에 사용하였다. 매개변수 보정결과는 $R^2$ 값이 0.87~0.96을 보이는 등 첨두유량의 예측에 충분히 적용가능한 것으로 판단되었으며, 보정되어진 매개변수로 실시한 검정에서는 0.76~0.85의 $R^2$ 값을 보였다. 본 연구의 결과를 바탕으로, 충분한 유량자료와 시간별 강우량자료만 준비된다면 첨두유량을 예측할 수 있는 회귀방정식으로 이루어진 간단한 모형을 구성할 수 있으며, 이를 활용하여 임의로 주어지는 시간별 강우량 자료를 활용하여 첨두유량의 예측이 가능할 것으로 판단되었다.

  • PDF