• Title/Summary/Keyword: 다중 회귀

Search Result 3,935, Processing Time 0.033 seconds

On Testing the First-order Autocorrelation of the Error Term in a Regression Model via Multiple Bayes Factor (다중 베이즈요인에 의한 회귀모형 오차항의 자기상관 검정)

  • 한성실;김혜중
    • The Korean Journal of Applied Statistics
    • /
    • v.12 no.2
    • /
    • pp.605-619
    • /
    • 1999
  • 본 논문은 회귀분석에서 오차항의 1차 자기상관 존재 여부 및 그 값을 검정하는 방법을 베이지안 접근법으로 제안하였다. 이 방법은 모수공간의 다중분할로 인해 얻어진 여러 가설들에 대한 다중결정문제를 다중 베이즈요인에 관한 이론과 일반화 Savage-Dickey 밀도비를 이용한 사후확률 추정법을 합성하여 개발되었다. 이 방법은 기존의 검정법들에서 가능한 검정 뿐 아니라 이들이 해결할 수 없는 자기상관에 대한 다중결정문제에도 사용이 가능한데 그 효용성이 있다. 모의실험을 통하여 제안된 검정법의 유효성을 평가하였다.

  • PDF

Comparison of Regression Coefficient Significance Test for Temporal Distribution by Multiple Regression Analysis Method (다중회귀분석 방법에 따른 시간분포 회귀식의 회귀계수 유의성 검정 비교)

  • Lee, Sung Ho;Lee, Jae Joon;Park, Jin Hee
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2019.05a
    • /
    • pp.205-205
    • /
    • 2019
  • 우리나라에서 강우의 시간분포를 위해 보편적으로 사용되고 있는 방법은 Huff 4분위법으로 강우의 시간적 분포특성을 나타내는 무차원 시간분포곡선을 제시한 것으로, 강우의 지속기간을 4분위로 구분하여 각 분위의 강우량 중 가장 큰 값이 속해 있는 구간을 선택하여 그 구간의 위치에 따라 분위를 정하는 방법이다. 현재 실무에서는 Huff의 분위별 곡선에 대한 회귀식은 지속기간 전반에 걸쳐 정확도가 높은 이유로 6차식을 적용하고 있으나, 통계 모델링에서 간결함의 원리에 따라 회귀식이 간결할 필요가 있으며, 통계적 유의수준에 기초하여 회귀계수를 결정하여야 하므로 유의성 검정 방법을 통한 검정결과를 비교할 필요가 있다. 따라서 본 연구에서는 다중회귀분석 방법에 따른 회귀계수 유의성 검정결과 비교를 위하여 구미지역의 무차원 누가우량 백분율을 이용한 시간분포 회귀식을 이용하여 유의성 검정 방법인 분산분석 방법(Analysis of Variance)과 변수선택 방법(Backward Selection)의 검정 결과를 도출 및 비교하였다. 통계프로그램인 프로그래밍 R을 이용하여 변수선택 방법 중 후방제거법 함수를 이용하여 최종 회귀식을 도출하고 또한 7차 회귀식을 분산분석을 이용한 후방제거법으로 회귀계수를 제거하는 방법으로 최종 회귀식을 산정하였다. 분산분석을 이용한 후방제거법의 유의성 검정결과는 프로그래밍 R을 이용한 후방제거법의 결과와 동일한 것으로 분석되었다. 일반적으로 설계강우량의 시간분포를 위한 방법으로 사용되고 있는 Huff의 4분위 방법의 시간분포 회귀식은 회귀계수의 유의성 검정이 이루어지고 있지 않으므로 본 연구결과를 통해 설계강우량 시간분포 회귀식의 유의성 검정방법 제시 및 결과도출과정을 통해 시간분포 회귀식 산정기법으로 활용할 수 있을 것으로 사료된다.

  • PDF

Procedure for the Selection of Principal Components in Principal Components Regression (주성분회귀분석에서 주성분선정을 위한 새로운 방법)

  • Kim, Bu-Yong;Shin, Myung-Hee
    • The Korean Journal of Applied Statistics
    • /
    • v.23 no.5
    • /
    • pp.967-975
    • /
    • 2010
  • Since the least squares estimation is not appropriate when multicollinearity exists among the regressors of the linear regression model, the principal components regression is used to deal with the multicollinearity problem. This article suggests a new procedure for the selection of suitable principal components. The procedure is based on the condition index instead of the eigenvalue. The principal components corresponding to the indices are removed from the model if any condition indices are larger than the upper limit of the cutoff value. On the other hand, the corresponding principal components are included if any condition indices are smaller than the lower limit. The forward inclusion method is employed to select proper principal components if any condition indices are between the upper limit and the lower limit. The limits are obtained from the linear model which is constructed on the basis of the conjoint analysis. The procedure is evaluated by Monte Carlo simulation in terms of the mean square error of estimator. The simulation results indicate that the proposed procedure is superior to the existing methods.

Estimation of seasonal rainfall based on multiple regression analysis using ASOS data of Korea Meteorological Administration (기상청 ASOS 자료를 활용한 다중회귀분석 기반의 계절 강수량 예측)

  • Kim, Chul-gyum;Lee, Jeongwoo;Lee, Jeong Eun;Kim, Nam-won;Kim, Hyeonjun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2019.05a
    • /
    • pp.310-310
    • /
    • 2019
  • 본 연구에서는 기상청 ASOS(종관기상관측장비) 자료와 통계적 기반의 다중회귀분석모형을 이용하여 경안천 유역에 대한 봄철 강수량(3~5월 누적강수량)의 예측성을 평가하였다. 예측대상기간은 2006~2018년이며 예측인자로서 전국 96개 지점의 ASOS 자료 중 35개 기상요소에 대한 월 자료를 활용하였다. 전망기간(1~12개월)에 따라 강수량 기준 최소 1개월에서 최대 24개월까지의 지체시간을 고려하여 1~24개월 선행 ASOS 기상자료와 강수량 사이의 상관성을 분석하였다. 예측대상년도를 기준으로 과거 40년간의 자료를 이용하여 상관성 분석을 수행하였으며, 상관성이 높은 상위 30개 기상인자를 조합하여 다중회귀분석모형의 예측인자(독립변수)로 활용하였다. 예측대상년도와 전망기간에 따라 최적의 예측인자를 조합하고, 교차검증을 통하여 각각 4,000개의 다중회귀모형을 도출하여 예측범위를 산출하였다. 다중회귀모형에 의한 예측범위를 분석한 결과, 2013년 자료까지는 예측범위가 관측값을 잘 포함하고 예측값의 평균이나 중간값이 관측값과 유사하게 나타난 반면, 2014년부터는 전망기간에 따라 관측값과 예측범위의 차이가 크게 나타나는 경우도 있었다. 예측치의 중간값을 기준으로 3분위(평년 이상, 평년 수준, 평년 이하) 적중률을 분석하면, 2006~2013년에 대해서는 58.3%인 반면, 2014~2018년에 대해서는 11.2% 수준으로 나타났다.

  • PDF

A study on the properties of sensitivity analysis in principal component regression and latent root regression (주성분회귀와 고유값회귀에 대한 감도분석의 성질에 대한 연구)

  • Shin, Jae-Kyoung;Chang, Duk-Joon
    • Journal of the Korean Data and Information Science Society
    • /
    • v.20 no.2
    • /
    • pp.321-328
    • /
    • 2009
  • In regression analysis, the ordinary least squares estimates of regression coefficients become poor, when the correlations among predictor variables are high. This phenomenon, which is called multicollinearity, causes serious problems in actual data analysis. To overcome this multicollinearity, many methods have been proposed. Ridge regression, shrinkage estimators and methods based on principal component analysis (PCA) such as principal component regression (PCR) and latent root regression (LRR). In the last decade, many statisticians discussed sensitivity analysis (SA) in ordinary multiple regression and same topic in PCR, LRR and logistic principal component regression (LPCR). In those methods PCA plays important role. Many statisticians discussed SA in PCA and related multivariate methods. We introduce the method of PCR and LRR. We also introduce the methods of SA in PCR and LRR, and discuss the properties of SA in PCR and LRR.

  • PDF

Development and Validation of Multiple Regression Models for the Prediction of Effluent Concentration in a Sewage Treatment Process (하수처리장 방류수 수질예측을 위한 다중회귀분석 모델 개발 및 검증)

  • Min, Sang-Yun;Lee, Seung-Pil;Kim, Jin-Sik;Park, Jong-Un;Kim, Man-Soo
    • Journal of Korean Society of Environmental Engineers
    • /
    • v.34 no.5
    • /
    • pp.312-315
    • /
    • 2012
  • In this study, the model which can predict the quality of effluent has been implemented through multiple regression analysis to use operation data of a sewage treatment plant, to which a media process is applied. Multiple regression analysis were carried out by cases according to variable selection method, removal of outliers and log transformation of variables, with using data of one year of 2011. By reviewing the results of predictable models, the accuracy of prediction for $COD_{Mn}$ of treated water of secondary clarifiers was over 0.87 and for T-N was over 0.81. Using this model, it is expected to set the range of operating conditions that do not exceed the standards of effluent quality. In conclusion, the proper guidance on the effluent quality and energy costs within the operating range is expected to be provided to operators.

First-time estimation of HCHO column in major cities over Asia using multiple regression with satellite data (위성자료와 다중회귀분석법을 이용한 아시아 주요도시의 포름알데하이드 칼럼농도 추정연구)

  • Choi, Wonei;Hong, Hyunkee;Park, Junsung;Lee, Hanlim
    • Korean Journal of Remote Sensing
    • /
    • v.31 no.6
    • /
    • pp.523-530
    • /
    • 2015
  • A Multiple Regression Method (MRM) is used for the first time with Ozone Monitoring Instrument (OMI) and Moderate Resolution Imaging Spectroradiometer (MODIS) data to estimate formaldehyde (HCHO) Vertical Column Density (VCD). For a 3.5-year period from January 2005 through July 2008, HCHO VCD estimation is investigated in cities over Asia in two categorized areas: (1) Major cities in Northeast Asia (Beijing, Seoul, and Tokyo), (2) Major cities in Southeast Asia (New Delhi, Dhaka, and Bangkok). In the Major cities in Northeast Asia, there are good agreements between HCHO estimated by the multiple linear regression method ($HCHO_{MRM}$) and HCHO measured by OMI ($HCHO_{OMI}$) (0.78 < $R^2$ < 0.82). However, in Major cities in Southeast Asia, there were poor agreements between $HCHO_{OMI}$ and $HCHO_{MRM}$ (0.24 < $R^2$ < 0.39). In addition, an unbiased assessment of the MRM performance using modeling and validation groups shows that the performance of the MRM based on separate modeling and validation groups is comparable to that using all the data for deriving Multiple Regression Equations (MREs). This study demonstrates that MRM can be an alternative tool for HCHO estimation in certain areas over Asia.

Comments on the regression coefficients (다중회귀에서 회귀계수 추정량의 특성)

  • Kahng, Myung-Wook
    • The Korean Journal of Applied Statistics
    • /
    • v.34 no.4
    • /
    • pp.589-597
    • /
    • 2021
  • In simple and multiple regression, there is a difference in the meaning of regression coefficients, and not only are the estimates of regression coefficients different, but they also have different signs. Understanding the relative contribution of explanatory variables in a regression model is an important part of regression analysis. In a standardized regression model, the regression coefficient can be interpreted as the change in the response variable with respect to the standard deviation when the explanatory variable increases by the standard deviation in a situation where the values of the explanatory variables other than the corresponding explanatory variable are fixed. However, the size of the standardized regression coefficient is not a proper measure of the relative importance of each explanatory variable. In this paper, the estimator of the regression coefficient in multiple regression is expressed as a function of the correlation coefficient and the coefficient of determination. Furthermore, it is considered in terms of the effect of an additional explanatory variable and additional increase in the coefficient of determination. We also explore the relationship between estimates of regression coefficients and correlation coefficients in various plots. These results are specifically applied when there are two explanatory variables.

A Study on the Characteristics of Algae Occurrence in Lower Watershed of Nam River Dam by Using Multiple Regression Analysis (다중회귀분석을 이용한 남강댐 하류지역의 조류발생 특성 연구)

  • Jung, Woo Suk;Kim, Young Do
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2016.05a
    • /
    • pp.126-126
    • /
    • 2016
  • 남강은 낙동강 주요 지류인 동시에 낙동강 하류지역의 유지용수, 생활, 공업, 농업용수 공급 등에 중요 역할을 하고 있어 오염원 및 수질관리가 매우 중요하다고 볼 수 있다. 최근 남강댐 하류 및 남강합류 후 낙동강 본류인 창녕함안보 지점에서의 녹조 발생이 빈번해지고 있으며, 녹조현상에 대한 관심과 우려가 높아지고 있는 실정이다. 따라서 기존 호소의 녹조관리는 '조류경보제'에 의해서 관리되고 있지만 4대강 16개의 보 건설 이후 '수질예보제'와 같이 녹조관리를 위한 제도 및 정책이 시행되면서 조류관리의 중요성이 대두되고 있다. 본 연구에서는 기존의 많은 문헌들을 참고하여 조류의 영향인자를 파악하였으며, 남강유역의 물관리 기초자료를 수집하고 구축된 데이터 기반의 각 항목별 주요항목 영향인자 분석을 위한 상관성 분석을 실시하여 영향인자별 상관관계 우선순위를 선정하여 입력변수로 이용하였다. 그에 따른 데이터 마이닝을 통한 조류 발생특성을 고려하여 예측 모형인 다중회귀분석(Multiple Regression Analysis)을 구현하였다. 회귀분석 과정에서 다중공선성이 발생하는 변수에 대해서는 모형에서 제거하였으며, 잔차분석을 통해 이상치와 영향치를 검토하여 고려하였다.

  • PDF

Voice Personality Transformation Using a Multiple Response Classification and Regression Tree (다중 응답 분류회귀트리를 이용한 음성 개성 변환)

  • 이기승
    • The Journal of the Acoustical Society of Korea
    • /
    • v.23 no.3
    • /
    • pp.253-261
    • /
    • 2004
  • In this paper, a new voice personality transformation method is proposed. which modifies speaker-dependent feature variables in the speech signals. The proposed method takes the cepstrum vectors and pitch as the transformation paremeters, which represent vocal tract transfer function and excitation signals, respectively. To transform these parameters, a multiple response classification and regression tree (MR-CART) is employed. MR-CART is the vector extended version of a conventional CART, whose response is given by the vector form. We evaluated the performance of the proposed method by comparing with a previously proposed codebook mapping method. We also quantitatively analyzed the performance of voice transformation and the complexities according to various observations. From the experimental results for 4 speakers, the proposed method objectively outperforms a conventional codebook mapping method. and we also observed that the transformed speech sounds closer to target speech.