• Title, Summary, Keyword: 회귀

Search Result 11,741, Processing Time 0.16 seconds

Improving Polynomial Regression Using Principal Components Regression With the Example of the Numerical Inversion of Probability Generating Function (주성분회귀분석을 활용한 다항회귀분석 성능개선: PGF 수치역변환 사례를 중심으로)

  • Yang, Won Seok;Park, Hyun-Min
    • The Journal of the Korea Contents Association
    • /
    • v.15 no.1
    • /
    • pp.475-481
    • /
    • 2015
  • We use polynomial regression instead of linear regression if there is a nonlinear relation between a dependent variable and independent variables in a regression analysis. The performance of polynomial regression, however, may deteriorate because of the correlation caused by the power terms of independent variables. We present a polynomial regression model for the numerical inversion of PGF and show that polynomial regression results in the deterioration of the estimation of the coefficients. We apply principal components regression to the polynomial regression model and show that principal components regression dramatically improves the performance of the parameter estimation.

Comparison of Regression Coefficient Significance Test for Temporal Distribution by Multiple Regression Analysis Method (다중회귀분석 방법에 따른 시간분포 회귀식의 회귀계수 유의성 검정 비교)

  • Lee, Sung Ho;Lee, Jae Joon;Park, Jin Hee
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • /
    • pp.205-205
    • /
    • 2019
  • 우리나라에서 강우의 시간분포를 위해 보편적으로 사용되고 있는 방법은 Huff 4분위법으로 강우의 시간적 분포특성을 나타내는 무차원 시간분포곡선을 제시한 것으로, 강우의 지속기간을 4분위로 구분하여 각 분위의 강우량 중 가장 큰 값이 속해 있는 구간을 선택하여 그 구간의 위치에 따라 분위를 정하는 방법이다. 현재 실무에서는 Huff의 분위별 곡선에 대한 회귀식은 지속기간 전반에 걸쳐 정확도가 높은 이유로 6차식을 적용하고 있으나, 통계 모델링에서 간결함의 원리에 따라 회귀식이 간결할 필요가 있으며, 통계적 유의수준에 기초하여 회귀계수를 결정하여야 하므로 유의성 검정 방법을 통한 검정결과를 비교할 필요가 있다. 따라서 본 연구에서는 다중회귀분석 방법에 따른 회귀계수 유의성 검정결과 비교를 위하여 구미지역의 무차원 누가우량 백분율을 이용한 시간분포 회귀식을 이용하여 유의성 검정 방법인 분산분석 방법(Analysis of Variance)과 변수선택 방법(Backward Selection)의 검정 결과를 도출 및 비교하였다. 통계프로그램인 프로그래밍 R을 이용하여 변수선택 방법 중 후방제거법 함수를 이용하여 최종 회귀식을 도출하고 또한 7차 회귀식을 분산분석을 이용한 후방제거법으로 회귀계수를 제거하는 방법으로 최종 회귀식을 산정하였다. 분산분석을 이용한 후방제거법의 유의성 검정결과는 프로그래밍 R을 이용한 후방제거법의 결과와 동일한 것으로 분석되었다. 일반적으로 설계강우량의 시간분포를 위한 방법으로 사용되고 있는 Huff의 4분위 방법의 시간분포 회귀식은 회귀계수의 유의성 검정이 이루어지고 있지 않으므로 본 연구결과를 통해 설계강우량 시간분포 회귀식의 유의성 검정방법 제시 및 결과도출과정을 통해 시간분포 회귀식 산정기법으로 활용할 수 있을 것으로 사료된다.

  • PDF

일반화혼합회귀 추정량과 베이지안 회귀추정량의 비교

  • 김주성;김영권
    • Communications for Statistical Applications and Methods
    • /
    • v.3 no.3
    • /
    • pp.1-9
    • /
    • 1996
  • 본 논문에서는 일반화 회귀모형의 회귀모수${\beta}$에 대한 사전정보의 형태에 따른 각 추정량들에 대하여 연구하였다. 먼저 사전정보가 ${\beta}$에 대한 사전분포로 주어지는 경우에 해당하는 베이지안 회귀추정량을 제시하였고, 다른 하나는 ${\beta}$에 대한 사전정보모형으로 선형회귀모형식이 주어진 경우의 일반화 혼합회귀추정량에 대하여 연구하였다. 두가지 경우로부터 얻어진 각 추정량의 정도를 알아보기 위하여 각 추정량의 공분산행렬을 이 용하여 서로 비교하여 보았다. 각 추정량의 분산비들을 이용하여 일반적으로 일반화 혼합회귀추정량이 베이지안 회귀추정량들보다 비교적 작은 분산값을 가진다는 결론을 얻었다.

  • PDF

Performance Comparison of Data Mining Approaches for Prediction Models of Near Infrared Spectroscopy Data (근적외선 분광 데이터 예측 모형을 위한 데이터 마이닝 기법의 성능비교)

  • Baek, Seung Hyun
    • Journal of the Korea Safety Management and Science
    • /
    • v.15 no.4
    • /
    • pp.311-315
    • /
    • 2013
  • 본 논문에서는 주성분 회귀법과 부분최소자승 회귀법을 비교하여 보여준다. 이 비교의 목적은 선형형태를 보유한 근적외선 분광 데이터의 분석에 사용할 수 있는 적합한 예측 방법을 찾기 위해서이다. 두 가지 데이터 마이닝 방법론인 주성분 회귀법과 부분최소자승 회귀법이 비교되어 질 것이다. 본 논문에서는 부분최소자승 회귀법은 주성분 회귀법과 비교했을 때 약간 나은 예측능력을 가진 결과를 보여준다. 주성분 회귀법에서 50개의 주성분이 모델을 생성하기 위해서 사용지만 부분최소자승 회귀법에서는 12개의 잠재요소가 사용되었다. 평균제곱오차가 예측능력을 측정하는 도구로 사용되었다. 본 논문의 근적외선 분광데이터 분석에 따르면 부분최소자승회귀법이 선형경향을 가진 데이터의 예측에 가장 적합한 모델로 판명되었다.

A study on the properties of sensitivity analysis in principal component regression and latent root regression (주성분회귀와 고유값회귀에 대한 감도분석의 성질에 대한 연구)

  • Shin, Jae-Kyoung;Chang, Duk-Joon
    • Journal of the Korean Data and Information Science Society
    • /
    • v.20 no.2
    • /
    • pp.321-328
    • /
    • 2009
  • In regression analysis, the ordinary least squares estimates of regression coefficients become poor, when the correlations among predictor variables are high. This phenomenon, which is called multicollinearity, causes serious problems in actual data analysis. To overcome this multicollinearity, many methods have been proposed. Ridge regression, shrinkage estimators and methods based on principal component analysis (PCA) such as principal component regression (PCR) and latent root regression (LRR). In the last decade, many statisticians discussed sensitivity analysis (SA) in ordinary multiple regression and same topic in PCR, LRR and logistic principal component regression (LPCR). In those methods PCA plays important role. Many statisticians discussed SA in PCA and related multivariate methods. We introduce the method of PCR and LRR. We also introduce the methods of SA in PCR and LRR, and discuss the properties of SA in PCR and LRR.

  • PDF

An Estimation of Regression Equation for Temporal Distribution of Design Rainfall Using Variable Selection Method (변수선택 방법을 이용한 설계강우량 시간분포 회귀식의 산정)

  • Lee, Sung Ho;Lee, Jae Joon;Park, Jin Hee;Rhee, Dong Sop
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • /
    • pp.169-169
    • /
    • 2018
  • 국내에서는 유량자료의 부족으로 수공구조물을 설계하기 위한 기초자료로서 설계강우량을 활용하고 있다. 따라서 설계강우량의 산정 및 시간분포가 중요한 요인으로 작용하고 있으며, 국내에서는 설계강우량 시간분포를 위한 방법으로 Huff의 4분위 방법을 사용하는 것이 일반적이다. 실무에서는 확률강우량도 개선 및 보완연구(Ministry of Land, Transport and Maritime Affairs, 2011)에서 제시한 관측소별 Huff의 무차원 누가우량 백분율을 이용하여 Huff의 4분위 방법 중 3분위의 자료를 이용하여 시간분포 회귀식을 산정하고 있으며, 회귀식의 차수는 전반적으로 결정계수가 높은 6차식을 사용하고 있다. 회귀식의 경우 고차식으로 갈수록 결정계수가 높아지는 것은 당연하지만 4차 이상의 회귀식에서는 결정계수의 차이가 미미하므로 6차식을 사용하는 것이 합리적이라고 할 수 없다. 따라서 본 연구에서는 통계적 유의수준에 기초하여 Huff 4분위 방법의 시간분포 회귀식에 대한 유의성 검정을 실시하여 회귀계수에 대한 통계적 검증을 실시하고 변수선택 방법인 전방선택법(Forward Selection)을 이용하여 유의하지 않은 회귀계수들을 제외하면서 가장 좋은 변수들로 구성된 간결한 설계강우량 시간분포 회귀식을 산정하고자 한다. 또한 산정된 회귀식과 기존 확률강우량도 개선 및 보완연구(Ministry of Land, Transport and Maritime Affairs, 2011)에서 제시한 회귀식과 비교하여 변수선택 방법인 전방 선택법(Forward Selection)을 이용하여 산정된 회귀식의 적합성을 검증하고자 한다.

  • PDF

Check for regression coefficient using jackknife and bootstrap methods in clinical data (잭나이프 및 붓스트랩 방법을 이용한 임상자료의 회귀계수 타당성 확인)

  • Sohn, Ki-Cheul;Shin, Im-Hee
    • Journal of the Korean Data and Information Science Society
    • /
    • v.23 no.4
    • /
    • pp.643-648
    • /
    • 2012
  • There are lots of analysis to determine the relation between dependent variable and explanatory variables. Often the regression analysis is used to do this, and we can analyze the how much the explanatory variable can be related with dependent variable and how much the regression model can explain the data. But the validation check of regression model is usually determined by coefficient of determination. We should check the validation of regression coefficient with different methods. This paper introduces the method for validation check the regression coefficient using the jackknife regression and bootstrap regression in clinical data.

A Study on Improving Estimation of Recurrence Rate of Public Water -Jungnangcheon Watershed- (생활용수 회귀수량 산정방법의 개선연구 -중랑천 유역을 대상으로-)

  • Jung, Chung Gil;Ahn, So Ra;Joh, Hyung Kyung;Kim, Seong Joon
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • /
    • pp.509-509
    • /
    • 2015
  • 물 수요관리측면에 대한 정책을 수립하기 위해서는 현재 또는 장래에 대한 용수수급의 정확한 이해를 필요로 한다. 이를 위해서는 용수 수요량 및 공급량뿐만 아니라 여러 산정요소를 필요로 하는데, 그 중 회귀수량은 물이 이용되고 다시 하천으로 회귀되어 이용될 가능성이 있는 수량으로 정의되며, 용수수급 및 용수절약 측면에서 회귀 수량은 중요한 요소라 할 수 있다. 회귀수량 조사는 유역조사 사업 이래, 10년간 생?공용수를 중심으로 미시적, 거시적으로 조사를 시행하였으나, 측정 자료의 신뢰도, 조사방법 및 지점선정 등의 문제로 인하여 조사 성과의 활용성이 매우 낮은 실정이다. 수자원장기종합계획등에서는 수자원관련 계획 수립시 생?공용수의 회귀율을 65 %로 적용하고 있으나, 이는 1970년대 말의 사회적 여건 및 경제적 상황이 반연된 결과로 현재 상황에 적용되기 곤란하다. 따라서, 현재 실정에 맞는 회귀율 산정은 반드시 필요하게 된다. 본 연구에서는 기존 생활용수 회귀수량 산정 연구 한계를 보완하고 유역조사 시행을 위한 개선된 회귀수량을 산정하고자 한다. 본 연구는 서울시 중랑물재생센터 처리구역을 기반으로 중랑천유역을 시험유역으로 선정하였다. 기존 회귀수량 산정방법을 개선하기 위해 시험유역 회귀수량 산정을 위한 가용 자료 분석 및 용수흐름 네트워크 공간분석을 추가로 진행하였다. 가용자료로 시험 유역내 상수공급자료(정수장 공급량, 상수계통도, 유수 및 누수율), 하수처리자료(하수처리구역도, 하수처리계통도, 유입량 및 방류량) 및 기상자료(기상청 지점 및 AWS 강우자료)를 구축하였고 각각의 상수계통도 및 하수처리계통도로부터 용수 흐름 네트워크망을 구축하였다. 상수공급자료로부터 상수계통도 공급지역을 구분하여 월별 유수율에 따른 월별 실 공급량을 산정하였다. 하수처리자료로부터 시험유역에서의 월별하수처리 유입량 및 방류량을 산정하였다. 최종적으로 회귀율(하수처리 방류량/실 공급량)을 산정한 결과 연평균 회귀율은 각각 93.97 %(2011년), 95.02%(2012년)로 과잉 추정 되었으며 7 ~ 9월의 회귀율은 110 ~ 120 %로 유입량을 초과하였다. 이는, 하수처리로 유입되는 유입량의 하수관거는 합류식으로 구축되어 7 ~ 9월에 많은 양의 강우량이 우수관을 통해 하수처리장으로 이송되어 생활용수 이외에 자연적인 공급량으로 인한 것으로 분석되었다. 따라서, 월별 회귀율 산정을 위해서는 불투수층에서의 면적강우량(mm)을 유입량(m3/s)으로 환산된 값을 고려하여 회귀율을 재산정하였다. 그 결과 연평균 회귀율은 각각 78.27 %(2011년), 77.58 %(2012년)로 나타났다.각각의 월별 회귀율도 매우 유사하게 나타났으며 과거 관용적으로 사용된 65 % 회귀율보다 약 12 ~ 13%로 증가하였으며 이는, 하수처리시설 구축 및 처리효율의 증가와 상수처리시설의 관로시설의 개량으로 인한 유수율 및 누수율 감소로 회귀율이 증가한 것으로 판단된다.

  • PDF

The Analysis of Return Flow Ratio By Measuring Discharge of The Sewer Network (하수관거 내 유량측정을 통한 생활용수의 회귀율 분석)

  • Choi, Gye-Woon;Kim, Young-Kyu;Ham, Myeong-Soo;Jo, Hyoung-Gen
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • /
    • pp.1169-1173
    • /
    • 2007
  • 본 연구의 시험유역은 기존에 제시되고 있는 회귀율 분석에서 각 지역별 및 업종별 다양한 회귀율을 나타내고 있어 어느 일정한 값을 결정하기 어렵고, 또한 최근 들면서 하수관거정비사업 등을 통하여 하수 차집비율이 과거에 비해 매우 높아짐에 따라 기존에 제시된 회귀율과 하수관거사업에 의해 변화되는 회귀율을 비교 분석하기위해 시험유역을 운영하였다. 물 사용량에 대한 회귀율의 정확성을 위하여 한강수계의 하남시를 대상으로 총 4개 지점에 대한 시험유역을 구성하여 생활용수의 회귀율 및 최근 환경부에서 중점적으로 추진하고 있는 하수관거 정비 사업에 따른 회귀율 변화에 대하여 계절별 회귀율을 제시하고 분석을 하였다.

  • PDF

Estimation of Irrigation Return Flow from Paddy Fields in Madun Reservoir (안성지역 마둔저수지의 농업용수 회귀수량 산정)

  • Kim, Ha-Young;Nam, Won-Ho;Mun, Young-Sik;An, Hyeon-Uk
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • /
    • pp.180-180
    • /
    • 2020
  • 최근 인구 증가, 도시화 및 산업의 발달로 인해 생활·공업용수의 수요가 증가하면서, 상대적으로 농업용수의 비율은 감소하고 있는 추세이다. 하지만 수자원이용 현황 중 농업용수는 전체 물 사용량의 48%로 여전히 가장 큰 비중을 차지하고 있다. 환경부 중심의 물관리 일원화 관련법 시행으로 국가 통합물관리 정책이 본격 추진됨에 따라 농업용수 가치의 재평가가 요구되고 있으며, 현재 수원공 확대의 경우 환경보호와 같은 이유로 농업용수 확보에 대한 많은 제약이 발생하고 있다. 공급된 농업용수 중 작물에 의해 소비되지 않고 하천으로 회귀되는 회귀수량은 하천 건천화 방지, 용수공급계획, 하천 유황예측 등 기여하는 바가 크다. 하지만 관개량과 회귀수량의 비로 나타내는 회귀율의 경우 지역에 따라 38.1%에서 70.5%로 큰 차이를 보이고 있으며, 지역별 회귀율 정량화에도 한계가 있다. 본 연구에서는 경기도 안성에 위치한 관개면적 429ha인 마둔 저수지를 대상으로 회귀율을 산정하고 농촌용수종합정보시스템 (Rural Agricultural Water Resource Information System, RAWRIS)에서 제공하는 저수지 수위 자료를 활용하여 마둔 저수지의 4월부터 9월 관개기 강수량, 저수율, 증발산량을 구축하였다. 물수지 분석 기반 회귀수량 산정모형으로부터 회귀율을 추정하였으며, 수로 네트워크 기반의 SWMM (Storm Water Management Model)과 비교를 통해 정량적인 회귀수량 및 회귀율을 산정하고자 한다. 본 연구의 결과를 통해 정량적인 회귀수량 및 회귀율 자료가 구축된다면, 농업용수의 재이용, 환경용수 및 하천유지용수, 용수공급계획 등 효율적인 농업 수자원관리에 기초자로로써 활용 가능할 것이라 판단된다.

  • PDF