• Title/Summary/Keyword: 회귀법

Search Result 1,737, Processing Time 0.029 seconds

回歸分析에 있어서의 多共線性과 名稱을 保全시키는 資料變換 技法

  • 兪浣
    • Journal of the Korean Statistical Society
    • /
    • v.8 no.2
    • /
    • pp.109-116
    • /
    • 1979
  • 두 개의 변수의 대체효과(substitution effect)를 연구하기 위하여 수요 또는 공급의 모형을 만들었을 경우 이에 관련된 변수들의 이름이 중요시 된다. 실제 관측 자료를 사용하였을 경우 흔히 일어나는 다공선성(multicollinearity) 문제를 다루기 위한 대안으로써 선형회귀선을 예로 들어 능형회귀기법(ridge regression technique)과 요인분석기법(factor analytic technique)을 소개하였으며 이에서 얻어지는 계수(coefficient)를 OLS 추정치로 설명하기 위하여 원래의 자료를 변환하였다. 실지 수요와 공급의 모형이 비선형일 경우 일반적으로 능형회귀나 요인분석을 쓰지 못한다는 점을 감안, 이러한 방법을 자료의 변환방법으로 설명함으로써 비선형모형에서도 다공선성문제를 위하여 능형회귀분석법이나 요인분석기법을 사용할 수 있도록 하였다.

  • PDF

On Some collinearities with Some Observations in Linear Regression (선형회귀모형에서 다공선성을 은폐 혹은 확대하는 관찰치에 관한 식별)

  • Kim, Seung Gu
    • Journal of Korean Society of Industrial and Systems Engineering
    • /
    • v.17 no.30
    • /
    • pp.59-65
    • /
    • 1994
  • 선형회귀모형에서 새로운 변수가 모형에 도입될때 몇몇 비정상적인 관찰치들은 변수들 간에 내재되어 있는 다공선성을 감추거나 혹은 오히려 더욱 크게 부풀림으로써 도입변수에 대한 해석을 매우 어렵게 만든다. 본고에서는 이러한 관찰치들을 식별할 수 있는 방법을 제안하였는데, 이와 같은 식별법은 postulated model의 회귀계수추정치에 대한 도입변수의 섭등(perturbations)을 분해함으로써 가능하였다.

  • PDF

The Calculation and Measurement of Flash Point for Water+1-Propanol and Water+2-Propanol Using Closed Cup Aparatus (밀폐식 장치를 사용한 Water+1-Propanol 과 Water+2-Propanol의 인화점 측정과 계산)

  • Ha, Dong-Myeong;Lee, Sungjin
    • Journal of Energy Engineering
    • /
    • v.25 no.4
    • /
    • pp.190-197
    • /
    • 2016
  • Flash point is the one of the important properties for the safe handling of inflammable liquid solution. In this paper, flash points of binary liquid solutions, water+1-propanol and water+2-propanol, were been measured by using Seta flash closed cup aparatus. Flash point was estimated using regression analysis method. Flash points were also estimated by the method based on Raoul's law and the method optimizing the binary parameters of van Laar equation. Experimental results were compared with the calculated results. The regression analysis method is able to estimate the flash point fairly well for water+1-propanol and water+2-propanol mixture.

Interesting Node Finding Criteria for Regression Trees (회귀의사결정나무에서의 관심노드 찾는 분류 기준법)

  • 이영섭
    • The Korean Journal of Applied Statistics
    • /
    • v.16 no.1
    • /
    • pp.45-53
    • /
    • 2003
  • One of decision tree method is regression trees which are used to predict a continuous response. The general splitting criteria in tree growing are based on a compromise in the impurity between the left and the right child node. By picking or the more interesting subsets and ignoring the other, the proposed new splitting criteria in this paper do not split based on a compromise of child nodes anymore. The tree structure by the new criteria might be unbalanced but plausible. It can find a interesting subset as early as possible and express it by a simple clause. As a result, it is very interpretable by sacrificing a little bit of accuracy.

Estimation of Irrigation Return Flow from Paddy Fields in Madun Reservoir (안성지역 마둔저수지의 농업용수 회귀수량 산정)

  • Kim, Ha-Young;Nam, Won-Ho;Mun, Young-Sik;An, Hyeon-Uk
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2020.06a
    • /
    • pp.180-180
    • /
    • 2020
  • 최근 인구 증가, 도시화 및 산업의 발달로 인해 생활·공업용수의 수요가 증가하면서, 상대적으로 농업용수의 비율은 감소하고 있는 추세이다. 하지만 수자원이용 현황 중 농업용수는 전체 물 사용량의 48%로 여전히 가장 큰 비중을 차지하고 있다. 환경부 중심의 물관리 일원화 관련법 시행으로 국가 통합물관리 정책이 본격 추진됨에 따라 농업용수 가치의 재평가가 요구되고 있으며, 현재 수원공 확대의 경우 환경보호와 같은 이유로 농업용수 확보에 대한 많은 제약이 발생하고 있다. 공급된 농업용수 중 작물에 의해 소비되지 않고 하천으로 회귀되는 회귀수량은 하천 건천화 방지, 용수공급계획, 하천 유황예측 등 기여하는 바가 크다. 하지만 관개량과 회귀수량의 비로 나타내는 회귀율의 경우 지역에 따라 38.1%에서 70.5%로 큰 차이를 보이고 있으며, 지역별 회귀율 정량화에도 한계가 있다. 본 연구에서는 경기도 안성에 위치한 관개면적 429ha인 마둔 저수지를 대상으로 회귀율을 산정하고 농촌용수종합정보시스템 (Rural Agricultural Water Resource Information System, RAWRIS)에서 제공하는 저수지 수위 자료를 활용하여 마둔 저수지의 4월부터 9월 관개기 강수량, 저수율, 증발산량을 구축하였다. 물수지 분석 기반 회귀수량 산정모형으로부터 회귀율을 추정하였으며, 수로 네트워크 기반의 SWMM (Storm Water Management Model)과 비교를 통해 정량적인 회귀수량 및 회귀율을 산정하고자 한다. 본 연구의 결과를 통해 정량적인 회귀수량 및 회귀율 자료가 구축된다면, 농업용수의 재이용, 환경용수 및 하천유지용수, 용수공급계획 등 효율적인 농업 수자원관리에 기초자로로써 활용 가능할 것이라 판단된다.

  • PDF

Parallelism Test of Slope in a Several Simple Linear Regression Model based on a Sequential Slope (여러개의 단순 선형 회귀모형에서 순차기울기를 이용한 평행성 검정)

  • Kim, Juhie;Kim, Dongjae
    • The Korean Journal of Applied Statistics
    • /
    • v.26 no.6
    • /
    • pp.1009-1018
    • /
    • 2013
  • Regression analysis is useful to understand the relationship of variables; however, we need to test if the slope of each regression lines is the same when comparing several populations. This paper suggests a new parallelism test for several linear regression lines. We use F-test of ANOVA and Kruskal-Wallis (1952) tests after obtaining slope estimator from a sequential slope. In addition, a Monte Carlo simulation study is adapted to compare the power of the proposed methods with those of Park and Kim (2009).

Speech Recognitioin Using Multilayered Recurrent Neural Networks (다층회귀신경망을 이용한 음성인식)

  • 어태경
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.267-271
    • /
    • 1998
  • 신경망에 의한 음절과 연속음성 인식시 동특성처리의 한방법으로 회귀신경망을 이용한다. 본 연구는 비회귀형 상위은닉층과 회귀형 하위은닉층을 가진 4층 구조의 다층회귀신경망으로 예측기를 반들어 나성화자 5명이 CV형 음절 14개, CVC형 음절 14개를 각각 5회씩 발음한 총 700개의 음성중 3회분인 420개 음성으로 학습한 후 나머지 2회분인 280개 음성으로 인식을 평가한다. 입력신호의 예측차수와 상, 하위 은닉층으 뉴런수를 변경시키면서 각각의 인식률을 조사해 본 결과 상위 은닉층의 뉴런이 10개이고 하위 은닉층의 뉴런이 10개와 15개 그리고 예측차수가 3,4차일 때 가장 양호한 인식기로 동작한다는 것을 알 수 있었다. 이 때 나타난 인식률은 Elman 망보다 다소 우세하다.

  • PDF

Maximum likelihood estimation of Logistic random effects model (로지스틱 임의선형 혼합모형의 최대우도 추정법)

  • Kim, Minah;Kyung, Minjung
    • The Korean Journal of Applied Statistics
    • /
    • v.30 no.6
    • /
    • pp.957-981
    • /
    • 2017
  • A generalized linear mixed model is an extension of a generalized linear model that allows random effect as well as provides flexibility in developing a suitable model when observations are correlated or when there are other underlying phenomena that contribute to resulting variability. We describe maximum likelihood estimation methods for logistic regression models that include random effects - the Laplace approximation, Gauss-Hermite quadrature, adaptive Gauss-Hermite quadrature, and pseudo-likelihood. Applications are provided with social science problems by analyzing the effect of mental health and life satisfaction on volunteer activities from Korean welfare panel data; in addition, we observe that the inclusion of random effects in the model leads to improved analyses with more reasonable inferences.

Suggestion of Regression Equations for Estimating RMR Factor Rating by Geological Condition (지질 조건을 고려한 RMR 인자값 추정을 위한 선형회귀식 제안)

  • Kim, Kwang-Yeom;Yim, Sung-Bin;Kim, Sung-Kwon;Kim, Chang-Yong;Seo, Yong-Seok
    • The Journal of Engineering Geology
    • /
    • v.17 no.4
    • /
    • pp.555-566
    • /
    • 2007
  • In general, RMR classification system is used for the support design of a tunnel. Face mapping during excavation and RMR-based rock classifications are conducted in order to provide information for complementary changes to preliminary survey plans and for continuous geological estimations in direction of tunnel route. Although they are ever so important, there are not enough time for survey in general and sometimes even face mapping is not available. Linear regression analysis for the estimation of mediating RQD and condition of discontinuities, which require longer time and more detailed observation in RMR, was performed and optimum regression equations are suggest as the result. The geological data collected from tunnels were analyzed in accordance with three rock types as sedimentary rock, phyllite and granite to see geological effects, generally not been considered in previous researches. Parameters for the regression analysis were set another RMR factor.

Identification of Uncertainty in Fitting Rating Curve with Bayesian Regression (베이지안 회귀분석을 이용한 수위-유량 관계곡선의 불확실성 분석)

  • Kim, Sang-Ug;Lee, Kil-Seong
    • Journal of Korea Water Resources Association
    • /
    • v.41 no.9
    • /
    • pp.943-958
    • /
    • 2008
  • This study employs Bayesian regression analysis for fitting discharge rating curves. The parameter estimates using the Bayesian regression analysis were compared to ordinary least square method using the t-distribution. In these comparisons, the mean values from the t-distribution and the Bayesian regression are not significantly different. However, the difference between upper and lower limits are remarkably reduced with the Bayesian regression. Therefore, from the point of view of uncertainty analysis, the Bayesian regression is more attractive than the conventional method based on a t-distribution because the data size at the site of interest is typically insufficient to estimate the parameters in rating curve. The merits and demerits of the two types of estimation methods are analyzed through the statistical simulation considering heteroscedasticity. The validation of the Bayesian regression is also performed using real stage-discharge data which were observed at 5 gauges on the Anyangcheon basin. Because the true parameters at 5 gauges are unknown, the quantitative accuracy of the Bayesian regression can not be assessed. However, it can be suggested that the uncertainty in rating curves at 5 gauges be reduced by Bayesian regression.