• Title/Summary/Keyword: 혼합회귀모형

Search Result 81, Processing Time 0.026 seconds

일반화혼합회귀 추정량과 베이지안 회귀추정량의 비교

  • 김주성;김영권
    • Communications for Statistical Applications and Methods
    • /
    • v.3 no.3
    • /
    • pp.1-9
    • /
    • 1996
  • 본 논문에서는 일반화 회귀모형의 회귀모수${\beta}$에 대한 사전정보의 형태에 따른 각 추정량들에 대하여 연구하였다. 먼저 사전정보가 ${\beta}$에 대한 사전분포로 주어지는 경우에 해당하는 베이지안 회귀추정량을 제시하였고, 다른 하나는 ${\beta}$에 대한 사전정보모형으로 선형회귀모형식이 주어진 경우의 일반화 혼합회귀추정량에 대하여 연구하였다. 두가지 경우로부터 얻어진 각 추정량의 정도를 알아보기 위하여 각 추정량의 공분산행렬을 이 용하여 서로 비교하여 보았다. 각 추정량의 분산비들을 이용하여 일반적으로 일반화 혼합회귀추정량이 베이지안 회귀추정량들보다 비교적 작은 분산값을 가진다는 결론을 얻었다.

  • PDF

Joint penalization of components and predictors in mixture of regressions (혼합회귀모형에서 콤포넌트 및 설명변수에 대한 벌점함수의 적용)

  • Park, Chongsun;Mo, Eun Bi
    • The Korean Journal of Applied Statistics
    • /
    • v.32 no.2
    • /
    • pp.199-211
    • /
    • 2019
  • This paper is concerned with issues in the finite mixture of regression modeling as well as the simultaneous selection of the number of mixing components and relevant predictors. We propose a penalized likelihood method for both mixture components and regression coefficients that enable the simultaneous identification of significant variables and the determination of important mixture components in mixture of regression models. To avoid over-fitting and bias problems, we applied smoothly clipped absolute deviation (SCAD) penalties on the logarithm of component probabilities suggested by Huang et al. (Statistical Sinica, 27, 147-169, 2013) as well as several well-known penalty functions for coefficients in regression models. Simulation studies reveal that our method is satisfactory with well-known penalties such as SCAD, MCP, and adaptive lasso.

The EM algorithm for mixture regression with missing covariates (결측 공변량을 갖는 혼합회귀모형에서의 EM 알고리즘)

  • Kim, Hyungmin;Ham, Geonhee;Seo, Byungtae
    • The Korean Journal of Applied Statistics
    • /
    • v.29 no.7
    • /
    • pp.1347-1359
    • /
    • 2016
  • Finite mixtures of regression models provide an effective tool to explore a hidden functional relationship between a response variable and covariates. However, it is common in practice that data are not fully observed due to several reasons. In this paper, we derived an expectation-maximization (EM) algorithm to obtain the maximum likelihood estimator when some covariates are missing at random in the finite mixture of regression models. We conduct some simulation studies and we also provide some real data examples to show the validity of the derived EM algorithm.

혼합모형의 구간추정을 위한 PROC MIXED의 활용

  • Park, Dong-Jun
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2005.05a
    • /
    • pp.1-6
    • /
    • 2005
  • SAS의 PROC MIXED는 ANOVA 추정량보다 더 다양한 잔차최대우도추정법 또는 최대우도추정법으로 모수들을 추론할 수 있다. 혼합모형에 속하는 불균형중첩오차구조를 갖는 선형회귀모형에서 랜덤효과에 해당되는 그룹간의 분산과 고정효과에 해당되는 회귀계수들에 대한 신뢰구간을 구하기 위하여 대표본인 경우와 소표본인 경우에 대하여 PROC MIXED를 사용한다. 시뮬레이션을 실행한 결과, 대표본인 경우에는 모수들의 신뢰구간을 구하기 위하여 PROC MIXED를 활용할 수 있지만, 소표본인 경우에는 PROC MIXED를 사용할 경우, 그룹간 분산과 회귀계수 가운데 하나인 절편항에 대한 신뢰구간은 시뮬레이터된 신뢰계수가 명시한 신뢰계수를 지키지 못하는 것을 보인다.

  • PDF

Development of a regressive prediction method of solute transport in rivers based on relation between breakthrough curve and travel distance (하천에서 농도곡선-유하거리 상관성 기반 회귀적 물질혼합 예측 기법)

  • Kim, Byunguk;Seo, Il Won
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.45-45
    • /
    • 2022
  • 산업화에 따른 화학물질 사용량의 증가는 담수로의 유해화학물질 유출사고의 위험을 증가시키며, 이러한 사고는 하천수 수질과 수환경 생태계에 심각한 위해와 손상을 야기한다. 이러한 수질사고 발생시 신속 대응을 위해, 하천에 유입된 물질의 거동을 신속하게 예측하는 것이 필요하며 이 경우 1차원 추적모형이 주로 사용된다. 1차원 물질혼합 모형은 하천을 하나의 유선으로 보며, 복잡한 하천흐름의 시스템을 현상학적으로 해석하고, 오염물질의 이송 및 혼합 메카니즘을 모델 매개변수에 반영하여 모형화한다. 이러한 매개변수들은 직접적으로 측정하기 어려우며, 이론에 기반한 매개변수 산정 기법이 구축되지 않은 실정이다. 따라서 대부분의 연구에서는 추적자 실험을 실시하여 유한한 하천구간에서 추적자의 시간-농도곡선(Breakthrough curve, BTC)을 취득하고, 이를 통하여 대상 구간의 매개변수를 역산하는 최적화 기법에 의존하고 있다. 하지만, 모든 하천구간에 대하여 추적자 실험을 수행하여 데이터를 확보하는 것이 어렵기 때문에 최적화 기법의 적용성에 한계가 있다. 본 연구는 흐름정보가 제공되지 않은 미계측 하천구간에서 BTC를 신속하게 예측할 수 있는 회귀모형을 구축하는 것을 목표로 한다. 국내 하천에서 수행한 4회의 추적자 실험으로부터 취득한 28개 구간 케이스의 데이터에 대하여 농도곡선 전처리를 수행하고 14개의 통계적 특징을 추출하였으며, 계측된 흐름특성과의 상관관계를 분석하였다. 분석 결과, 대상 구간에서의 BTC의 변화가 추적자의 유하거리에 매우 높은 상관관계를 보였으며, 이를 이용하여 회귀모형을 제시하였다. 제안된 회귀모형을 적용하여 하류의 지점에서의 BTC를 예측하였으며, 1차원 이송-분산 방정식과 하천저장대모형을 활용한 예측결과와 비교하여 검증하였다. 그 결과, BTC의 변화특성을 활용한 회귀적 예측이 하천 지형 및 흐름의 변동성이 작은 구간에서 1차원 혼합모형들을 이용한 예측보다 더 높은 정확도를 보였으며, 이러한 장점은 장거리 예측에서 더 분명하게 나타났다.

  • PDF

Density Estimation of Mixture Normal Distribution with Binned Data Using Nonlinear Regression

  • Na, Yeong-Ho;Oh, Chang-Hyeok
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 2004.04a
    • /
    • pp.127-130
    • /
    • 2004
  • 혼합정규분포에서 얻어진 히스토그램 자료에서 모수의 추정은 EM 알고리즘 혹은 스프라인 방법이 흔히 이용되고 있다. 본 논문에서는 히스토그램 자료를 비선형회귀모형으로 적합하는 방법을 제시하고, 시뮬레이션으로 제시된 방법과 EM 알고리즘 방법을 비교하였다.

  • PDF

A nonparametric Bayesian seemingly unrelated regression model (비모수 베이지안 겉보기 무관 회귀모형)

  • Jo, Seongil;Seok, Inhae;Choi, Taeryon
    • The Korean Journal of Applied Statistics
    • /
    • v.29 no.4
    • /
    • pp.627-641
    • /
    • 2016
  • In this paper, we consider a seemingly unrelated regression (SUR) model and propose a nonparametric Bayesian approach to SUR with a Dirichlet process mixture of normals for modeling an unknown error distribution. Posterior distributions are derived based on the proposed model, and the posterior inference is performed via Markov chain Monte Carlo methods based on the collapsed Gibbs sampler of a Dirichlet process mixture model. We present a simulation study to assess the performance of the model. We also apply the model to precipitation data over South Korea.

Robust ridge regression for nonlinear mixed effects models with applications to quantitative high throughput screening assay data (비선형 혼합효과모형에서의 로버스트 능형회귀 방법과 정량적 고속 대량 스크리닝 자료에의 응용)

  • Yoo, Jiseon;Lim, Changwon
    • The Korean Journal of Applied Statistics
    • /
    • v.31 no.1
    • /
    • pp.123-137
    • /
    • 2018
  • A nonlinear mixed effects model is mainly used to analyze repeated measurement data in various fields. A nonlinear mixed effects model consists of two stages: the first-stage individual-level model considers intra-individual variation and the second-stage population model considers inter-individual variation. The individual-level model, which is the first stage of the nonlinear mixed effects model, estimates the parameters of the nonlinear regression model. It is the same as the general nonlinear regression model, and usually estimates parameters using the least squares estimation method. However, the least squares estimation method may have a problem that the estimated value of the parameters and standard errors become extremely large if the assumed nonlinear function is not explicitly revealed by the data. In this paper, a new estimation method is proposed to solve this problem by introducing the ridge regression method recently proposed in the nonlinear regression model into the first-stage individual-level model of the nonlinear mixed effects model. The performance of the proposed estimator is compared with the performance with the standard estimator through a simulation study. The proposed methodology is also illustrated using quantitative high throughput screening data obtained from the US National Toxicology Program.

The Reanalysis of the Donation Data Using the Zero-Inflated Possion Regression (0이 팽창된 포아송 회귀모형을 이용한 기부회수 자료의 재분석)

  • Kim, In-Young;Park, Tae-Kyu;Kim, Byung-Soo
    • The Korean Journal of Applied Statistics
    • /
    • v.22 no.4
    • /
    • pp.819-827
    • /
    • 2009
  • Kim et al. (2006) analyzed the donation data surveyed by Voluneteer 21 in year 2002 at South Korea using a Poisson regression based on the mixture of two Poissons and detected significant variables for affecting the number of donations. However, noting the large deviation between the predicted and the actual frequencies of zero, we developed in this note a Poisson regression model based on a distribution in which zero inflated Poisson was added to the mixture of two Poissons. Thus the population distribution is now a mixture of three Poissons in which one component is concentrated on zero mass. We used the EM algorithm for estimating the regression parameters and detected the same variables with Kim et al's for significantly affecting the response. However, we could estimate the proportion of the fixed zero group to be 0.201, which was the characteristic of this model. We also noted that among two significant variables, the income and the volunteer experience(yes, no), the second variable could be utilized as a strategric variable for promoting the donation.

Interval Estimation in Mixed Model by Use of PROC MIXED (PROC MIXED를 활용한 혼합모형의 신뢰구간추정)

  • Park Dong-Joon
    • The Korean Journal of Applied Statistics
    • /
    • v.19 no.2
    • /
    • pp.349-360
    • /
    • 2006
  • PROC MIXED in SAS can be utilized to make inferences on parameters in a mixed model by use of Restricted Maximum Likelihood Estimation Method or Maximum Likelihood Estimation Method which has more merits than ANOVA method. A regression model with unbalanced nested error structure that belongs to a mixed model is used to construct confidence intervals on variances among groups, within groups, and regression coefficients in the model. PROC MIXED is applied to three different sample sizes for simulation. As a result of the simulation study, PROC MIXED generates confidence intervals on parameters that maintain the stated confidence coefficient in a large sample size. However, it does not generate confidence intervals that maintain the stated confidence coefficient for variance components among groups and intercept in a small sample size.