• 제목/요약/키워드: mixture regression

검색결과 208건 처리시간 0.021초

A Graphical Method for Evaluating the Mixture Component Effects of Ridge Regression Estimator in Mixture Experiments

  • Jang, Dae-Heung
    • Communications for Statistical Applications and Methods
    • /
    • 제6권1호
    • /
    • pp.1-10
    • /
    • 1999
  • When the component proportions in mixture experiments are restricted by lower and upper bounds multicollinearity appears all too frequently. The ridge regression can be used to stabilize the coefficient estimates in the fitted model. I propose a graphical method for evaluating the mixture component effects of ridge regression estimator with respect to the prediction variance and the prediction bias.

  • PDF

혼합회귀모델을 이용한 의사의 선호보상체계 분석 (Segmentation of the Compensation Packages for Doctors by Mixture Regression Model)

  • 백수경;곽영식
    • 한국병원경영학회지
    • /
    • 제10권4호
    • /
    • pp.75-97
    • /
    • 2005
  • The research objective is to empirically investigate the compensation packages maximizing the utilities of internal customers by applying the market segmentation theory. Data was collected from four Korean hospitals in Seoul, Busan and Gyunggi-do. The research is designed to seek the compensation package maximizing the utility of doctors by mixture regression model, which has been applied as latent structure and other type of finite mixture models from various academic fields since early 1980s. The mixture regression model shows the optimal segments number and fuzzy classification for each observation by EM(expectation-maximization algorism). The finite mixture regression model is to unmix the sample, to identify the groups, and to estimate the parameters of the density function underlying the observed data within each group. The doctors were segmented into 5 groups by their preference for the compensation package. The results of this study imply that the utility of doctors increases with differentiated compensation package segmented by their preference.

  • PDF

Optimal Restrictions on Regression Parameters For Linear Mixture Model

  • Ahn, Jung-Yeon;Park, Sung-Hyun
    • Journal of the Korean Statistical Society
    • /
    • 제28권3호
    • /
    • pp.325-336
    • /
    • 1999
  • Collinearity among independent variables can have severe effects on the precision of response estimation for some region of interest in the experiments with mixture. A method of finding optimal linear restriction on regression parameter in linear model for mixture experiments in the sense of minimizing integrated mean squared error is studied. We use the formulation of optimal restrictions on regression parameters for estimating responses proposed by Park(1981) by transforming mixture components to mathematically independent variables.

  • PDF

청바지제품 세분시장 내 가격-품질 평가집단 추출에 관한 연구: 결합분석과 mixture model를 이용하여 (Market Segmentation With Price-Dependent Quality Evaluation in Denim Jeans Market ; Based on Conjoin analysis and mixture model)

  • 곽영식;이진화
    • 한국의류학회지
    • /
    • 제26권11호
    • /
    • pp.1605-1614
    • /
    • 2002
  • The purpose of this study was to identify the consumers who use the level of price as the indicator of the product quality. In order to implement the purpose of this study, Jeans market had been segmented by the mixture regression model, and price response function was calibrated for each segment. Based on the types of price response function, segments were allocated into one of two groups; the group using the level of price as the quality indicator or the group not using the level of price as that. Then, characteristics of both groups were compared in terms of product attributes and demographic variables. Data were co]looted from the sample of the 23o undergraduate and graduate students in Seoul. For the data analysis, mixture regression model, conjoint analysis, and t-test were used. As a result, jeans market was divided into 5 segments. Segment 1,2,3 were allocated into the group not using the level of price as the quality indicator while segment 4,5 were done into the other group. Significant differences existed between two groups in product attributes, not in demographic variables. Mixture model and conjoint analysis were proved to be an effective set of tools in market segmentation.

Model-based inverse regression for mixture data

  • Choi, Changhwan;Park, Chongsun
    • Communications for Statistical Applications and Methods
    • /
    • 제24권1호
    • /
    • pp.97-113
    • /
    • 2017
  • This paper proposes a method for sufficient dimension reduction (SDR) of mixture data. We consider mixture data containing more than one component that have distinct central subspaces. We adopt an approach of a model-based sliced inverse regression (MSIR) to the mixture data in a simple and intuitive manner. We employed mixture probabilistic principal component analysis (MPPCA) to estimate each central subspaces and cluster the data points. The results from simulation studies and a real data set show that our method is satisfactory to catch appropriate central spaces and is also robust regardless of the number of slices chosen. Discussions about root selection, estimation accuracy, and classification with initial value issues of MPPCA and its related simulation results are also provided.

OPTIMAL RESTRICTIONS ON REGRESSION PARAMETERS FOR LINEAR MIXTURE MODEL

  • Park, Sung-Hyun;Ahn, Jung-Yeon
    • 한국품질경영학회:학술대회논문집
    • /
    • 한국품질경영학회 1998년도 The 12th Asia Quality Management Symposium* Total Quality Management for Restoring Competitiveness
    • /
    • pp.239-250
    • /
    • 1998
  • A method of finding optimal linear restriction on regression parameters in linear model for mixture experiments in the sense of minimizing integrated mean squared error is studied. We use the formulation of optimal restrictions on regression parameters for estimating responses proposed by Park(1981) by transforming mixture components to mathematically independent variables.

  • PDF

혼합회귀모형에서 콤포넌트 및 설명변수에 대한 벌점함수의 적용 (Joint penalization of components and predictors in mixture of regressions)

  • 박종선;모은비
    • 응용통계연구
    • /
    • 제32권2호
    • /
    • pp.199-211
    • /
    • 2019
  • 주어진 회귀자료에 유한혼합회귀모형을 적합하는 경우 적절한 성분의 수를 선택하고 선택된 각각의 회귀모형에서 의미있는 예측변수들의 집합을 선택하며 동시에 편의와 변동이 작은 회귀계수 추정치들을 얻는 것은 매우 중요하다. 본 연구에서는 혼합선형회귀모형에서 성분의 개수와 회귀계수에 벌점함수를 적용하여 적절한 성분의 수와 각 성분의 회귀모형에 필요한 설명변수들을 동시에 선택하는 방법을 제시하였다. 성분에 대한 벌점은 성분들의 로그값에 SCAD 벌점함수를 적용하였고 회귀계수들에는 SCAD와 더불어 MCP 및 Adplasso 벌점함수들을 사용하여 가상자료와 실제자료들에 대한 결과를 비교하였다. SCAD-SCAD 벌점함수 조합과 SCAD-MCP 조합의 경우 기존의 Luo 등 (2008)의 방법에서 문제가 되었던 과적합 문제를 해결함과 동시에 선택된 성분의 수와 회귀계수들을 효과적으로 선택하였으며 회귀계수들의 추정치에 대한 편의도 크지 않았다. 본 연구는 성분의 수가 알려져 있지 않은 회귀자료에서 적절한 성분의 수와 더불어 각 성분에 대한 회귀모형에서 모형에 필요한 예측변수들을 동시에 선택하는 방법을 제시하였다는데 의미가 있다고 하겠다.

결측 공변량을 갖는 혼합회귀모형에서의 EM 알고리즘 (The EM algorithm for mixture regression with missing covariates)

  • 김형민;함건희;서병태
    • 응용통계연구
    • /
    • 제29권7호
    • /
    • pp.1347-1359
    • /
    • 2016
  • 혼합회귀모형은 반응 변수와 공변량 사이의 관계를 규명하는 유용한 통계적 모형으로 여러 분야에서 사용되어지고 있다. 하지만 실제로 혼합회귀모형을 이용하여 분석을 하는 과정에서 공변량이 결측값을 포함하는 문제는 흔하게 발생하며, 발생하는 결측의 유형 또한 다양하게 나타난다. 이러한 경우에 있어서 본 논문에서는 최대우도추정량을 구하기 위한 EM 알고리즘을 제안하고자 한다. 제안된 EM 알고리즘의 효용성을 모의실험을 통해 확인하였으며 또한 사례연구를 통해 제시된 방법이 어떻게 사용될수 있는지와 그 효용성을 함께 확인하였다.

포아송 분포의 혼합모형을 이용한 기부 횟수 자료 분석 (The Analysis of the Number of Donations Based on a Mixture of Poisson Regression Model)

  • 김인영;박수범;김병수;박태규
    • 응용통계연구
    • /
    • 제19권1호
    • /
    • pp.1-12
    • /
    • 2006
  • 본 논문에서는 2002년에 (사)볼런티어21에서 실시한 설문조사 자료를 이용하여 2001년에 우리나라 개인들이 기부한 횟수에 영향을 주는 유의한 변수들을 식별하였다. 기부횟수의 경험적 분포로 미루어 모집단은 기부를 적게 하는 집단과 많이 하는 집단으로 구성되며 따라서 모집단 분포를 두개 포아송 분포의 혼합분포로 모형화하였다. 이 모형에 기초하여 기부횟수에 영향을 미치는 변수들을 식별하였다. EM알고리즘을 이용하여 모수를 추정하고 2.5%와 97.5%에 기초한 백분위수 신뢰구간을 보완한 BCa(bias-corrected and accelerated) 신뢰구간을 계산하여 유의한 변수들을 찾았다. 연구결과 혼합 포아송 회귀모형에서는 기부횟수가 적은 집단("작은 군")과 기부횟수가 많은 집단("큰 군") 모두에서 소득과 자원봉사의 경험 유무(1:예, 0:아니오)가 기부횟수에 유의적으로 영향을 주는 변수로 밝혀졌다. 또한 두 변수 각각에서 회귀계수가 양수로 나타나 소득이 많을수록, 혹은 자원봉사의 경험이 있는 사람일수록 기부횟수가 증가하는 것을 알 수 있다. 그러나 소득과 자원봉사 변수의 회귀계수는 "작은 군"이 "큰 군"에 비해 더욱 크게 나타나고 있다. "작은 군"보다 "큰 군"의 사람들에게 기부가 생활화되어 있고, 따라서 소득과 자원봉사의 경험 유무가 기부횟수에 미치는 영향이 상대적으로 적은 것으로 파악된다.

A Bayesian Method for Narrowing the Scope fo Variable Selection in Binary Response t-Link Regression

  • Kim, Hea-Jung
    • Journal of the Korean Statistical Society
    • /
    • 제29권4호
    • /
    • pp.407-422
    • /
    • 2000
  • This article is concerned with the selecting predictor variables to be included in building a class of binary response t-link regression models where both probit and logistic regression models can e approximately taken as members of the class. It is based on a modification of the stochastic search variable selection method(SSVS), intended to propose and develop a Bayesian procedure that used probabilistic considerations for selecting promising subsets of predictor variables. The procedure reformulates the binary response t-link regression setup in a hierarchical truncated normal mixture model by introducing a set of hyperparameters that will be used to identify subset choices. In this setup, the most promising subset of predictors can be identified as that with highest posterior probability in the marginal posterior distribution of the hyperparameters. To highlight the merit of the procedure, an illustrative numerical example is given.

  • PDF