• 제목/요약/키워드: Bayesian mixed model

검색결과 47건 처리시간 0.025초

군집 특정 변량효과를 포함한 유한 혼합 모형의 베이지안 분석 (Bayesian analysis of finite mixture model with cluster-specific random effects)

  • 이혜진;경민정
    • 응용통계연구
    • /
    • 제30권1호
    • /
    • pp.57-68
    • /
    • 2017
  • 대량의 데이터에 있어 전반적인 특성 및 구조를 파악하는데 유용하기 때문에 다양한 분야에서 군집분석을 사용하고 있다. Dempster 등 (1977)에서 정의된 expectation-maximization(EM) 알고리즘은 가장 보편적으로 사용되는 군집분석 방법이다. 선형모형의 유한혼합물(finite mixture of linear model) 기법 또한 군집분석 방법 중 많이 사용되는 방법이며 베이지안 군집방법은 Bernardo와 Giron (1988)이 군집에 대한 가중치 확률만 모를 경우 처음 적용하였다. 우리는 이 연구에서 일반적인 선형모형의 유한혼합물이 아닌 군집특정(cluster-specific) 변량효과를 모형에 포함하여 베이지안 분석방법인 깁스표집법(Gibbs sampling)을 사용한다. 제안한 모형의 특성 및 표집법에 대하여 설명하였고 모의실험 및 실제 데이터 분석을 통하여 모형의 유용성을 파악하였다. Hurn 등 (2003)의 CO2 데이터에 모형을 적용하여 변량효과가 없는 모형, 개체특정(subject-specific) 변량효과 모형과 비교하였다.

특정 종돈집단의 임신기간, 이유후초종부일, 총산자수 및 사산에 대한 유전모수 추정 (Estimation of Genetic Parameters for Gestation Length, Wean to First Service, Litter Size and Stillborn Piglets in a Closed Nucleus Swine Breeding Herd)

  • 이득환;손지현
    • Journal of Animal Science and Technology
    • /
    • 제55권5호
    • /
    • pp.389-398
    • /
    • 2013
  • 본 연구는 폐쇄종돈군을 유지하면서 장기간 선발육종을 실시한 Landrace 및 Yorkshire 모계 종돈집단에서 임신기간, 총산자수, 이유후초종부일 및 사산두수에 대한 유전적 변이성을 제시함으로써 이들 형질들에 대한 선발지표에 참고자료를 제시하고자 실시하였다. 분석에 이용된 자료는 상기의 형질들에 대하여 사전 이상치를 제외한 후, Landrace 품종에서 1,910두의 모돈으로부터 수집된 7,616복의 기록 및 Yorkshire 품종 2283두의 모돈으로부터 수집된 총 10,454복의 기록을 이용하였다. 분석형질들에 대한 유전변이를 추정하기 위하여 상기의 4개 형질을 동시에 고려한 혼합모형을 설정하였으며, 특히 사산두수에 대하여는 정규성에 크게 위배되기 때문에 범주형 자료로 가정하여 다형질 선형-임계형 반복동물개체모형을 설정하여 분석하였다. 분석방법으로서는 Bayesian 추론의 일종인 Gibbs Sampling (GS) 방법에 의하여 모수의 사후분포 함수로부터 모수에 대한 GS을 50,000회 실시하고 burn-in을 제외한 후 모수의 사후분포에 대한 통계량을 제시하였다. 유전변이를 추정한 결과, 임신기간에 대한 유전력은 0.21~0.35로 추정되었고, 이유후초종부일에서는 0.16~0.23, 총산자수는 0.14~0.16 및 사산두수에 있어서는 0.09~0.10으로 추정되었다. 임신기간에 대한 유전상관 추정치는 총산자수 및 사산두수에서 부의 상관을 갖는 것으로 추정되었고 총산자수와 사산두수와는 정의 상관을 갖는 것으로 추정되었다. 총산자수와 이유후초발정일 간의 유전상관은 낮은 부의 상관을 갖는 것으로 추정되었으며 임신기간과 이유후 초종부일 간에는 유전적 상관관계가 매우 미약한 것으로 분석되었다. 따라서 총산자수를 개량하고자 할 때, 사산두수를 고려하여 선발지표를 설정함이 타당할 것으로 판단되었다.

Movie Choice under Joint Decision: Reassessment of Online WOM Effect

  • Kim, Youngju;Kim, Jaehwan
    • Asia Marketing Journal
    • /
    • 제15권1호
    • /
    • pp.155-168
    • /
    • 2013
  • This study describes consumers' movie choices in conjunction with other group members and attempts to reassess the effect of the online word of mouth (WOM) source in a joint decision context. The tendency of many people to go to movies in groups has been mentioned in previous literature but there is no modeling research that studies movie choice from the group decision perspective. We found that ignoring the group movie-going perspective can result in a misunderstanding, especially underestimation of genre preference and the impact of the WOM variables. Most of the studies to measure online WOM effects were done at the aggregate level, and the role of online WOM variables(volume vs valence) is mixed in the literature. We postulate that group-level analysis might offer insight to resolve these mixed understanding of WOM effects in the literature. We implemented the study via a random effect model with group-level heterogeneity. Romance, drama, and action were selected as genre variables; valence and volume were selected as online WOM variables. A choice-based conjoint survey was used for data collection and the models was estimated via Bayesian MCMC method. The empirical results show that (i) both genre and online WOM are important variables when consumers choose movies, especially as group, and (ii) the WOM valence effect are amplified more than the volume effect does as individuals are engaged in group decision. This research contributes to the literature in several ways. First, we investigate movie choice from a group movie-going perspective that is more realistic and consistent with the market behavior. Secondly, the study sheds new light on the WOM effect. At group-level, both valence and volume significantly affect movie choices, which adds to the understanding of the role of online WOM in consumers' movie choice.

  • PDF

베이지안 확률 기반 범죄위험지역 예측 모델 개발 (Crime Incident Prediction Model based on Bayesian Probability)

  • 허선영;김주영;문태헌
    • 한국지리정보학회지
    • /
    • 제20권4호
    • /
    • pp.89-101
    • /
    • 2017
  • 범죄는 장소나 건축물 용도에 따라 발생빈도와 유형이 다르고, 그 장소를 이용하는 사람들의 특성 및 공간 구조 차이에 의해 다양하게 발생한다. 따라서 공간 및 지역특성을 포함한 공간 빅데이터를 활용하여 지역을 분석해 보면 범죄예방 전략을 마련할 수 있다. 아울러 빅데이터와 지능 정보화시대의 도래에 따라 예측적 경찰활동이 새로운 경찰활동의 패러다임으로 등장하고 있다. 이에 보편적인 지방도시 J시를 대상으로 3개년 동안의 7,420건의 실제 범죄사례를 바탕으로 도시공간의 물리 환경적인 특성을 분석하여 범죄발생공간을 규명하고, 위험지역을 예측해 보고자 하였다. 분석에는 다양한 빅데이터 중 범죄를 유발하는 도시 공간 내 물리 환경적 요소에 한하여 공간 빅데이터를 구축하여 공간회귀분석을 실시하였다. 다음으로 분석결과 도출된 가로폭, 평균 층수, 용적율, 1층 사용용도(제2종 근린생활시설, 상업시설, 유흥시설, 주거시설)을 변수로 베이지안확률 기반 범죄발생 위험성 예측 모형(CIPM: Crime Incident Prediction Model)을 개발하였다. 개발된 모델은 실제 범죄발생 지역과의 중첩분석 및 모델의 정확도를 판단하는 Roc curve 분석을 통해 AUC 값이 0.8로 모델이 적합한 것으로 나타났다. 개발된 모델을 토대로 사례지역의 범죄 위험도를 분석한 결과 범죄발생은 상업 및 유흥시설이 밀집된 지역과 건물층수가 높은 지역, 그리고 상업 및 유흥시설과 주거가 혼재해 있는 블록이 범죄발생 확률이 높은 것으로 나타났다. 본 연구는 단순히 범죄의 공간적 분포와 범죄발생 영향요인을 탐색하는 기존의 연구와 달리 범죄발생 예측모델을 확률론적 관점에서 개발하는 영역으로 한 단계 진전되었다는 점에 의의가 있다.

Genomic partitioning of growth traits using a high-density single nucleotide polymorphism array in Hanwoo (Korean cattle)

  • Park, Mi Na;Seo, Dongwon;Chung, Ki-Yong;Lee, Soo-Hyun;Chung, Yoon-Ji;Lee, Hyo-Jun;Lee, Jun-Heon;Park, Byoungho;Choi, Tae-Jeong;Lee, Seung-Hwan
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제33권10호
    • /
    • pp.1558-1565
    • /
    • 2020
  • Objective: The objective of this study was to characterize the number of loci affecting growth traits and the distribution of single nucleotide polymorphism (SNP) effects on growth traits, and to understand the genetic architecture for growth traits in Hanwoo (Korean cattle) using genome-wide association study (GWAS), genomic partitioning, and hierarchical Bayesian mixture models. Methods: GWAS: A single-marker regression-based mixed model was used to test the association between SNPs and causal variants. A genotype relationship matrix was fitted as a random effect in this linear mixed model to correct the genetic structure of a sire family. Genomic restricted maximum likelihood and BayesR: A priori information included setting the fixed additive genetic variance to a pre-specified value; the first mixture component was set to zero, the second to 0.0001×σ2g, the third 0.001×σ2g, and the fourth to 0.01×σ2g. BayesR fixed a priori information was not more than 1% of the genetic variance for each of the SNPs affecting the mixed distribution. Results: The GWAS revealed common genomic regions of 2 Mb on bovine chromosome 14 (BTA14) and 3 had a moderate effect that may contain causal variants for body weight at 6, 12, 18, and 24 months. This genomic region explained approximately 10% of the variance against total additive genetic variance and body weight heritability at 12, 18, and 24 months. BayesR identified the exact genomic region containing causal SNPs on BTA14, 3, and 22. However, the genetic variance explained by each chromosome or SNP was estimated to be very small compared to the total additive genetic variance. Causal SNPs for growth trait on BTA14 explained only 0.04% to 0.5% of the genetic variance Conclusion: Segregating mutations have a moderate effect on BTA14, 3, and 19; many other loci with small effects on growth traits at different ages were also identified.

한우의 도체형질 유전모수 추정을 위한 REML과 Bayesian via Gibbs Sampling 방법의 비교 연구 (Comparison between REML and Bayesian via Gibbs Sampling Algorithm with a Mixed Animal Model to Estimate Genetic Parameters for Carcass Traits in Hanwoo(Korean Native Cattle))

  • 노승희;김병우;김효선;민희식;윤호백;이득환;전진태;이정규
    • Journal of Animal Science and Technology
    • /
    • 제46권5호
    • /
    • pp.719-728
    • /
    • 2004
  • 본 연구는 한우의 도체형질들에 대한 유전적 변이를 분석방법에 따라 어떠한 차이가 있는지를 알아보고자 한우 후대검정자료를 이용하여 분석하였다. 분석에 이용된 도체성적 관련 자료는 가축개량사업소와 한우개량단지에서 1996 년부터 2001 년까지 태어난 후대검정우 1526두로부터 조사었다. 한우에 있어서 주요 개량형질인 육량과 육질에 영향하는 도체중, 도체율,배최장근단면적, 등지방두께, 근내지방도를 대상으로 유전력과 유전상관을 추정하였다. 유전모수 추정에 있어서 REML 분석법과 Bayesian추론방법으로써 Gibbs Sampling 분석법을 사용하였는데 각각의 모수들에 대한 Gibbs Sampler는 100,000회 실시하였고 초기 1,000회는 모수의 사후분포에 대한 부정확성으로 간주하여 모수의 사후분포특성 규명에서 제외하였다. 각각의 형질들에 대한 유전변이는 이러한 두 가지 분석방법을 상호 비교 함으로써 최적의 통계분석 방법을 모색하였다. 도체형질에 대한 유전력 추정은 REML 방법을 통한 추정에서는 근내지방도가 0.51로 고도의 유전력을 보였고, 도체율이 0.25로 중도의 유전력이 추정되었다. Gibbs Sampling 방법을통한 추정에서도 근내지방도가 0.54로 고도의 유전력을 도체율에서 0.25로 중도의 유전력을 보였다. REML 분석방법과 Gibbs Sampling 분석방법에서의 유전력은 다소 큰 차이는 보이지 않았으나, 대체로 Gibbs Sampling 방법으로 분석한 유전력 추정치가 높게 추정되었다. 그리고, 유전상관분석에서는 REML 방법을 통한 분석에서 도체중과 배최장근단면적에서 0.651 로 높은 정의 유전상관을 나타내었고, 배최장근단면적과 등지방두께에서 -0.139로 부의 유천상관을 나타내었다. Gibbs Sampling 방법에서는 도체중과 도체율, 배최장근단면적에서 각각 0.814, 0.695으로 높은 정의 상관을 나타내었고, 배최장근단면적과 등지방두께에서 -0.126으로 부의상관을 나타내었다. Gibbs Sampling방법을 통한 분석에서 특정 형질간 유전상관이 높게 나타났으며, 다소 큰 차이를 보이지 않았다. REML 분석방법과 Bayesian Inference를 바탕으로 한 Gibbs Sampling 분석에서 모수 추정은 큰 차이를 보이지 않았다. 따라서 방대한 현장정보를 활용하여 보다 정확한 모수 추정을 수행하기 위해서는 분석모형에 대한 계수행렬의 역행렬 계산을 통한 REML 방법의 한계성을 극복할 수 있는 방법으로써 Gibbs Sampling 분석 방법이 가능할 것으로 사료된다.

Potential influence of κ-casein and β-lactoglobulin genes in genetic association studies of milk quality traits

  • Zepeda-Batista, Jose Luis;Saavedra-Jimenez, Luis Antonio;Ruiz-Flores, Agustin;Nunez-Dominguez, Rafael;Ramirez-Valverde, Rodolfo
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제30권12호
    • /
    • pp.1684-1688
    • /
    • 2017
  • Objective: From a review of published information on genetic association studies, a meta-analysis was conducted to determine the influence of the genes ${\kappa}-casein$ (CSN3) and ${\beta}-lactoglobulin$ (LGB) on milk yield traits in Holstein, Jersey, Brown Swiss, and Fleckvieh. Methods: The GLIMMIX procedure was used to analyze milk production and percentage of protein and fat in milk. Models included the main effects and all their possible two-way interactions; not estimable effects and non-significant (p>0.05) two-way interactions were dropped from the models. The three traits analyzed used Poisson distribution and a log link function and were determined with the Interactive Data Analysis of SAS software. Least square means and multiple mean comparisons were obtained and performed for significant main effects and their interactions (p<0.0255). Results: Interaction of breed by gene showed that Holstein and Fleckvieh were the breeds on which CSN3 ($6.01%{\pm}0.19%$ and $5.98%{\pm}0.22%$), and LGB ($6.02%{\pm}0.19%$ and $5.70%{\pm}0.22%$) have the greatest influence. Interaction of breed by genotype nested in the analyzed gene indicated that Holstein and Jersey showed greater influence of the CSN3 AA genotype, $6.04%{\pm}0.22%$ and $5.59%{\pm}0.31%$ than the other genotypes, while LGB AA genotype had the largest influence on the traits analyzed, $6.05%{\pm}0.20%$ and $5.60%{\pm}0.19%$, respectively. Furthermore, interaction of type of statistical model by genotype nested in the analyzed gene indicated that CSN3 and LGB genes had similar behavior, maintaining a difference of more than 7% across analyzed genotypes. These results could indicate that both Holstein and Jersey have had lower substitution allele effect in selection programs that include CSN3 and LGB genes than Brown Swiss and Fleckvieh. Conclusion: Breed determined which genotypes had the greatest association with analyzed traits. The mixed model based in Bayesian or Ridge Regression was the best alternative to analyze CSN3 and LGB gene effects on milk yield and protein and fat percentages.