• 제목/요약/키워드: Multivariate Threshold Model

검색결과 14건 처리시간 0.032초

다형질 Threshold 개체모형에서 Missing 기록을 포함한 이산형 자료에 대한 Bayesian 분석 (Bayesian Analysis for Categorical Data with Missing Traits Under a Multivariate Threshold Animal Model)

  • 이득환
    • Journal of Animal Science and Technology
    • /
    • 제44권2호
    • /
    • pp.151-164
    • /
    • 2002
  • 한우의 근내지방도 또는 임신 여부 등과 같이 이산형 분포의 성질을 갖는 다수의 형질들에 대한 유전모수 및 종축의 유전능력을 평가하기 위한 방법으로써 Threshold 모형하에서 Bayesian 추론방법의 일종인 Gibbs sampling방법을 모의실험을 통하여 알아보았으며 기록이 누락된 다수의 형질을 포함하는 다형질 Threshold 개체모형에서의 종축평가 방법론을 제시하였다. 이산형 형질의 관측치에 대응하는 임의의 잠재변수는 기록을 갖고 있는 형질들에 대한 사전정보를 고려한 사후조건확률분포에서 Gibbs sampling을 할 때 모수에 근접하는 확률분포를 얻을 수 있었으며 이러한 이산형 기록들에 대한 육종가 추정치는 선형모형에서 보다 Threshold 모형에서의 추정치가 실제 모수에 더욱 근접하는 것을 알 수 있었다. 따라서 기록이 누락된 개체들에 대한 이산형 분포를 갖는 형질들에 대하여 선형분포를 갖는 형질들과 함께 동시 유전분석할 때 Threshod 모형이 일반 선형모형 보다 적합함을 알 수 있었다.

Bayesian Analysis of Multivariate Threshold Animal Models Using Gibbs Sampling

  • Lee, Seung-Chun;Lee, Deukhwan
    • Journal of the Korean Statistical Society
    • /
    • 제31권2호
    • /
    • pp.177-198
    • /
    • 2002
  • The estimation of variance components or variance ratios in linear model is an important issue in plant or animal breeding fields, and various estimation methods have been devised to estimate variance components or variance ratios. However, many traits of economic importance in those fields are observed as dichotomous or polychotomous outcomes. The usual estimation methods might not be appropriate for these cases. Recently threshold linear model is considered as an important tool to analyze discrete traits specially in animal breeding field. In this note, we consider a hierarchical Bayesian method for the threshold animal model. Gibbs sampler for making full Bayesian inferences about random effects as well as fixed effects is described to analyze jointly discrete traits and continuous traits. Numerical example of the model with two discrete ordered categorical traits, calving ease of calves from born by heifer and calving ease of calf from born by cow, and one normally distributed trait, birth weight, is provided.

Genetic parameters for worm resistance in Santa Inês sheep using the Bayesian animal model

  • Rodrigues, Francelino Neiva;Sarmento, Jose Lindenberg Rocha;Leal, Tania Maria;de Araujo, Adriana Mello;Filho, Luiz Antonio Silva Figueiredo
    • Animal Bioscience
    • /
    • 제34권2호
    • /
    • pp.185-191
    • /
    • 2021
  • Objective: The objective of this study was to estimate the genetic parameters for worm resistance (WR) and associated characteristics, using the linear-threshold animal model via Bayesian inference in single- and multiple-trait analyses. Methods: Data were collected from a herd of Santa Inês breed sheep. All information was collected with animals submitted to natural contamination conditions. All data (number of eggs per gram of feces [FEC], Famacha score [FS], body condition score [BCS], and hematocrit [HCT]) were collected on the same day. The animals were weighed individually on the day after collection (after 12-h fasting). The WR trait was defined by the multivariate cluster analysis, using the FEC, HCT, BCS, and FS of material collected from naturally infected sheep of the Santa Inês breed. The variance components and genetic parameters for the WR, FEC, HCT, BCS, and FS traits were estimated using the Bayesian inference under the linear and threshold animal model. Results: A low magnitude was obtained for repeatability of worm-related traits. The mean values estimated for heritability were of low-to-high (0.05 to 0.88) magnitude. The FEC, HCT, BCS, FS, and body weight traits showed higher heritability (although low magnitude) in the multiple-trait model due to increased information about traits. All WR characters showed a significant genetic correlation, and heritability estimates ranged from low (0.44; single-trait model) to high (0.88; multiple-trait model). Conclusion: Therefore, we suggest that FS be included as a criterion of ovine genetic selection for endoparasite resistance using the trait defined by multivariate cluster analysis, as it will provide greater genetic gains when compared to any single trait. In addition, its measurement is easy and inexpensive, exhibiting greater heritability and repeatability and a high genetic correlation with the trait of resistance to worms.

Estimation of Genetic Parameters for Calving Ease by Heifers and Cows Using Multi-trait Threshold Animal Models with Bayesian Approach

  • Lee, D.H.
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제15권8호
    • /
    • pp.1085-1090
    • /
    • 2002
  • Genetic parameters for birth weights (BWT), calving ease scores observed from calves born by heifers (CEH), and calving ease scores observed from calves born by cows (CEC) were estimated using Bayesian methodology with Gibbs sampling in different threshold animal models. Data consisted of 77,458 records for calving ease scores and birth weights in Gelbvieh cattle. Gibbs samplers were used to obtain the parameters of interest for the categorical traits in two univariate threshold animal models, a bivariate threshold animal model, and a three-trait linear-threshold animal model. Samples of heritabilities and genetic correlations were calculated from the posterior means of dispersion parameters. In a univariate threshold animal model with CEH (model 1), the posterior means of heritabilities for calving ease was 0.35 for direct genetic effects and 0.18 for maternal genetic effects. In the other univariate threshold model with CEC (model 2), the posterior means of heritabilities of CEC was 0.28 for direct genetic effects and 0.18 for maternal genetic effects. In a bivariate threshold model with CEH and CEC (model 3), heritability estimates were similar to those in unvariate threshold models. In this model, genetic correlation between heifer calving ease and cow calving ease was 0.89 and 0.87 for direct genetic effect and maternal genetic effects, respectively. In a three-trait animal model, which contained two categorical traits (CEH and CEC) and one continuous trait (BWT) (model 4), heritability estimates of CEH and CEC for direct (maternal) genetic effects were 0.40 (0.23) and 0.23 (0.13), respectively. In this model, genetic correlation estimates between CEH and CEC were 0.89 and 0.66 for direct genetic effects and maternal effects, respectively. These estimates were greater than estimates between BWT and CEH (0.82 and 0.34) or BWT and CEC (0.85 and 0.26). This result indicates that CEH and CEC should be high correlated rather than estimates between calving ease and birth weight. Genetic correlation estimates between direct genetic effects and maternal effects were -0.29, -0.31 and 0.15 for BWT, CEH and CEC, respectively. Correlation for permanent environmental effects between BWT and CEC was -0.83 in model 4. This study can provide genetic evaluation for calving ease with other continuous traits jointly with assuming that calving ease from first calving was a same trait to calving ease from later parities calving. Further researches for reliability of dispersion parameters would be needed even if the more correlated traits would be concerned in the model, the higher reliability could be obtained, especially on threshold model with property that categorical traits have little information.

Non-Destructive Sorting Techniques for Viable Pepper (Capsicum annuum L.) Seeds Using Fourier Transform Near-Infrared and Raman Spectroscopy

  • Seo, Young-Wook;Ahn, Chi Kook;Lee, Hoonsoo;Park, Eunsoo;Mo, Changyeun;Cho, Byoung-Kwan
    • Journal of Biosystems Engineering
    • /
    • 제41권1호
    • /
    • pp.51-59
    • /
    • 2016
  • Purpose: This study examined the performance of two spectroscopy methods and multivariate classification methods to discriminate viable pepper seeds from their non-viable counterparts. Methods: A classification model for viable seeds was developed using partial least square discrimination analysis (PLS-DA) with Fourier transform near-infrared (FT-NIR) and Raman spectroscopic data in the range of $9080-4150cm^{-1}$ (1400-2400 nm) and $1800-970cm^{-1}$, respectively. The datasets were divided into 70% to calibration and 30% to validation. To reduce noise from the spectra and compare the classification results, preprocessing methods, such as mean, maximum, and range normalization, multivariate scattering correction, standard normal variate, and $1^{st}$ and $2^{nd}$ derivatives with the Savitzky-Golay algorithm were used. Results: The classification accuracies for calibration using FT-NIR and Raman spectroscopy were both 99% with first derivative, whereas the validation accuracies were 90.5% with both multivariate scattering correction and standard normal variate, and 96.4% with the raw data (non-preprocessed data). Conclusions: These results indicate that FT-NIR and Raman spectroscopy are valuable tools for a feasible classification and evaluation of viable pepper seeds by providing useful information based on PLS-DA and the threshold value.

다변량 L-moment를 이용한 이변량 강우빈도해석에서 수문학적 동질지역 선정 (Hydrological homogeneous region delineation for bivariate frequency analysis of extreme rainfalls in Korea)

  • 신주영;정창삼;주경원;허준행
    • 한국수자원학회논문집
    • /
    • 제51권1호
    • /
    • pp.49-60
    • /
    • 2018
  • 다변량 지역빈도해석은 기존에 사용되어온 다변량 빈도해석과 지역빈도해석의 장점을 가지고 있는 방법으로 다양한 변수를 고려함으로써 수문현상에 대하여 많은 정보를 얻을 수 있다. 현재까지는 우리나라의 수문자료를 이용하여 다변량 지역빈도해석이 시도된 적이 없어 국내의 수문자료를 대상으로 다변량 지역빈도해석의 적용성을 검토할 필요가 있다. 본 연구에서는 다변량 지역빈도해석의 수문학적 동질지역을 설정하는 단계에 집중하여 이변량 수문자료인 연최대 강우량-지속기간 자료에 대하여 수문학적 동질지역을 설정하였다. 이변량 지역빈도해석에서 사용되는 지역구분방법의 한국의 연최대 강우량-지속기간 자료에 대한 적용성을 평가하였고 그 특성을 분석하였다. 기상청 71개 지점에 대하여 분석을 실시하였다. 군집해석방법으로는 K-medoid 방법을 적용하였고, 불일치 척도와 이질성 척도를 이용하여 지역구분이 적절히 되었는지를 판정하였다. 군집해석 결과 한국은 총 5개의 지역으로 나누어지며, 두 지역을 제외하고는 지역 내 모든 지점의 불일치 척도가 기준치 이하인 것으로 나타났다. 자료연수가 짧은 지점에서 불일치 척도가 높게 나오는 것을 확인하였다. 구분된 모든 지역은 지역 내 지점들의 자료들이 동질한 것으로 나타났고 각 지점간의 상관성이 매우 높은 것으로 나타났다.

범주형 자료를 포함한 다형질 임계개체모형에서 유전능력 추정 알고리즘 (Computing Algorithm for Genetic Evaluations on Several Linear and Categorical Traits in A Multivariate Threshold Animal Model)

  • 이득환
    • Journal of Animal Science and Technology
    • /
    • 제46권2호
    • /
    • pp.137-144
    • /
    • 2004
  • 불연속 범주형 자료에 대한 잠재변수가 존재한다는 가정하에 임계값을 추정하고 잠재변수를 생성하며 생성된 잠재변수 및 기타 연속변량에 대한 관측치를 포함하는 다변량 임계개체모형을 설정하고 유전능력을 예측하기 위한 방법을 제시하였다. 각각의 범주형 조사 자료의 특성을 갖는 형질에 있어서 임계점의 추정은 추정 가능한 임계점에 대한 1차 미분값(gradient)과 2차 미분값(Hessian)을 이용한 Newton 방법을 이용하면 추정가능하며 지역모수인 육종가의 추정은 PCG 방법으로 구현 가능하다. 이러한 이론은 Quaas(2001)가 제시한 하나의 이산형 자료와 하나의 연속형 자료의 2변량 동시 분석방법을 확장하여 전개한 것이며 이때 잠재변수 및 임계점의 추정은 기타 형질의 잔차 회귀계수 및 상관을 고려해야 한다. 본 연구를 위한 모의실험은 2개의 연속변량으로 체중과 유량을 고려하였고 또 다른 2개의 불연속 변량인 분만난이도와 출생시 생존유무를 고려하여 4형질 동시 분석을 실시하였다. 임계모형에 의한 육종가 추정치의 정확도는 4개의 구간으로 분류되어 기록된 분만난이도의 경우에 91${\sim}$92%의 정확도를 보였고 이항분포인 분만시 생존유무에 대하여는 87~89%의 정확도를 보였다. 반면에 이들 범주형 자료를 선형으로 간주하고 분석한 선형 동물개체 혼합모형에서는 72${\sim}$84% 및 59${\sim}$70%으로 비교적 낮은 추정의 정확도를 보였다. 따라서 범주형 자료의 유전분석은 선형 혼합모형 보다 임계형 혼합모형이 크게 타당할 것으로 사료되었다.

한우의 도체중, 배장근단면적 및 근내지방도의 유전모수 추정방법 (Methods for Genetic Parameter Estimations of Carcass Weight, Longissimus Muscle Area and Marbling Score in Korean Cattle)

  • 이득환
    • Journal of Animal Science and Technology
    • /
    • 제46권4호
    • /
    • pp.509-516
    • /
    • 2004
  • 한우 종모우 선발을 위한 유전능력 평가에서 고려되는 형질들 중 이산형 형태로 조사되는 근내지방도의 유전변이가 추정방법에 따라 어느 정도 차이가 있는지 알아보기 위한 모의실험을 실시하였다. 모의실험 자료는 연속변량으로 간주되는 도체중 및 배장근단면적과 근내지방도의 잠재변수를 다변량 정규분포함수에서 생성하였고 근내지방도의 잠재변수를 이용하여 특정 임계값을 중심으로 순서화된 근내지방도 점수로 변화 하였따. 근내지방도의 점수 부여방법으로써 비거세우에서 조사된 근내지방도의 점수 1${\sim}$5점 사이에 정규분포에서 크게 어긋나는 분포특성을 갖도록 자료(DSI)를 생성하였고 또한 한우 거세우에서 현재 조사되고 있는 점수 1${\sim}$7점 사이에 정규 분포에 좀더 접근한 분포특성을 갖는 모의 자료(DS2)를 생성하였다. 분석방법간에 유전변이 추정의 정확도를 알아보기 위하여 1) 생성된 이들 자료를 선형으로 간주하고 다형질 혼합 선형 개체모형에서 REML 분석방법으로 유전변이를 추정하였고 2) 특정 임계치를 중심으로 잠재변수가 존재한다는 가정하에 다형질 임계 개체 혼합모형을 설정하여 Gibbs sampling 방법으로 유전변이를 추정하였다. 여기서 추정된 유전변이(유전력, 유전상관 및 잔차상관)에 대하여 모수와의 차이를 검정함으로써 편의되는 정도를 알아보았다. 모의실험은 각 자료에 대하여 10회 실시하였다. 분석결과, 근내지방도의 유전력 추정치는 DS1에서는 다형질 임계개체혼합모형을 설정하여 Gibbs sampling 방법으로 모수에 대한 사후분포의 평균으로 계산한 결과 참값과 유의적인 차이가 없는 것으로 분석되었다. 반면에 근내지방도를 선형으로 간주하고 다형질 선형 개체혼합모형에 의한 유전력 추정치는 모수보다 매우 낮은 유전력을 보였다(0.500 vs 0.315). 유전상관 추정치는 선형모형에서의 REML 방법 또는 임계모형에서의Gibbs sampling 방법에서 모두 모수와 유의적인 차이가 없는 것으로 분석되었으나 근내지방도의 잔차상관에 있어서 REML 방법으로 분석하였을 경우에 모수보다 낮게 추정되었다. 반면에 범주형 모형에서는 모수와 추정치 간에 유의적인 차이가 없는 것으로 분석되었다. 또한 7개의 범주형으로 조사된 자료(DS2)에서 이들 추정치는 DS1에서와 동일한 경향을 보였는데 그 편의 정도는 다소 적어지는 경향을 보였다. 따라서 이산형으로 조사되는 근내지방도에 대한 유전변이를 추정하기 위해서는 범주형 임계모형이 선형모형 보다 사소 정확한 추정을 할 수 있을 것으로 판단 되었다.

다변량 Bernoulli 모형을 이용한 녹조 발생 예측 모형 개발 (Development of an algal bloom prediction model using multivariate Bernoulli model)

  • 정민규;김진영;조혜미;권현한
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.83-83
    • /
    • 2021
  • 수리구조물로 인한 유황변화와 함께 기후변화로 기인하는 강우변동성 및 온도 증가는 수생태 전반에 악영향을 미치는 주요 인자로 작용하고 있다. 특히, 최근 가뭄으로 인한 유황감소 및 폭염 등으로 여름철 녹조의 발생 빈도 및 강도 증가가 지속적으로 증가하고 있다. 본 연구에서는 하천에서 계측되고 있는 Cyanobacteria 개체수를 기반으로 녹조발생 여부를 전망할 수 있는 모형을 개발하고자 한다. Cyanobacteria 개체수를 기준으로 녹조발생 여부를 판단할 수 있도록 기준값(threshold)을 설정하고 binary 형태로 시계열을 구성하였다. 이를 Bernoulli 모형에 적합하여 녹조 발생 여부를 판단할 수 있도록 모형을 개발하였다. 하천을 따라 나타나는 녹조는 시공간적으로 유사한 특성을 가지며, 이러한 점을 고려하여 여러 관측지점을 동시에 모델링하는 것이 모형의 효율성과 예측성 측면에서 유리하다. 본 연구에서는 낙동강을 따라 여러 녹조관측지점을 대상으로 동시에 모델링이 가능하도록 다변량 Bernoulli 모형 기반의 녹조 예측 모형을 제시하고 과거 자료를 대상으로 모형의 적합성을 평가하였다. 다양한 지표를 기준으로 교차검증을 수행하였으며, 기존 물리적 모델에 비해 모형의 예측성능 및 효율성 측면에서 우수성을 확인할 수 있었다.

  • PDF

Validity of the scoring system for traumatic liver injury: a generalized estimating equation analysis

  • Lee, Kangho;Ryu, Dongyeon;Kim, Hohyun;Jeon, Chang Ho;Kim, Jae Hun;Park, Chan Yong;Yeom, Seok Ran
    • Journal of Trauma and Injury
    • /
    • 제35권1호
    • /
    • pp.25-33
    • /
    • 2022
  • Purpose: The scoring system for traumatic liver injury (SSTLI) was developed in 2015 to predict mortality in patients with polytraumatic liver injury. This study aimed to validate the SSTLI as a prognostic factor in patients with polytrauma and liver injury through a generalized estimating equation analysis. Methods: The medical records of 521 patients with traumatic liver injury from January 2015 to December 2019 were reviewed. The primary outcome variable was in-hospital mortality. All the risk factors were analyzed using multivariate logistic regression analysis. The SSTLI has five clinical measures (age, Injury Severity Score, serum total bilirubin level, prothrombin time, and creatinine level) chosen based on their predictive power. Each measure is scored as 0-1 (age and Injury Severity Score) or 0-3 (serum total bilirubin level, prothrombin time, and creatinine level). The SSTLI score corresponds to the total points for each item (0-11 points). Results: The areas under the curve of the SSTLI to predict mortality on post-traumatic days 0, 1, 3, and 5 were 0.736, 0.783, 0.830, and 0.824, respectively. A very good to excellent positive correlation was observed between the probability of mortality and the SSTLI score (γ=0.997, P<0.001). A value of 5 points was used as the threshold to distinguish low-risk (<5) from high-risk (≥5) patients. Multivariate analysis using the generalized estimating equation in the logistic regression model indicated that the SSTLI score was an independent predictor of mortality (odds ratio, 1.027; 95% confidence interval, 1.018-1.036; P<0.001). Conclusions: The SSTLI was verified to predict mortality in patients with polytrauma and liver injury. A score of ≥5 on the SSTLI indicated a high-risk of post-traumatic mortality.