• 제목/요약/키워드: Bayesian model class selection

검색결과 10건 처리시간 0.01초

Bayesian Hierarchical Model with Skewed Elliptical Distribution

  • 정윤식
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2000년도 추계학술발표회 논문집
    • /
    • pp.5-12
    • /
    • 2000
  • Meta-analysis refers to quantitative methods for combining results from independent studies in order to draw overall conclusions. We consider hierarchical models including selection models under a skewed heavy tailed error distribution and it is shown to be useful in such Bayesian meta-analysis. A general class of skewed elliptical distribution is reviewed and developed. These rich class of models combine the information of independent studies, allowing investigation of variability both between and within studies, and weight function. Here we investigate sensitivity of results to unobserved studies by considering a hierarchical selection model and use Markov chain Monte Carlo methods to develop inference for the parameters of interest.

  • PDF

A Bayesian Method for Narrowing the Scope fo Variable Selection in Binary Response t-Link Regression

  • Kim, Hea-Jung
    • Journal of the Korean Statistical Society
    • /
    • 제29권4호
    • /
    • pp.407-422
    • /
    • 2000
  • This article is concerned with the selecting predictor variables to be included in building a class of binary response t-link regression models where both probit and logistic regression models can e approximately taken as members of the class. It is based on a modification of the stochastic search variable selection method(SSVS), intended to propose and develop a Bayesian procedure that used probabilistic considerations for selecting promising subsets of predictor variables. The procedure reformulates the binary response t-link regression setup in a hierarchical truncated normal mixture model by introducing a set of hyperparameters that will be used to identify subset choices. In this setup, the most promising subset of predictors can be identified as that with highest posterior probability in the marginal posterior distribution of the hyperparameters. To highlight the merit of the procedure, an illustrative numerical example is given.

  • PDF

Bayesian ballast damage detection utilizing a modified evolutionary algorithm

  • Hu, Qin;Lam, Heung Fai;Zhu, Hong Ping;Alabi, Stephen Adeyemi
    • Smart Structures and Systems
    • /
    • 제21권4호
    • /
    • pp.435-448
    • /
    • 2018
  • This paper reports the development of a theoretically rigorous method for permanent way engineers to assess the condition of railway ballast under a concrete sleeper with the potential to be extended to a smart system for long-term health monitoring of railway ballast. Owing to the uncertainties induced by the problems of modeling error and measurement noise, the Bayesian approach was followed in the development. After the selection of the most plausible model class for describing the damage status of the rail-sleeper-ballast system, Bayesian model updating is adopted to calculate the posterior PDF of the ballast stiffness at various regions under the sleeper. An obvious drop in ballast stiffness at a region under the sleeper is an evidence of ballast damage. In model updating, the model that can minimize the discrepancy between the measured and model-predicted modal parameters can be considered as the most probable model for calculating the posterior PDF under the Bayesian framework. To address the problems of non-uniqueness and local minima in the model updating process, a two-stage hybrid optimization method was developed. The modified evolutionary algorithm was developed in the first stage to identify the important regions in the parameter space and resulting in a set of initial trials for deterministic optimization to locate all most probable models in the second stage. The proposed methodology was numerically and experimentally verified. Using the identified model, a series of comprehensive numerical case studies was carried out to investigate the effects of data quantity and quality on the results of ballast damage detection. Difficulties to be overcome before the proposed method can be extended to a long-term ballast monitoring system are discussed in the conclusion.

준모수적 계층적 선택모형에 대한 베이지안 방법 (A Bayesian Method to Semiparametric Hierarchical Selection Models)

  • 정윤식;장정훈
    • 응용통계연구
    • /
    • 제14권1호
    • /
    • pp.161-175
    • /
    • 2001
  • 메타분석(Meta-analysis)은 서로 독립적으로 연구되어진 결과들을 전체적인 하나의 결과로 도출하기 위해 사용되어지는 통계적 방법이다. 이러한 통계적 방법을 설명할 모형으로는 선택모형(selection model)을 포함한 계층적 모형(hierarchical model)을 사용하며, 이러한 모형들은 베이지안 메타분석에 유용한 것으로 알려져 있다. 그러나, 메타분석의 자료들은 일반적으로 출판편의(publication bias)를 갖고 있으므로 이를 극복하고자 가중함수(weight function)를 이용하여 분포함수를 새롭게 정의하여 사용한다. 최근에 Silliman(1997)은 계층적 모형(hierarchical model)에 가중함수를 첨부한 계층적 선택모형(hierarchical selection model)을 정의하고 모수적 베이지안 방법을 제시하였다. 본 연구에서는 미관측된 연구효과에 디리슈레 과정 사전분포(Dirichlet process prior)를 적용한 준모수적 계층적 선택모형(semiparametric hierarchical selection models)을 소개한다. 여기서 제시된 준모수적 계층적 선택모형을 베이지안 방법으로 추정하기 위하여 마코프 연쇄 몬테칼로(Markov chain Monte Carlo)방법을 이용한다. 제시된 방법을 적용하기 위하여 실제 자료(Johnson, 1993)인 충치를 예방하기 위한 두 가지의 예방약의 효과에 대한 차이를 비교하기 위해 얻어진 12개의 연구를 이용하여 메타분석을 한다.

  • PDF

잠재그룹 포아송 모형을 이용한 전립선암 환자의 베이지안 그룹화 (Bayesian Clustering of Prostate Cancer Patients by Using a Latent Class Poisson Model)

  • 오만숙
    • 응용통계연구
    • /
    • 제18권1호
    • /
    • pp.1-13
    • /
    • 2005
  • 최근 많은 연구자와 실무자들이 모집단에 내재해 있는 여러 다른 그룹(class, segment)간의 이질성을 밝혀내고 객체들을 그룹별로 세분화하는 방법 중 하나로 잠재그룹 모델(Latent class model)을 고려하고 있다. 이 논문에서는 2000년도에 국립 암 센터에 접수된 한국 내 연령별 전립선암 사망자수 자료를 기반으로, 잠재그룹 포아송 모형을 이용하여 전립선암 환자의 연령에 따른 그룹화를 시도한다. 최우추정법 등 고전적 추론방법의 한계를 극복하기 위하여 Markov Chain Monte Carlo (MCMC) 방법을 도구로 한 베이지안 추정 방법을 제안한다. 제안된 베이지안 방법의 장점은 용이한 모수추정과 추정오차의 제공, 그리고 각 객체의 소속그룹의 판정과 이에 따르는 오차, 즉, 객체의 각 군집에 속할 확률, 도 구할 수 있다는 것이다. 또한 주어진 자료들에 대해 가장 적합한 그룹의 수를 결정하는 방법을 제시하여 그룹의 수나 세분화의 근거를 사전에 제공하지 않아도 자료가 주는 정보로부터 이들을 자동으로 결정하는 방법을 제시한다.

BAYESIAN ROBUST ANALYSIS FOR NON-NORMAL DATA BASED ON A PERTURBED-t MODEL

  • Kim, Hea-Jung
    • Journal of the Korean Statistical Society
    • /
    • 제35권4호
    • /
    • pp.419-439
    • /
    • 2006
  • The article develops a new class of distributions by introducing a nonnegative perturbing function to $t_\nu$ distribution having location and scale parameters. The class is obtained by using transformations and conditioning. The class strictly includes $t_\nu$ and $skew-t_\nu$ distributions. It provides yet other models useful for selection modeling and robustness analysis. Analytic forms of the densities are obtained and distributional properties are studied. These developments are followed by an easy method for estimating the distribution by using Markov chain Monte Carlo. It is shown that the method is straightforward to specify distribution ally and to implement computationally, with output readily adopted for constructing required criterion. The method is illustrated by using a simulation study.

Investigation of modal identification and modal identifiability of a cable-stayed bridge with Bayesian framework

  • Kuok, Sin-Chi;Yuen, Ka-Veng
    • Smart Structures and Systems
    • /
    • 제17권3호
    • /
    • pp.445-470
    • /
    • 2016
  • In this study, the Bayesian probabilistic framework is investigated for modal identification and modal identifiability based on the field measurements provided in the structural health monitoring benchmark problem of an instrumented cable-stayed bridge named Ting Kau Bridge (TKB). The comprehensive structural health monitoring system on the cable-stayed TKB has been operated for more than ten years and it is recognized as one of the best test-beds with readily available field measurements. The benchmark problem of the cable-stayed bridge is established to stimulate investigations on modal identifiability and the present paper addresses this benchmark problem from the Bayesian prospective. In contrast to deterministic approaches, an appealing feature of the Bayesian approach is that not only the optimal values of the modal parameters can be obtained but also the associated estimation uncertainty can be quantified in the form of probability distribution. The uncertainty quantification provides necessary information to evaluate the reliability of parametric identification results as well as modal identifiability. Herein, the Bayesian spectral density approach is conducted for output-only modal identification and the Bayesian model class selection approach is used to evaluate the significance of different modes in modal identification. Detailed analysis on the modal identification and modal identifiability based on the measurements of the bridge will be presented. Moreover, the advantages and potentials of Bayesian probabilistic framework on structural health monitoring will be discussed.

잠재변수 모형에서의 군집효율을 이용한 변수선택 (Variable selection for latent class analysis using clustering efficiency)

  • 김성경;서병태
    • 응용통계연구
    • /
    • 제31권6호
    • /
    • pp.721-732
    • /
    • 2018
  • 잠재집단 모형은 다변량 범주형 자료 안에 숨겨진 집단을 찾는 매우 중요한 도구종의 하나이다. 하지만 실제 자료분석에서 너무 많은 관찰변수들을 포함시킨 모형은 모형을 복잡하게 만들고 또한 모수추정의 정확도에 영향을 주기 때문에 정보가 손실되지 않는 내에서 유용한 변수를 찾는 것은 중요한 문제이다. Dean과 Raftery (2010)은 잠재집단 모형에서의 변수선택을 위해 BIC를 이용한 Headlong search 알고리즘을 제시하였는데 본 논문에서는 이 방법을 대체할 수 있는 방법으로 적합한 모형으로부터 계산된 잠재집단에 속할 사후확률을 이용하여 변수 선택을 하는 방법을 제안하고자 한다. 이를 위하여 잠재집단 모형의 적합성을 측정할 수 있는 새로운 통계량과 이를 이용한 변수선택 알고리즘을 제시할 것이다. 또한 제안된 방법의 효율성을 모의실험과 실증자료 분석을 통해 살펴보고자 한다.

정규 혼합분포를 이용한 준지도 학습 (Semi-Supervised Learning by Gaussian Mixtures)

  • 최병정;채윤석;최우영;박창이;구자용
    • 응용통계연구
    • /
    • 제21권5호
    • /
    • pp.825-833
    • /
    • 2008
  • 혼합모형을 이용한 판별분석은 다중 분류문제를 해결하는데 유용한 방법으로서 준지도 학습으로 확장될 수 있다. 본 논문에서는 정규 혼합분포를 이용한 준지도 학습 방법에서 혼합 모형의 하위 구성요소 개수 선택 기준을 연구하고자 한다. 하위 구성요소 선택 기준으로서 베이지안 정보량을 사용하였고 모의실험을 통해 이 방법의 유용성을 규명하였다.

환경음 인식을 위한 GMM의 혼합모델 개수 추정 (Estimation of Optimal Mixture Number of GMM for Environmental Sounds Recognition)

  • 한다정;박아론;백성준
    • 한국산학기술학회논문지
    • /
    • 제13권2호
    • /
    • pp.817-821
    • /
    • 2012
  • 본 논문에서는 환경음 인식에 GMM(Gaussain mixture model)을 이용할 때 MDL(minimum description length)와 BIC(Bayesian information criterion) 모델선택 기준을 이용하여 최적의 혼합모델 개수를 결정하는 방법에 대해 다루었다. 실험은 모두 9가지 종류의 환경음으로부터 12차 MFCC(mel-frequency cepstral coefficients) 특징 27747개를 추출하고 이를 GMM으로 분류하였다. 각 환경음 클래스의 최적 혼합모델 개수를 추정 하기위해 MDL과 BIC를 적용하고 그 결과를 고정 개수의 혼합모델을 사용한 경우와 비교하였다. 실험 결과에 따르면 혼합모델 선택 방법을 적용한 경우가 그렇지 않은 경우에 비해 거의 유사한 인식성능을 유지하면서 계산복잡도는 BIC와 MDL를 통해 각각 17.8%와 31.7%가 감소하는 것을 확인하였다. 이는 GMM을 이용한 환경음 인식에서 BIC와 MDL 적용을 통해 계산복잡도를 효과적으로 감소시킬 수 있음을 보여준다.