• 제목/요약/키워드: Hierarchical Bayesian method

검색결과 59건 처리시간 0.023초

Bayes tests of independence for contingency tables from small areas

  • Jo, Aejung;Kim, Dal Ho
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권1호
    • /
    • pp.207-215
    • /
    • 2017
  • In this paper we study pooling effects in Bayesian testing procedures of independence for contingency tables from small areas. In small area estimation setup, we typically use a hierarchical Bayesian model for borrowing strength across small areas. This techniques of borrowing strength in small area estimation is used to construct a Bayes test of independence for contingency tables from small areas. In specific, we consider the methods of direct or indirect pooling in multinomial models through Dirichlet priors. We use the Bayes factor (or equivalently the ratio of the marginal likelihoods) to construct the Bayes test, and the marginal density is obtained by integrating the joint density function over all parameters. The Bayes test is computed by performing a Monte Carlo integration based on the method proposed by Nandram and Kim (2002).

A Finite Mixture Model for Gene Expression and Methylation Pro les in a Bayesian Framewor

  • Jeong, Jae-Sik
    • 응용통계연구
    • /
    • 제24권4호
    • /
    • pp.609-622
    • /
    • 2011
  • The pattern of methylation draws significant attention from cancer researchers because it is believed that DNA methylation and gene expression have a causal relationship. As the interest in the role of methylation patterns in cancer studies (especially drug resistant cancers) increases, many studies have been done investigating the association between gene expression and methylation. However, a model-based approach is still in urgent need. We developed a finite mixture model in the Bayesian framework to find a possible relationship between gene expression and methylation. For inference, we employ Expectation-Maximization(EM) algorithm to deal with latent (unobserved) variable, producing estimates of parameters in the model. Then we validated our model through simulation study and then applied the method to real data: wild type and hydroxytamoxifen(OHT) resistant MCF7 breast cancer cell lines.

A Bayesian Method for Narrowing the Scope of Variable Selection in Binary Response Logistic Regression

  • Kim, Hea-Jung;Lee, Ae-Kyung
    • 품질경영학회지
    • /
    • 제26권1호
    • /
    • pp.143-160
    • /
    • 1998
  • This article is concerned with the selection of subsets of predictor variables to be included in bulding the binary response logistic regression model. It is based on a Bayesian aproach, intended to propose and develop a procedure that uses probabilistic considerations for selecting promising subsets. This procedure reformulates the logistic regression setup in a hierarchical normal mixture model by introducing a set of hyperparameters that will be used to identify subset choices. It is done by use of the fact that cdf of logistic distribution is a, pp.oximately equivalent to that of $t_{(8)}$/.634 distribution. The a, pp.opriate posterior probability of each subset of predictor variables is obtained by the Gibbs sampler, which samples indirectly from the multinomial posterior distribution on the set of possible subset choices. Thus, in this procedure, the most promising subset of predictors can be identified as that with highest posterior probability. To highlight the merit of this procedure a couple of illustrative numerical examples are given.

  • PDF

베이지안 분계점 모형에 의한 순서 범주형 변수의 대체 (Imputation for Binary or Ordered Categorical Traits Based on the Bayesian Threshold Model)

  • 이승천
    • 응용통계연구
    • /
    • 제18권3호
    • /
    • pp.597-606
    • /
    • 2005
  • 대개의 표본조사에서 무응답은 필연적으로 발생되고 있고, 직접 표본조사에 참가하지 않은 데이터의 사용자는 무응답의 원인을 알 수 없는 것이 일반적이므로 데이터 분석에 어려움을 갖는다. 또 대부분의 통계분석 방법은 무응답을 전제하지 않고 있어 무응답이 있는 항목은 데이터 분석의 걸림돌이 된다고 하겠다. 최근 무응답에 대해 대체법이 하나의 표준적인 처리 방법이 되고 있어 현재까지 대체법에 대한 많은 연구가 있었으나 대부분의 대체법은 정규성 등을 가정한 연속형 변수의 대체법에 대한 것이었다. 그러나 표본조사에서 많은 중요한 항목들이 순서 범주에 의해 측정되는 경우가 많으므로 범주형변수의 대체법에 대한 연구가 필요하며, 본 연구에서는 보조변수가 있는 경우 Bayesian 모형에 의한 순서범주형 항목의 대체법에 대해 알아본다.

Extraction of Hierarchical Decision Rules from Clinical Databases using Rough Sets

  • Tsumoto, Shusaku
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2001년도 The Pacific Aisan Confrence On Intelligent Systems 2001
    • /
    • pp.336-342
    • /
    • 2001
  • One of the most important problems on rule induction methods is that they cannot extract rules, which plausibly represent experts decision processes. On one hand, rule induction methods induce probabilistic rules, the description length of which is too short, compared with the experts rules. On the other hand, construction of Bayesian networks generates too lengthy rules. In this paper, the characteristics of experts rules are closely examined and a new approach to extract plausible rules is introduced, which consists of the following three procedures. First, the characterization of decision attributes (given classes) is extracted from databases and the classes are classified into several groups with respect to the characterization. Then, two kinds of sub-rules, characterization rules for each group and discrimination rules for each class in the group are induced. Finally, those two parts are integrated into one rule for each decision attribute. The proposed method was evaluated on a medical database, the experimental results of which show that induced rules correctly represent experts decision processes.

  • PDF

왜도 타원형 분포를 이용한 준모수적 계층적 선택 모형 (Semiparametric Bayesian Hierarchical Selection Models with Skewed Elliptical Distribution)

  • 정윤식;장정훈
    • 응용통계연구
    • /
    • 제16권1호
    • /
    • pp.101-115
    • /
    • 2003
  • 본 논문에서는 Chen, Dey와 Shao(1999), Branco와 Dey(2001)가 제안한 왜도가 있는 두터운 꼬리를 가지는 오차 분포와 디리슈레 과정 사전분포를 이용한 베이지안 메타분석 (meta-analysis)을 하고자 한다. 베이지안 메타분석을 위하여 가중함수를 고려한 계층적 선택 모형을 이용한다. 이때의 오차항은 왜도가 있는 비정규 분포로 가정한다. 이를 위하여 우선 왜도 타원형 분포의 일반적인 족을 소개한다 이 분포족중 왜도 정규분포와 왜도 t 분포를 오차항 분포로 이용한 베이지안 계층적 선택 모형을 고려하며, 이 때 발생하는 복잡한 베이지안 계산은 MCMC 방법으로 해결한다. 마지막으로, 실제 자료(Johnson, 1993)인 두 가지의 충치예방약의 효과에 대한 차이를 비교하기 위해 얻어진 12개의 연구 자료를 이용하여 본 연구에서 제시된 베이지안 방법을 이용하여 메타분석을 한다.

Simultaneous modeling of mean and variance in small area estimation

  • Kim, Myungjin;Kim, Dal Ho
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권5호
    • /
    • pp.1423-1431
    • /
    • 2016
  • When the sample size in a certain domain is too small to produce adequate information, small area model with random effects is usually used. Also, if we do not consider an inherent pattern which data possess, it considerably affects inference. In this paper, we mainly focus on modeling to handle increased variation of the Current Population Survey (CPS) median income as the Internal Revenue Service (IRS) mean income increases. In a hierarchical Bayesian framework, most estimations are carried out through the Gibbs sampler while the grid method is used to generate parameters from non-standard form. Numerical study indicates that the performance of proposed model is better than that of CPS method in terms of four comparison measurements.

계층적 베이지안을 활용한 개념적 강우-유출모형 앙상블 모델 구축 (Development of a conceptual rainfall-runoff ensemble model using hierarchical Bayesian method)

  • 유재웅;김민지;오세청;권현한
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.181-181
    • /
    • 2021
  • 유역 내의 물순환 평가를 위하여 적합한 강우-유출모형을 선정하고 적용하는 것은 수문학적 관점에서 주된 과제이다. 장기적인 관점의 수자원 관리를 위해서는 직접적인 계측을 통해 장기간의 유출자료를 취득하는 방법이 있으나, 국내의 주요지점을 제외한 대다수의 중소규모의 지점에 계측기를 설치하는 것은 현실적으로 어려우므로, 자료취득이 비교적 용이하고 신뢰성이 높은 장기간 강우 자료를 강우-유출모형의 입력자료로 활용하여 미계측 유역으로의 모형을 확장하는 방안이 적절하다는 평가를 받고 있다. 본 연구는 국내외 주요 연속강우-유출모형의 특성을 파악하기 위하여 비교적 신뢰성 있는 자료를 보유하고 있는 소양강댐 유역에 다수의 연속강우-유출모형을 적용하였다. 모델링 결과로 산출된 유황곡선(flow duration curve)을 소양강댐 유입량과 비교하여 각 모형의 특징을 파악하고 유량에 따른 적합성 평가를 진행하였다. 또한, 향후 미계측유역으로 모형을 확장하기 위하여 매개변수 개수 및 재현능력을 동시에 평가하였다. 다수의 모형 중 적합성이 높은 모형들을 선별하였으며, 선별된 모형들의 불확실성을 고려함과 동시에 계층적 베이지안 기법을 활용하여 최종적으로 앙상블모형을 제시하였다. 앙상블모형을 단일 모형과 비교한 결과 단일 모형보다 개선된 성능을 확인하였다.

  • PDF

동적 베이스망 기반의 걸음걸이 분석 (Dynamic Bayesian Network-Based Gait Analysis)

  • 김찬영;신봉기
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권5호
    • /
    • pp.354-362
    • /
    • 2010
  • 본 연구는 동적 베이스 망을 이용하여, 사람의 보행 동작을 보행 방향과 보행 자세로 분리하여 계층적으로 분석하는 방법을 제안한다. DBN의 일종인 FHMM을 기본 바탕으로 하여, 걸음걸이 동작 특성을 고려하여 순환 고리형 상태 공간 구조로 '보행 동작 디코더'(Gait Motion Decoder, GMD)를 설계한다. 기존 연구에는 보행자의 식별에만 치중을 하고 보행 방향의 변화, 관찰 각도에 제한적이거나 보행 동작에 대한 분석이 없었다. 반면에 본 연구에서는 동작과 자세를 적극적으로 표현하여 임의 방향의 보행, 방향의 변화, 보행 자세까지 인식할 수 있도록 하였다. 실험 결과 동작과 자세의 관점에서 걸음걸이 방향을 분석한 결과 96.5%의 방향 인식률을 기록하였다. 본 연구는 보행 동작을 방향과 보행 자세로 계층적으로 분석하는 최초의 방법 및 시도이며 향후 상황별 휴먼 동작 분석에 크게 활용할 수 있을 것이다.

확률론적 베이지언 모델링에 의한 케이블 교량의 복합열화 리스크 평가 및 예측시스템 (The Risk Assessment and Prediction for the Mixed Deterioration in Cable Bridges Using a Stochastic Bayesian Modeling)

  • 조태준;이정배;김성수
    • 한국구조물진단유지관리공학회 논문집
    • /
    • 제16권5호
    • /
    • pp.29-39
    • /
    • 2012
  • 상관관계가 높은 복합열화의 완벽한 개별예측모델의 개발은 매우 어려운 문제로, 본 논문에서는 현수교 시스템의 미래열화와 유지 예산을 예측하기 위하여, 10년간의 유지 데이터가 주어진 매개변수(파손지표와 사용성)의 사후 확률 밀도함수를 찾기 위해 베이지언 추론을 적용하였다. 마르코프 연쇄 몬테카를로법을 이용하여 매개변수의 사후 분포를 조사하였다. 감소한 사용성의 모의위험예측은 사전분포와 연간유지 업무에서 업데이트한 데이터의 가능성에 따라 작성한 사후 분포이다. 기존의 선형 예측 모델과 비교하면, 제안된 2차 모델은 교량부품의 사용성, 위험요소, 그리고 유지 예산의 측정 데이터에 대하여 매우 개선된 수렴성과 근접성을 제공한다. 따라서 제안된 2차 추계학적 회귀 모델을 기반으로 복잡한 사회간접설비의 미래 성능과 유지관리예산을 예측하고 제어할 수 있는 기회를 제공할 것으로 기대한다.