• 제목/요약/키워드: 베이즈 인자

검색결과 14건 처리시간 0.029초

메타분석에서 그룹화 임의효과 모형의 베이지안 해석

  • 정윤식;정호진
    • 응용통계연구
    • /
    • 제13권1호
    • /
    • pp.81-96
    • /
    • 2000
  • 본 논문은 의학분야에서 주로 사용되는 메타분석 중 그룹화 임의효과 모형(grouped random effects model)을 프라빗 연결함수(probit link function)를 이용하여 베이즈적 관점에서 연구하였다. 이때 프라빗 함수를 강요하기 위해 잠재변수를 정의하였고, 사전 분포를 달리한 세가지 모형을 고려하였다. 주어진 세가지 모형들에게서 적합한 모형 선택을 위하여 베이즈 인자(Bayes factor, BF)와 유사베이즈 인자(pseudo-Bayes factor, PsBF)를 이용하였다. 깁스샘플러와 메트로폴리스 알고리즘을 이용하여 베이지안 계산상의 어려움을 해결하였다. 예로써, 새로운 간질약에 대한 효과를 조사하기 위하여 앞에서 제시된 방법으로 해석하였다.

  • PDF

변량모형 자료에서의 베이지안 이상점검출 (A Bayesian Outlier Detection in Random Effects Model)

  • 정윤식;이상진
    • 응용통계연구
    • /
    • 제13권1호
    • /
    • pp.115-131
    • /
    • 2000
  • 이 논문에서는 평균-이동모형(mean-shift model)을 이상점을 위한 대립모형으로 사용하여 변량모형(random effect model)에서의 이상점 검출을 위한 베이즈인자(Bayes factor)를 제시한다. 그러나 가능한 사전 정보가 없어서 무정보사전분포(noninformative prior distribution)가 사용되어야만 할 때, 대부분의 무정보사전분포는 부적절분포(improper distribution)이기 때문에 베이즌 인자에는 사전분포로부터 나온 미지의 상수가 포함되어 잇다. 이 문제를 해결하기 위해 이 논문에서는 Berger와 Pericchi (1996)가 제시한 내재베이즈인자(the intrinsic Bayes factor;IBF)를 사용한다. 또한 이 베이즈인자를 계산상 어려움을 해결하기 위해 Verdinellidh Wasserman(1995)의 일반화 세비디지키 밀도비를 이용하여 수정하고 이것을 이용하여 이상점을 검출하는 방법을 제시한다. 마지막으로 인위적으로 이상점을 포함하고 있는 데이터를 만들고 제시된 방법으로 가상실험을 하고 또한 실제 데이터에서 제시한 방법으로 이상점을 찾아보았다.

  • PDF

AR(1)모형에서 자기회귀계수의 다중검정을 위한 베이지안방법 (Bayesian Method for the Multiple Test of an Autoregressive Parameter in Stationary AR(L) Model)

  • 김경숙;손영숙
    • 응용통계연구
    • /
    • 제16권1호
    • /
    • pp.141-150
    • /
    • 2003
  • 본 논문은 베이즈인자(Bayes factor)를 이용하여 정상(stationary) AR(1)모형의 자기회귀계수에 대해 다중검정하는 방법을 제시한다. 모수들에 대한 사전분포로는 무정보 사전분포(noninformative prior distribution)를 가정한다. 이러한 경우에 통상적으로 사용되는 베이즈인자를 근사없이 정확히 계산하여 각 모형에 대한 사후확률(posterior probability)을 얻는다. 최종적으로 모의실험 자료 및 실제 자료에 적용하여 이론의 결과가 잘 부합되는지를 검토한다.

확률모델을 이용한 산림전용지역의 스크리닝방법 개발 (Development of a Screening Method for Deforestation Area Prediction using Probability Model)

  • 이정수
    • 한국지리정보학회지
    • /
    • 제11권2호
    • /
    • pp.108-120
    • /
    • 2008
  • 본 연구에서는 행정정보, GIS, RS정보, 확률모델을 이용하여 교토의정서에서 정의하는 산림전용지역의 추출가능성에 대하여 검토하였다. 1989년의 정사사진과 2001년의 IKONOS화상을 이용한 산림전용지역의 특성을 보면, 1989년부터 2001년까지의 산림전용지역은 약 40ha로 나타났다. 산림전용지역의 종류를 살펴보면, 도로(임도) 개설 및 주택지 개발을 위한 산림전용이 대부분을 차지하였고, 택지전용지의 80%는 기존의 도로로부터 100m이내에 분포하였으며, 신설된 도로 또한 20% 이상이 기존의 도로로부터 100m이내에 분포하였다. 산림전용지역의 추출모델 구축을 위하여 지형인자와 위성영상인자를 이용하였으며, 확률 개념을 도입한 산림전용지 발생 확률 지도를 작성하였다. 구축한 산지전용지 발생 모델의 유효성을 검증하기 위하여, 대상지역을 시스템적으로 구분하여, 추출 정도를 비교 검토하였다. 베이즈 모델과 Regression모델을 비교한 결과, 베이즈모델이 Regression모델보다 높은 추출확률을 나타냈다. 모델의 적합성을 평가하기위해서 대상지역을 2지역으로 구분하여 한쪽의 정보만을 가지고 발생확률지도를 작성하고, 나머지 지역에 대하여 발생확률을 검토한 결과에서도 베이즈모델이 높은 추출확률을 나타냈다.

  • PDF

폐질환 조기 검출을 위한 결합 히스토그램 기반의 통계적 특징 인자에 대한 연구 (Study of Joint Histogram Based Statistical Features for Early Detection of Lung Disease)

  • 원철호
    • 재활복지공학회논문지
    • /
    • 제10권4호
    • /
    • pp.259-265
    • /
    • 2016
  • 본 논문에서는 폐질환 조기 검출을 위하여 Broncho vascular, Emphysema, Ground Glass Reticular, Ground Glass, Honeycomb, Normal의 6가지 폐조직에 대한 새로운 분류기법을 제안하였다. 단순 베이즈 분류기와 아다부스트 학습 기법을 도입하여 459개의 결합 히스토그램 특징인자로부터 유효한 특징인자를 선별함으로써 폐조직을 분류하였다. 다중 해상도 해석, 체적 LBP 및 CT 휘도를 기반으로 하는 결합 히스토그램 특징인자는 정확도, 민감도, 특이도 결과에서 기존의 3D AMFM보다 우수한 결과를 보였다. 제안한 특징인자와 3D AMFM 특징인자의 정확도는 각각 90.1%과 85.3%로서 제안한 특징인자의 우수한 분류 성능을 확인하였다.

점진적 특징 가중치 기법을 이용한 나이브 베이즈 문서분류기의 성능 개선 (Improving Naïve Bayes Text Classifiers with Incremental Feature Weighting)

  • 김한준;장재영
    • 정보처리학회논문지B
    • /
    • 제15B권5호
    • /
    • pp.457-464
    • /
    • 2008
  • 실제 운용 환경에서 자동문서분류시스템의 성공을 위해서 충분하지 못한 학습문서의 문제와 특징 공간들에 대한 사전지식이 없는 상황을 해결하는 것이 관건이다. 이런 맥락에서 많은 자동문서분류 시스템의 구축을 위해 나이브 베이즈 문서분류 알고리즘을 사용한다. 이는 기존 학습된 분류모델과 특징 공간을 점진적으로 갱신함으로써 분류모델을 향상시키는 것이 매우 용이하기 때문이다. 본 논문에서는 특징 가중치를 이용하여 문서분류기의 성능을 향상시키는 기법을 제안한다. 기본 아이디어는 문서분류 모델의 인자로서 특징들의 분포뿐만 아니라 각 특징들의 중요도를 반영하는 것이다. 속성 선택을 미리 수행하여 학습모델을 만드는 것이 아니라, 속성 중요도를 나이브 베이즈 학습 모델에 포함시킴으로써 보다 정확한 모델을 생성할 수 있다. 또한 동적 환경에서 점진적인 특징 가중치 부여를 위해 기존의 특징 갱신 기법을 확장한 알고리즘도 제안한다. 본 논문에서 제안된 기법을 평가하기 위해서 Reuters-21578과 20Newsgroup 문서집합 이용한 실험을 실시하여, 제안된 기법이 전통적인 나이브 베이즈 분류기의 성능을 크게 향상시킴을 증명한다.

무응답을 가지고 있는 범주형 자료에 대한 모형 선택 방법 (Model selection method for categorical data with non-response)

  • 윤용화;최보승
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권4호
    • /
    • pp.627-641
    • /
    • 2012
  • 본 연구는 다차원 분할표 형태로 정리된 범주형 자료가 결측치나 무응답을 가지고 있을 때 주어진 자료를 가장 잘 설명하고 예측의 정확도를 높일 수 있는 모형의 추정과 모형의 선택 문제를 다루었다. 무시할 수 없는 무응답 (non-ignorable non-response)체계하에서 최대우도 추정에서 발생할 수 있는 변방값 문제를 해결하기 위하여 계층적 베이지안 모형을 고려하였다. 또한 모형 적도를 높이기 위한 변수 조합을 찾는 모형 선택의 문제를 함께 다루었다. 베이지안 접근하에서 모형 선택의 문제를 다루기 위하여 베이즈 인자 (Bayes factor)를 모형 선택의 기준으로 이용하였다. 제시된 방법은 2004년 실시된 우리나라 국회의원 선거를 앞두고 수행된 여론조사 데이터를 이용하여 실증분석을 수행하였다. 분석결과 무시할 수 없는 무응답 체계하에서 설명변수로 투표참여여부를 이용하는 것이 가장 적합한 모형으로 판명되었다.

ISSR 표지자를 이용한 느릅나무 자연집단의 유전변이 분석 (Population Genetic Variation of Ulmus davidiana var. japonica in South Korea Based on ISSR Markers)

  • 안지영;홍경낙;이제완;양병훈
    • 한국산림과학회지
    • /
    • 제102권4호
    • /
    • pp.560-565
    • /
    • 2013
  • 국내의 느릅나무(Ulmus davidiana var. japonica) 집단에 대한 유전구조와 유전다양성을 분석하였다. 느릅나무 7개 자연집단, 171개체에 대하여 7개 ISSR 표지자를 이용하여 총45개의 다형적 증폭산물을 확인하였다. 유효대립인자와 다형적 유전자좌 비율의 평균값은 1.5개와 89%이었다. Shannon의 다양성 지수(I)가 0.435, 빈도주의 방법에 의한 이형접합도 기대치($H_e$)는 0.289, 베이즈 추정에 의한 이형접합도 기대치(hs)가 0.323으로 나타났다. AMOVA 분석에서 느릅나무 집단의 유전변이 중 4.2%가 집단간 차이(${\Phi}_{ST}=0.042$)에 기인하였으며, 95.8%를 집단내 개체들이 보유하고 있었다. 베이즈 추정에 의한 집단간 유전분화율(${\theta}^{II}$)은 0.043으로 나타났다. 국내 느릅나무 집단의 유전다양성은 다른 느릅나무속 수종과 유사한 수준에 해당하였으나, 집단간 유전분화 정도는 매우 낮았다. 베이즈 근사추정에서 집단별 고정지수(평균 $PS-F_{IS}=0.822$)나 집단 특이적 유전분화율(평균 $PS-F_{ST}=0.101$)에서 유의할 만한 차이를 보이는 집단은 없었다. 군집분석과 주성분분석에서 7개의 집단들을 3개 군집으로 나눌 수 있었으나, 두 방법의 군집 양상은 일치하지 않았다. 또한 베이즈 군집분석에서 집단간 유연관계와 지리적 분포의 상관성을 확인할 수 없었다.

디폴트 베이즈인자를 이용한 포아송 평균모수에 대한 다중검정 (A Multiple Test of a Poisson Mean Parameter Using Default Bayes Factors)

  • 김경숙;손영숙
    • 품질경영학회지
    • /
    • 제30권2호
    • /
    • pp.118-129
    • /
    • 2002
  • A multiple test of a mean parameter, λ, in the Poisson model is considered using the Bayes factor. Under noninformative improper priors, the intrinsic Bayes factor(IBF) of Berger and Pericchi(1996) and the fractional Bayes factor(FBF) of O'Hagan(1995) called as the default or automatic Bayes factors are used to select one among three models, M$_1$: λ< $λ_0, M$_2$: λ= $λ_0, M$_3$: λ> $λ_0. Posterior probability of each competitive model is computed using the default Bayes factors. Finally, theoretical results are applied to simulated data and real data.

베이즈 이론을 활용한 적정 하천설계빈도 결정 (Determination of the Optimal Return Period for River Design using Bayes Theory)

  • 류재희;이진영;김지은;김태웅
    • 대한토목학회논문집
    • /
    • 제38권6호
    • /
    • pp.793-800
    • /
    • 2018
  • 본 연구는 최근 빈번히 발생하는 홍수재해에 대비하고 안정적인 치수대책 수립을 위하여 공학적 판단에 근거한 하천의 적정 설계빈도 결정방안을 제시하였다. 지방하천의 설계빈도는 하천의 중요도 및 지역특성에 따라 최소 50년부터 최대 200년까지 설정되고 있으나, 적용범위가 넓어 하천의 지형적, 치수적 특성을 제대로 반영하지 못하는 실정이다. 본 연구에서는 지방하천의 적정 설계빈도를 결정하기 위하여 7개의 평가인자(시가화 침수면적, 유역면적, 형상계수, 하도경사, 수계 및 하천차수, 배수영향구간, 이상강우 발생빈도)에 대하여 베이즈 이론을 적용하여 가중치를 산정하였다. 또한, 기후변화를 고려한 홍수피해잠재능을 산정하였고, 시군구별 잠재능을 구분하여 적정 설계빈도를 결정하였다. 충청남도 382개 지방하천에 대하여 현행 설계빈도의 적정성을 평가하였다. 382개의 현행 하천설계빈도보다 상향되는 하천은 65개 하천으로 상대적으로 시가화 침수면적이 크게 산정되고 홍수피해잠재능이 큰 지역의 하천이며, 하향되는 하천은 169개로 분석되었다.