• 제목/요약/키워드: Bayesian 통계방법

검색결과 180건 처리시간 0.035초

비정상 자기회귀모형에서의 벌점화 추정 기법에 대한 연구 (Model selection for unstable AR process via the adaptive LASSO)

  • 나옥경
    • 응용통계연구
    • /
    • 제32권6호
    • /
    • pp.909-922
    • /
    • 2019
  • 벌점화 추정 기법 중 adaptive LASSO 방법은 모형 선택과 모수 추정을 동시에 할 수 있는 유명한 방법으로 이미 정상 자기회귀모형에서 연구된 적이 있다. 본 논문에서는 이를 확장하여 확률보행과정과 같은 비정상 자기회귀모형에서 adaptive LASSO 추정량이 갖는 성질을 모의실험을 통해 연구하였다. 다만 비정상 자기회귀모형에서는 단위근의 존재 여부를 판단하는 것과 모형의 차수를 선택하는 것이 가장 중요하므로, 이를 위해 원 자기회귀모형이 아닌 ADF 검정에서 고려하는 회귀모형으로 변환하여 adaptive LASSO를 적용하였다. 일반적으로 Adaptive LASSO를 적용할 때 조절모수의 선택이 가장 중요한 문제이며, 본 논문에서는 교차검증, AIC, BIC 세 가지 방법을 이용하여 조절모수를 선택하였다. 모의실험 결과를 보면, 이 중에서 BIC가 최소가 되도록 선택한 조절모수에 대응되는 adaptive LASSO 추정량이 단위근의 존재 여부를 잘 판단할 뿐만 아니라 자기회귀모형의 차수 또한 비교적 정확하게 선택함을 확인할 수 있다.

영과잉 포아송 회귀모형에 대한 베이지안 추론: 구강위생 자료에의 적용 (Bayesian Analysis of a Zero-inflated Poisson Regression Model: An Application to Korean Oral Hygienic Data)

  • 임아경;오만숙
    • 응용통계연구
    • /
    • 제19권3호
    • /
    • pp.505-519
    • /
    • 2006
  • 셀 수 있는 이산 자료(discrete count data)에 대한 분석은 여러 분야에서 활용되고 있지만 영(zero)을 과도하게 포함하고 있는 영과잉 자료는 자료의 성격상 포아송 분포를 따르지 못할 때가 있어 분석에 어려움이 따른다. Zero-Inflated Poisson(ZIP)모형은 이런 어려움을 극복하기 위하여 영에 대한 점확률을 가지는 분포와 포아송 분포를 합성하여 과도한 영과 영이 아닌 자료를 설명하는 모형이다. 설명 변수가 존재할 때는 포아송 분포 부분에서 반응변수의 평균과 공변량사이에 로그선형 연결함수를 사용한 Zero-Inflated Poisson Regression(ZIPR)모형이 사용될 수 있다. 본 논문에서는 Markov Chain Monte Carlo 기법을 이용한 ZIPR모형의 베이지안 추론방법을 제안하고, 이를 실제 구강위생 자료에 적용하며 다른 모형들과 비교한다. 그 결과 베이지안 추론 방법을 적용한 영과잉 모형의 추정오차가 다른 모형들의 추정오차보다 작았고, 예측치가 더 정확했다는 점에서 우수함을 알 수 있었다.

베이지안 음이항 분기과정을 이용한 한국 메르스 발생 연구 (A study on MERS-CoV outbreak in Korea using Bayesian negative binomial branching processes)

  • 박유하;최일수
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권1호
    • /
    • pp.153-161
    • /
    • 2017
  • 전염병 확산에 대한 확률과정모형으로 활용되는 분기과정은 실제 데이터를 통해 모수를 추정할 수 있다는 장점이 있다. 음이항 분포를 분기과정의 생산 분포 모형으로 적용할 수 있는데 음이항 분포를 적용하기 위해서는 평균과 산포 모수를 추정하여야한다. 기존의 생물학 연구와 역학 연구 분야에서는 이를 최대우도법을 이용하여 추정하고 있다. 그러나 대부분의 역학 자료의 특성상 분기과정에서 이용되는 음이항 분포는 소표본이어서 최대우도 추정량의 정도를 충족시킬 수 없다. 본 논문에서는 소표본 자료에서 좋은 통계량의 성질을 만족한다고 알려져 있는 베이지안을 이용하여 모수를 추정하는 방법을 제안한다. 2015년 국내 메르스 사례에 베이지안 방법을 적용하여 모수를 추정하고 사후 분포를 적합하였다. 그 결과 어떠한 사전 분포를 가정하더라도 안정적으로 모수를 추정하는 것을 알 수 있었다. 추정된 산포 모수를 이용하여 분기과정에서의 전염병 소멸 확률을 유도하였다.

바이어스필드에 의해 왜곡된 MRI 영상자료분할을 위한 EM 알고리즘 기반 접근법 (EM Algorithm-based Segmentation of Magnetic Resonance Image Corrupted by Bias Field)

  • 김승구
    • 응용통계연구
    • /
    • 제16권2호
    • /
    • pp.305-319
    • /
    • 2003
  • 본 연구에서는 바이어스 필드에 의해 왜곡된 MRI 영상에 대한 분할을 위해 확장된 EM 알고리즘을 기반으로 한 통계적 접근법을 제시한다. 영상의 명암값을 자료로 하는 분할기법들은 고주파 성분의 잡음 뿐만 아니라 영상을 불균질하게 만드는 바이어스 필드라는 저주파 성분의 왜곡에 특히 취약하다. 이 문제를 해결하기 위해 본 논문에서는 잡음을 효과적으로 제어하기 위해 마코프랜덤필드가 적용된 정규혼합모형을 고려하며, 효과적인 바이어스 필드의 보정을 위해 페널티-우도를 도입하여 추정하는 방법으로 고안되었다.

패널자료에서의 항목무응답 대체 방법 비교 (Comparison of imputation methods for item nonresponses in a panel study)

  • 이혜정;송주원
    • 응용통계연구
    • /
    • 제30권3호
    • /
    • pp.377-390
    • /
    • 2017
  • 설문조사를 실시할 때 응답자가 설문조사의 일부 문항에 대하여 응답하지 않는 경우 항목무응답이 발생한다. 무응답이 발생한 자료를 제외하고 완전하게 응답된 자료 만에 근거한 분석은 분석 결과에 편의가 발생할 수 있으므로, 이를 채워 넣어 완전한 형태의 자료로 분석하기 위해서 무응답 대체가 흔히 사용되고 있으며 여러 가지 무응답 대체 기법들을 비교하는 연구들도 많이 존재한다. 패널조사 연구는 연구 대상 패널에 대하여 정해진 시간에 따라 반복적으로 동일한 설문 문항에 대하여 응답을 조사하여 시간에 따른 변화를 살펴보는 조사 방법을 나타낸다. 패널조사 자료의 항목 무응답을 대체할 때 이전 시점의 응답 자료가 존재한다면 이를 포함하여 대체를 실시하는 것이 바람직한 것으로 여겨져 왔으나 이에 관한 직접적인 연구는 찾기 힘들다. 따라서 본 연구에서는 패널자료에서 이전 시점의 정보를 고려하지 않고 대체를 실시하는 방법과 이전 시점의 정보를 활용하여 대체하는 방법들 중에서 어느 대체 방법이 보다 적절한 대체를 제공하는지 살펴보았다. 특히 이전 시점의 응답 정보를 이용하는 방법인 비대체, 선형혼합모형을 이용한 대체와 선형혼합모형에 근거한 베이지안 대체 방법을 고려하였고, 이를 이전 시점의 정보를 고려하지 않는 대체 방법들 중 흔히 사용되는 평균대체, 핫덱대체 방법과 비교하였다. 모의실험 결과 선형혼합모형에 근거한 베이지 안 대체 방법이 다른 대체 방법에 비해 무응답 비율이 높아지더라도 편의도 작으며 평균에 관한 95% 신뢰구간의 포함률도 높게 나타나서 가장 좋은 대체 방법으로 확인되었다.

The Changing Point Analysis of Annual Maximum Rainfall

  • 성장현;강현석;박수희;조천호;김영오
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2011년도 학술발표회
    • /
    • pp.22-22
    • /
    • 2011
  • 기존의 빈도해석(frequency analysis) 방법은 자료의 정상성(stationarity)을 가정하고 있다. 즉, 자료 분포가 기상에 영향을 받는 정도가 통계적으로 유의하지 않다는 것을 의미하는데 최근의 관측값들은 주기를 나타내거나 증가, 감소하는 경향을 자주 보이고 있고 이는 정상성에 대한 가정이 더 이상 유효하지 않음을 의미한다. 본 연구는 최근 증가경향이 두드러지게 나타나고 있는 관측 연최대 일강우량을 대상으로 증가 변동점(changing point)을 탐색하였다. 이를 위하여 Barry and Hartigan이 1999년에 제안한 BCP (Bayesian Change Point) 방법을 우리나라 전체 강우 관측지점에 적용하였다. 적용 결과, 2000년대를 기준으로 이전의 관측값과 통계적 특성이 다른 관측값들이 많이 발생하는 것을 알 수 있었다. 향후, 매개변수와 시간의 회귀분석(regression analysis)으로 확률분포형의 미래 매개변수를 구하는 비정상성 빈도해석 방법 적용시, BCP 결과로 얻은 변동점을 바탕으로 회귀분석의 구간을 적절하게 선택한다면 계산된 결과의 신뢰성이 더욱 향상되리라 본다.

  • PDF

자동차보험 신뢰도 적용에 대한 베이지안 추론 방식 연구 (A study of Bayesian inference on auto insurance credibility application)

  • 김명준;김영화
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권4호
    • /
    • pp.689-699
    • /
    • 2013
  • 본 연구는 가격 경쟁으로 인하여 최근 들어 요율 세분화가 심화되고 있는 자동차보험 시장에서, 부분 신뢰도의 적용 대상에 대한 경험적 사전분포 (empirical prior distribution) 함수 또는 무정보적 사전분포 (noninformative prior distribution) 정보의 가정을 통한 신뢰도 산출 방식에 대하여 살펴보았다. 요율 세분화의 확대로 가격 산출 단위의 수가 증가될 경우, 부분 신뢰도의 적용 대상은 점차 증가되게 될 것으로 판단되기 때문에, 기존에 제시된 신뢰도 적용 방식을 베이지안 프레임에서 적용, 추론함으로써 보다 다양하고 정교한 방식으로 그 활용 범위를 넓히고자 한다. 즉, 경험적으로 사용되는 사전 분포함수 또는 무정보적 사전 정보를 통하여 적절한 사후분포 (posterior distribution)함수를 도출하고 오차를 최소화하는 베이즈 통계량을 적용한 신뢰도를 추정하여 적용함으로써, 위험도 예측에 있어 기존에 제시된 방법과 비교하여 그 효용성을 입증하고자 한다. 현재 가장 많이 활용되는 제곱근 법칙 (square root rule)의 신뢰도 추정 방식에 베이지안 추론에서 도출된 통계량을 반영한 결과를 분석하여 실질적인 위험도에 수렴하는 수준을 비교하게 된다. 이는 이론적으로 위험도 예측에서 오차를 줄이는 방식에 대한 대안 제시와 더불어 신뢰도 적용 방식에 대한 추가적인 활용 대안을 보험업계에 제시함으로써 요율 세분화로 인한 부분 신뢰도 적용방식에 대한 그 이해와 활용의 폭을 넓히고자 한다.

나이브베이즈 문서분류시스템을 위한 선택적샘플링 기반 EM 가속 알고리즘 (Accelerating the EM Algorithm through Selective Sampling for Naive Bayes Text Classifier)

  • 장재영;김한준
    • 정보처리학회논문지D
    • /
    • 제13D권3호
    • /
    • pp.369-376
    • /
    • 2006
  • 본 논문은 온라인 전자문서환경에서 전통적 베이지안 통계기반 문서분류시스템의 분류성능을 개선하기 위해 EM(Expectation Maximization) 가속 알고리즘을 접목한 방법을 제안한다. 기계학습 기반의 문서분류시스템의 중요한 문제 중의 하나는 양질의 학습문서를 확보하는 것이다. EM 알고리즘은 소량의 학습문서집합으로 베이지안 문서분류 알고리즘의 성능을 높이는데 활용된다. 그러나 EM 알고리즘은 최적화 과정에서 느린 수렴성과 성능 저하 현상을 나타내는데, EM 알고리즘의 기본 가정을 따르지 않는 온라인 전자문서환경에서 특히 그러하다. 제안 기법의 주요 아이디어는 전통적 EM 알고리즘을 개선하기 위해 불확정성도 기반 선택적 샘플링 기법을 활용한 것이다. 성능평가를 위해 Reuter-21578 문서집합을 사용하여, 제안 알고리즘의 빠른 수렴성을 보이고 전통적 베이지안 알고리즘의 분류 정확성을 향상시켰음을 보인다.

미계측 지역 기후변화 평가를 위한 격자 기반 통계적 상세화 기법 개발 (A development of grid-based spatial downscaling for climate change assessment in regions with sparse ground data networks)

  • 김용탁;정민규;김민지;권현한
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.41-41
    • /
    • 2021
  • 최근 전 세계적으로 급증하는 기후변화의 영향으로 이상기후로 인한 자연재해들의 강도 및 발생 빈도의 증가가 다양한 연구를 통하여 확인되고 있으며, 이를 대비 및 대응하기 위한 방안수립 연구가 세계의 가장 중요한 주제로 부상되고 있다. 우리나라의 경우에는 기후변화에 따른 심각성 문제가 대두되고 있지만 국가적 대응기반조성 및 수자원정책 의사결정에 직접적으로 활용될 수 있는 일관성 있고 통합적인 기후 정보가 부족한 실정이다. 미래 기상 변동성을 나타내는 기후모델은 전 지구적 대규모 기상장(large scale climate pattern)을 비교적 정확하게 묘사하는 것으로 알려져 있으나 모형에 내재해 있는 시·공간적 편의(spatial-temporal bias) 및 불확실성으로 인하여 통계학적 상세화가 필수적으로 요구된다. 이러한 편향성은 일반적으로 지상 관측 자료를 격자에 보간하여 보정하는 방법이 적용되고 있지만, 관측자료의 불연속성 및 관측소의 불균등성으로 인하여 공간적 신뢰성이 낮다. 이에, 본 연구에서는 Bayesian 기반의 Kriging을 통한 공간적 편의보정 및 QDM(quantile delta mapping)을 연계한 새로운 격자 기반의 통계적 상세화 모형 Bayesian Kriging-QDM을 개발하였다. 본 연구를 통하여 산정된 결과는 과거자료에 근거하여 이루어지는 기존의 보수적인 수자원 관리 체계의 위험성을 저감 시킬 수 있는 의사결정에 직접적으로 활용될 수 있는 기초 자료로 이용 가능할 것으로 판단된다.

  • PDF

한우의 도체형질 유전모수 추정을 위한 REML과 Bayesian via Gibbs Sampling 방법의 비교 연구 (Comparison between REML and Bayesian via Gibbs Sampling Algorithm with a Mixed Animal Model to Estimate Genetic Parameters for Carcass Traits in Hanwoo(Korean Native Cattle))

  • 노승희;김병우;김효선;민희식;윤호백;이득환;전진태;이정규
    • Journal of Animal Science and Technology
    • /
    • 제46권5호
    • /
    • pp.719-728
    • /
    • 2004
  • 본 연구는 한우의 도체형질들에 대한 유전적 변이를 분석방법에 따라 어떠한 차이가 있는지를 알아보고자 한우 후대검정자료를 이용하여 분석하였다. 분석에 이용된 도체성적 관련 자료는 가축개량사업소와 한우개량단지에서 1996 년부터 2001 년까지 태어난 후대검정우 1526두로부터 조사었다. 한우에 있어서 주요 개량형질인 육량과 육질에 영향하는 도체중, 도체율,배최장근단면적, 등지방두께, 근내지방도를 대상으로 유전력과 유전상관을 추정하였다. 유전모수 추정에 있어서 REML 분석법과 Bayesian추론방법으로써 Gibbs Sampling 분석법을 사용하였는데 각각의 모수들에 대한 Gibbs Sampler는 100,000회 실시하였고 초기 1,000회는 모수의 사후분포에 대한 부정확성으로 간주하여 모수의 사후분포특성 규명에서 제외하였다. 각각의 형질들에 대한 유전변이는 이러한 두 가지 분석방법을 상호 비교 함으로써 최적의 통계분석 방법을 모색하였다. 도체형질에 대한 유전력 추정은 REML 방법을 통한 추정에서는 근내지방도가 0.51로 고도의 유전력을 보였고, 도체율이 0.25로 중도의 유전력이 추정되었다. Gibbs Sampling 방법을통한 추정에서도 근내지방도가 0.54로 고도의 유전력을 도체율에서 0.25로 중도의 유전력을 보였다. REML 분석방법과 Gibbs Sampling 분석방법에서의 유전력은 다소 큰 차이는 보이지 않았으나, 대체로 Gibbs Sampling 방법으로 분석한 유전력 추정치가 높게 추정되었다. 그리고, 유전상관분석에서는 REML 방법을 통한 분석에서 도체중과 배최장근단면적에서 0.651 로 높은 정의 유전상관을 나타내었고, 배최장근단면적과 등지방두께에서 -0.139로 부의 유천상관을 나타내었다. Gibbs Sampling 방법에서는 도체중과 도체율, 배최장근단면적에서 각각 0.814, 0.695으로 높은 정의 상관을 나타내었고, 배최장근단면적과 등지방두께에서 -0.126으로 부의상관을 나타내었다. Gibbs Sampling방법을 통한 분석에서 특정 형질간 유전상관이 높게 나타났으며, 다소 큰 차이를 보이지 않았다. REML 분석방법과 Bayesian Inference를 바탕으로 한 Gibbs Sampling 분석에서 모수 추정은 큰 차이를 보이지 않았다. 따라서 방대한 현장정보를 활용하여 보다 정확한 모수 추정을 수행하기 위해서는 분석모형에 대한 계수행렬의 역행렬 계산을 통한 REML 방법의 한계성을 극복할 수 있는 방법으로써 Gibbs Sampling 분석 방법이 가능할 것으로 사료된다.