• Title/Summary/Keyword: 사전분포

Search Result 554, Processing Time 0.024 seconds

Bayesian Testing for the Equality of K-Exponential Populations (K개 지수분포의 상등에 관한 베이지안 다중검정)

  • Moon, Kyoung-Ae;Kim, Dal-Ho
    • Journal of the Korean Data and Information Science Society
    • /
    • v.12 no.1
    • /
    • pp.41-50
    • /
    • 2001
  • We propose the Bayesian testing for the equality of K-exponential populations means. Specially we use the intrinsic Bayesian factors suggested by Beregr and Perrichi (1996,1998) based on the noninformative priors for the parameters. And, we investigate the usefulness of the proposed Bayesian testing procedures via simulations.

  • PDF

Bayesian Testing for the Equality of Two Lognormal Populations with the fractional Bayes factor (부분 베이즈요인을 이용한 로그정규분포의 상등에 관한 베이지안검정)

  • Moon, Kyoung-Ae;Kim, Dal-Ho
    • Journal of the Korean Data and Information Science Society
    • /
    • v.12 no.1
    • /
    • pp.51-59
    • /
    • 2001
  • We propose the Bayesian testing for the equality of two Lognormal population means. Specially we use the fractional Bayesian factors suggested by O'Hagan (1995) based on the noninformative priors for the parameters. In order to investigate the usefulness of the proposed Bayesian testing procedures, we compare it with classical tests via both real data analysis and simulations.

  • PDF

HMM Topology Optimization using Model Prior Estimation (모델의 사전 확률 추정을 이용한 HMM 구조의 최적화)

  • ;;Alain Biem;Jayashree Subrahmonia
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.325-327
    • /
    • 2001
  • 본 논문은 온라인 문자 인식을 연속 밀도 HMM의 구조의 최적화 문제를 다룬다. 최적이란 최소한의 모델 파라미터를 사용하여 최소한의 오류를 허용하는 것이라고 정의할 수 있다. 본 연구에서는 HMM 구조의 최적화를 위해 Bayesian 모델 선택 방법론을 사용한다. 먼저 잘 알려진 BIC(Bayesian Information Criterion)을 적용해보고, 그것을 HMM의 복잡한 구조에 적합하도록 본 논문에서 제안한 HBIC(HMM-Oriented BIC)와 비교해본다. BIC는 모델의 사전 확률 분포를 추정하지 않고 다변량 정규분포라고 가정하는데 비해 HBIC는 모델의 각 파라미터로부터 사전 확률을 추정한 후 그것들을 사용함으로써 더 좋은 결과를 얻도록 한다. 실험 결과 BIC와 HBIC 둘 다 기존 방법보다 모델의 파라미터 수를 현저히 감소시킴을 확인했고, HBIC가 BIC에 비해 더 적은 수의 파라미터를 사용해도 비슷한 인식률을 얻을 수 있었다.

  • PDF

Launch Vehicle Reliability Analysis (발사체 신뢰도 분석)

  • 한풍규;김경호;우유철;조상연;김용욱
    • Proceedings of the Korean Society of Propulsion Engineers Conference
    • /
    • 2003.05a
    • /
    • pp.76-79
    • /
    • 2003
  • 주요 우주 발사체 보유 국가에서 1957년부터 1999년 사이에 발사된 우주 발사체의 성공 및 실패 이력에 대해 베이즈 분석기법을 적용하여 각국의 발사체에 대한 신뢰도를 분석하였다. 베이즈 분석기법에서 사전분포함수로는 베타함수를 사용하였으며, 미래의 발사체 성공률을 표현하는 사후분포함수는 년도별 누적된 발사 이력을 반영한 베타 사전함수를 이용하여 년도마다 발사체 신뢰도를 평가하는 경우와 첫 발사부터 1999년까지의 발사 성공률에 대한 평균과 분산을 반영할 베타 사전함수를 이용하여 년도별 발사체 신뢰도를 구하는 경우로 나누어 구하였다. 발사 이력이 많은 국가의 경우에는 베이즈 분석기법으로 구한 성공률과 산술적으로 구한 성공률은 거의 동일하였으나, 발사 이력이 적은 국가에서는 비교적 큰 차이를 나타내었다 따라서 발사 이력이 적은 경우에는 산술적 평균에 의한 성공률보다는 베이즈 기법을 이용한 향후 발사체의 발사 성공률 분석이 우주 발사체의 신뢰도를 평가하는데 적합하다는 것을 알 수 있었다.

  • PDF

Keyword Data Analysis Using Bayesian Conjugate Prior Distribution (베이지안 공액 사전분포를 이용한 키워드 데이터 분석)

  • Jun, Sunghae
    • The Journal of the Korea Contents Association
    • /
    • v.20 no.6
    • /
    • pp.1-8
    • /
    • 2020
  • The use of text data in big data analytics has been increased. So, much research on methods for text data analysis has been performed. In this paper, we study Bayesian learning based on conjugate prior for analyzing keyword data extracted from text big data. Bayesian statistics provides learning process for updating parameters when new data is added to existing data. This is an efficient process in big data environment, because a large amount of data is created and added over time in big data platform. In order to show the performance and applicability of proposed method, we carry out a case study by analyzing the keyword data from real patent document data.

베이즈 p-값의 제안 및 그 성질에 대한 연구

  • Hwang, Hyeong-Tae;O, Hui-Jeong
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2002.11a
    • /
    • pp.159-162
    • /
    • 2002
  • 일반적으로 p-값은 귀무가설에 의하여 주어지는 통계적 모형과 현재 관측치 사이의 호환성의 측도로써 가장 널리 쓰이는 개념중의 하나로 간주될 수 있다. 이 연구에서는 고전통계학에서의 고전적 p-값에 대응하는 베이즈 관점에서의 베이즈 p-값을 제안하고 그 성질에 대하여 고찰한다.

  • PDF

말뭉치에 근거한 한국어 사전 표제어 구성

  • Park, Yeong-Hwan;Yun, Jun-Tae;Song, Man-Seok
    • Annual Conference on Human and Language Technology
    • /
    • 1991.10a
    • /
    • pp.58-65
    • /
    • 1991
  • 사전은 자연어를 처리하는 핵심 부분을 이루고 있다. 그러나 기존의 한국어 사전은 기계적인 처리에 직접 이용하기에는 크게 미흡하다. 특히, 사전의 기본을 이루는 표제어 수록에 관한 연구는 더욱 취약한 형편이다. 본 연구는 새로운 한국어 사전의 표제어률 구성하기 위하여 대형 말뭉치를 수집하였다. 이 말뭉치를 이용하여 기존 사전에서 빠져있는 미등록어들을 찾아내어 수록하고, 말뭉치에 나타난 각 단어의 출현 빈도를 조사하였다. 이 연구를 수행하기 위하여 형태소 분석기, 용례 분석기 등의 필수적인 텍스트 처리 도구들을 개발하였다. 또한, 말뭉치에 나타난 어절 단위의 오류 분포를 조사하여 밝히었다.

  • PDF

커널 판별분석의 오분류확률에 대한 붓스트랩 조정

  • 백장선
    • Communications for Statistical Applications and Methods
    • /
    • v.2 no.2
    • /
    • pp.249-265
    • /
    • 1995
  • 본 논문에서는 확률분포가 알려져 있지 않은 두 모집단 중 어느 하나로 새로운 관측치를 분류할 때 오분류확률이 분석자에 의해 사전에 정해진 수준에 부합할 수 있도록 커널 판별함수의 임계치를 결정하였다. 정해진 오분류확률을 만족시키기 위한 판별함수의 임계치는 붓스트랩(bootstrap)기법을 판별 함수에 적용시켜 계산된다. 본 논문에서 제시도된 방법은 모집단에 대한 모수적 가정이 없으므로 어느 분포에도 적용가능하며, 모집단이 정규분포, 대수정규분포, 이산형과 연속형 변수가 혼합된 분포의 경우 모의실험을 통하여 그 성능에 대한 검증을 하였다.

  • PDF

Introduction to variational Bayes for high-dimensional linear and logistic regression models (고차원 선형 및 로지스틱 회귀모형에 대한 변분 베이즈 방법 소개)

  • Jang, Insong;Lee, Kyoungjae
    • The Korean Journal of Applied Statistics
    • /
    • v.35 no.3
    • /
    • pp.445-455
    • /
    • 2022
  • In this paper, we introduce existing Bayesian methods for high-dimensional sparse regression models and compare their performance in various simulation scenarios. Especially, we focus on the variational Bayes approach proposed by Ray and Szabó (2021), which enables scalable and accurate Bayesian inference. Based on simulated data sets from sparse high-dimensional linear regression models, we compare the variational Bayes approach with other Bayesian and frequentist methods. To check the practical performance of the variational Bayes in logistic regression models, a real data analysis is conducted using leukemia data set.

A Comparison study of Hybrid Monte Carlo Algorithm

  • 황진수;전성해;이찬범
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2000.11a
    • /
    • pp.135-140
    • /
    • 2000
  • 베이지안 신경망 모형(Bayesian Neural Networks Models)에서 주어진 입력값(input)은 블랙 박스(Black-Box)와 같은 신경망 구조의 각 층(layer)을 거쳐서 출력값(output)으로 계산된다. 새로운 입력 데이터에 대한 예측값은 사후분포(posterior distribution)의 기대값(mean)에 의해 계산된다. 주어진 사전분포(prior distribution)와 학습데이터에 의한 가능도함수(likelihood functions)를 통해 계산되어진 사후분포는 매우 복잡한 구조를 갖게 됨으로서 기대값의 적분계산에 대한 어려움이 발생한다. 이때 확률적 추정에 의한 근사 방법인 몬테칼로 적분을 이용한다. 이러한 방법으로서 Hybrid Monte Carlo 알고리즘은 우수한 결과를 제공하여준다(Neal 1996). 본 논문에서는 Hybrid Monte Carlo 알고리즘과 기존에 많이 사용되고 있는 Gibbs sampling, Metropolis algorithm, 그리고 Slice Sampling등의 몬테칼로 방법들을 비교한다.

  • PDF