• Title/Summary/Keyword: 베이즈 방법론

Search Result 11, Processing Time 0.02 seconds

베이즈주의와 제거적 귀납주의

  • Yeo, Yeong-Seo
    • Korean Journal of Logic
    • /
    • v.7 no.2
    • /
    • pp.121-146
    • /
    • 2004
  • 본 논문은 베이즈주의가 확률론을 이용해서 제거적 귀납을 정교하게 발전시키고 있다고 주장한다. 이를 위해 본 논문은 두 가지 작업을 진행한다. 하나는 제거적 귀납이 무엇인가 하는것이고 다른 하나는 제거적 귀납이 베이즈주의에 기여하는 바가 무엇인가 하는 것이다. 먼저 본 논문은 제거적 귀납이 참인 가설을 포함하는 가능한 가설들의 총체로부터 경쟁가설들을 연역적 또는 귀납적으로 제거하고 남는 가설을 선택하는 추론형식임을 밝히고, 이 때 베이즈주의는 제거적 귀납을 정교하게 발전시킨 모습이기 때문에 제거적 귀납으로부터 기술적으로 도움 받을 측면은 없다고 주장한다. 그 대신 본 논문은 베이즈주의가 과학방법론으로 발전되는 데에서 직면하는 여러 가지 문제점을 해결하는 방법에 대해 제거적 귀납으로부터 조언을 얻을 수 있다고 주장한다. 이와 같은 논의를 통해 본 논문은 베이즈주의와 제거적 귀납주의의 결합은 유용한 과학방법론을 만들 수 있을 것으로 전망한다.

  • PDF

The Analysis of Roll Call Data from the 18th Korean National Assembly: A Bayesian Approach (제 18대 국회 기명투표 분석: 베이즈(Bayesian) 방법론 적용)

  • Hahn, Kyu S.;Kim, Yuneung;Lim, Jongho;Lim, Johan;Kwon, Suhyun;Lee, Kyeong Eun
    • The Korean Journal of Applied Statistics
    • /
    • v.27 no.4
    • /
    • pp.523-541
    • /
    • 2014
  • We apply a Bayesian estimation procedure to the analysis of roll call voting records on 2,389 bills processed during the 18th Korean National Assembly. The analysis of roll calls yields useful tools for to combining the measurement of legislative preference with the models of legislative behavior. The current Bayesian procedure is extremely exible, applicable to any legislative setting, irrespective of the extremism of the legislator's voting history or the number of roll calls available for analysis. It can be applied to any legislative settings, providing a useful solution to many statistical problems inherent in the analysis of roll call voting records. We rst estimate the ideal points of all members of the 18th National Assembly and their condence intervals. Subsequently, using the estimated ideal points, we examine the factional disparity within each major party using the estimated ideal points. Our results clearly suggest that there exists a meaningful ideological spectrum within each party. We also show how the Bayesian procedure can easily be extended to accommodate theoretically interesting theoretical models of legislative behavior. More specically, we demonstrate how the estimated posterior probabilities can be used for identifying pivotal legislators.

Introduction to variational Bayes for high-dimensional linear and logistic regression models (고차원 선형 및 로지스틱 회귀모형에 대한 변분 베이즈 방법 소개)

  • Jang, Insong;Lee, Kyoungjae
    • The Korean Journal of Applied Statistics
    • /
    • v.35 no.3
    • /
    • pp.445-455
    • /
    • 2022
  • In this paper, we introduce existing Bayesian methods for high-dimensional sparse regression models and compare their performance in various simulation scenarios. Especially, we focus on the variational Bayes approach proposed by Ray and Szabó (2021), which enables scalable and accurate Bayesian inference. Based on simulated data sets from sparse high-dimensional linear regression models, we compare the variational Bayes approach with other Bayesian and frequentist methods. To check the practical performance of the variational Bayes in logistic regression models, a real data analysis is conducted using leukemia data set.

Understanding Bayesian Statistics

  • Jeong, Yun-Sik
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2002.11a
    • /
    • pp.61-68
    • /
    • 2002
  • 통계학은 불확실성(uncertainty)에 대한 연구이다. 베이지안 통계 방법은 불확실성 아래서 통계 추론과 의사 결정 모두를 위한 완전한(complete) 패러다임을 제공한다. 베이지안 방법론은 합리적인 초기 정보와 결합하는 것을 가능하게 만들고, 전통적인 통계적 방법론에 의하여 직면하는 많은 어려움들을 풀 수 있는 coherent 방법론을 제공하면서 엄격한 수학적 기본에 근거하고 있다. 베이지안 패러다임은 일반적인 용어로써 확률이란 단어의 사용을 가장 잘 어울리게 하는 불확실성의 조건부 측도(conditional measure of uncertainty)로써 확률의 해석에 근거한다. 관심있는 것에 대한 통계적 추론은 증거의 관점에서 그 값에 대한 불확실성의 변형으로써 묘사되며, 베이즈 정리(Bayes' theorem)는 이러한 변형이 어떻게 만들어지는 가를 자세히 설명할 수 있다. 베이지안 방법들은 전통적인 통계적 방법론에 접근할 없는 복잡하고, 다양한 구조적 문제들에 응용할 수 있다.

  • PDF

A Study on Pornographic Web Site Detection Based on Contents (콘텐츠 기반 음란물 사이트 검출에 관한 연구 동향)

  • Han, You-Na;Park, Sang-Sung;Shin, Young-Guen;Jang, Dong-Sik
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2008.02a
    • /
    • pp.143-146
    • /
    • 2008
  • 인터넷의 발전은 온라인상의 무한한 정보 이용을 가능케 하였다. 인터넷 상의 무한한 정보에는 유익한 정보도 있지만 그렇지 못한 유해한 정보도 있다. 대표적인 유해 정보인 음란물 사이트는 청소년들에게 쉽게 노출되어 심신건강에 악영향을 끼친다. 최근에는 이러한 음란물 사이트를 차단하기 위한 알고리즘 개발이 활발히 진행되고 있다. 본 논문에서는 음란물 사이트 차단을 위해 연구되고 있는 대표적인 알고리즘들의 성능 비료를 통하여 각 알고리즘의 취약점을 보완할 수 있는 새로운 방법론을 제시한다.

  • PDF

Bayesian Change Point Analysis for a Sequence of Normal Observations: Application to the Winter Average Temperature in Seoul (정규확률변수 관측치열에 대한 베이지안 변화점 분석 : 서울지역 겨울철 평균기온 자료에의 적용)

  • 김경숙;손영숙
    • The Korean Journal of Applied Statistics
    • /
    • v.17 no.2
    • /
    • pp.281-301
    • /
    • 2004
  • In this paper we consider the change point problem in a sequence of univariate normal observations. We want to know whether there is any change point or not. In case a change point exists, we will identify its change type. Namely, it can be a mean change, a variance change, or both the mean and variance change. The intrinsic Bayes factors of Berger and Pericchi (1996, 1998) are used to find the type of optimal change model. The Gibbs sampling including the Metropolis-Hastings algorithm is used to estimate all the parameters in the change model. These methods are checked via simulation and applied to the winter average temperature data in Seoul.

Estimation of Flood Damage Using Bayesian Approach (Bayesian 기법을 이용한 홍수피해액 산정)

  • You, Jong Hyun;Yi, Choong Sung;Kim, Hung Soo;Shim, Myung Pil
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2004.05b
    • /
    • pp.742-747
    • /
    • 2004
  • 최근 들어 지구온난화에 따른 이상기후 및 집중호우 빈발 그리고 급격한 도시화와 산업화는 예측하기 어려운 수문현상의 변화를 유발시키고 있다. 이에 따른 유출양상의 변화는 수문분석에 의한 기존의 설계기준에도 변화를 요구하고 있다. 즉, 설계빈도의 무조건적인 상향조정에 따른 확정론적인 방법에 의존하기보다는 수문량의 변화를 통계학적으로 반영한 수 있도록 불확실성 분석이 필요하게 되었다. 따라서 설계홍수량에 따른 범람면적별 홍수피해액을 산정할 때 설계홍수량에 대한 불확실성 분석을 수행함으로써 안전율을 고려 할 범람과 홍수피해액을 추정할 수 있는 것이다. 본 연구에서는 Bayesian에 의해 불확실성을 고려한 빈도별 설계홍수량을 산정하였으며, HEC-GeoRAS와 HEC-RAS 및 ArcView GIS 3.2a를 이용해 홍수범람면적을 수치지형도에 도시하고, 범람면적별 홍수피해액을 산정하였다. 또한, 불확실성을 고려하지 않은 경우에 대해서는 L-모멘트법을 이용해 설계홍수량을 구하고 홍수범람면적파 홍수피해액을 산정하였다. 불확실성의 고려 여부에 따른 설계홍수량과 예상 홍수피해액을 비교${\cdot}$분석한 결과 불확실성을 고려한 경우가 불확실성을 고려하지 않은 경우에 비해 설계홍수량은 $7\~33\%$, 예상 홍수피해액은 $1\~4\%$정도 차이를 보였다.

  • PDF

Bayesian estimation for frequency using resampling methods (재표본 방법론을 활용한 베이지안 주파수 추정)

  • Pak, Ro Jin
    • The Korean Journal of Applied Statistics
    • /
    • v.30 no.6
    • /
    • pp.877-888
    • /
    • 2017
  • Spectral analysis is used to determine the frequency of time series data. We first determine the frequency of the series through the power spectrum or the periodogram and then calculate the period of a cycle that may exist in a time series. Estimating the frequency using a Bayesian technique has been developed and proven to be useful; however, the Bayesian estimator for the frequency cannot be analytically solved through mathematical equations and may be handled numerically or computationally. In this paper, we make an inference on the Bayesian frequency through both resampling a parameter by Markov chain Monte Carlo (MCMC) methods and resampling data by bootstrap methods for a time series. We take the Korean real estate price index as an example for Bayesian frequency estimation. We have found a difference in the periods between the sale price index and the long term rental price index, but the difference is not statistically significant.

Construction of Robust Bayesian Network Ensemble using a Speciated Evolutionary Algorithm (종 분화 진화 알고리즘을 이용한 안정된 베이지안 네트워크 앙상블 구축)

  • Yoo Ji-Oh;Kim Kyung-Joong;Cho Sung-Bae
    • Journal of KIISE:Software and Applications
    • /
    • v.31 no.12
    • /
    • pp.1569-1580
    • /
    • 2004
  • One commonly used approach to deal with uncertainty is Bayesian network which represents joint probability distributions of domain. There are some attempts to team the structure of Bayesian networks automatically and recently many researchers design structures of Bayesian network using evolutionary algorithm. However, most of them use the only one fittest solution in the last generation. Because it is difficult to combine all the important factors into a single evaluation function, the best solution is often biased and less adaptive. In this paper, we present a method of generating diverse Bayesian network structures through fitness sharing and combining them by Bayesian method for adaptive inference. In order to evaluate performance, we conduct experiments on learning Bayesian networks with artificially generated data from ASIA and ALARM networks. According to the experiments with diverse conditions, the proposed method provides with better robustness and adaptation for handling uncertainty.

A Method for Prediction of Quality Defects in Manufacturing Using Natural Language Processing and Machine Learning (자연어 처리 및 기계학습을 활용한 제조업 현장의 품질 불량 예측 방법론)

  • Roh, Jeong-Min;Kim, Yongsung
    • Journal of Platform Technology
    • /
    • v.9 no.3
    • /
    • pp.52-62
    • /
    • 2021
  • Quality control is critical at manufacturing sites and is key to predicting the risk of quality defect before manufacturing. However, the reliability of manual quality control methods is affected by human and physical limitations because manufacturing processes vary across industries. These limitations become particularly obvious in domain areas with numerous manufacturing processes, such as the manufacture of major nuclear equipment. This study proposed a novel method for predicting the risk of quality defects by using natural language processing and machine learning. In this study, production data collected over 6 years at a factory that manufactures main equipment that is installed in nuclear power plants were used. In the preprocessing stage of text data, a mapping method was applied to the word dictionary so that domain knowledge could be appropriately reflected, and a hybrid algorithm, which combined n-gram, Term Frequency-Inverse Document Frequency, and Singular Value Decomposition, was constructed for sentence vectorization. Next, in the experiment to classify the risky processes resulting in poor quality, k-fold cross-validation was applied to categorize cases from Unigram to cumulative Trigram. Furthermore, for achieving objective experimental results, Naive Bayes and Support Vector Machine were used as classification algorithms and the maximum accuracy and F1-score of 0.7685 and 0.8641, respectively, were achieved. Thus, the proposed method is effective. The performance of the proposed method were compared and with votes of field engineers, and the results revealed that the proposed method outperformed field engineers. Thus, the method can be implemented for quality control at manufacturing sites.