• 제목/요약/키워드: Bayes decision

검색결과 120건 처리시간 0.029초

Corresponding between Error Probabilities and Bayesian Wrong Decision Lasses in Flexible Two-stage Plans

  • Ko, Seoung-gon
    • Journal of the Korean Statistical Society
    • /
    • 제29권4호
    • /
    • pp.435-441
    • /
    • 2000
  • Ko(1998, 1999) proposed certain flexible two-stage plans that could be served as one-step interim analysis in on-going clinical trials. The proposed Plans are optimal simultaneously in both a Bayes and a Neyman-Pearson sense. The Neyman-Pearson interpretation is that average expected sample size is being minimized, subject just to the two overall error rates $\alpha$ and $\beta$, respectively of first and second kind. The Bayes interpretation is that Bayes risk, involving both sampling cost and wrong decision losses, is being minimized. An example of this correspondence are given by using a binomial setting.

  • PDF

Machine Learning Based Keyphrase Extraction: Comparing Decision Trees, Naïve Bayes, and Artificial Neural Networks

  • Sarkar, Kamal;Nasipuri, Mita;Ghose, Suranjan
    • Journal of Information Processing Systems
    • /
    • 제8권4호
    • /
    • pp.693-712
    • /
    • 2012
  • The paper presents three machine learning based keyphrase extraction methods that respectively use Decision Trees, Na$\ddot{i}$ve Bayes, and Artificial Neural Networks for keyphrase extraction. We consider keyphrases as being phrases that consist of one or more words and as representing the important concepts in a text document. The three machine learning based keyphrase extraction methods that we use for experimentation have been compared with a publicly available keyphrase extraction system called KEA. The experimental results show that the Neural Network based keyphrase extraction method outperforms two other keyphrase extraction methods that use the Decision Tree and Na$\ddot{i}$ve Bayes. The results also show that the Neural Network based method performs better than KEA.

Bayes 결정이론에 기반을 둔 능동카메라 환경에서의 이동 물체의 검출 및 추적 (Moving Object Tracking in Active Camera Environment Based on Bayes Decision Theory)

  • 배수현;강문기
    • 방송공학회논문지
    • /
    • 제4권1호
    • /
    • pp.22-31
    • /
    • 1999
  • 이동물체 추적 시스템은 감시, 방송, 영상회의 등의 시스템에 관한 품질 및 처리 효율을 개선시킨다. 본 논문에서는 능동 카메라 환경에서 이동물체의 검출 및 추적을 위한 개선된 bayes 결정이론을 제안한다. 제안한 시스템은 손실함수를 최소화 하는 최적의 패턴 클래스를 선택할 수 있도록 결정함수를 제공해주는 bayes 결정이론에 기반을 둔다. bayes 결정은 연속적인 영상을 통계적으로 분석하고, 능동카메라 환경에서 물체와 배경에 맞게 각 픽셀에 존재하는 pdf를 재구성 함으로써 이동 물체의 영역을 찾아낸다. 제안된 방법에 의해 만들어진 시스템은 능동카메라 환경에서 이동물체의 영역을 명확하게 찾아내고 그 영역을 표시함을 실험결과를 통해 알 수 있다. 본 논문에서는 제안된 방법과 기존의 방법들을 성능면에서 비교함으로서, 제안된 시스템이 정확하고, 노이즈에 대한 대처능력이 우수함을 알 수 있다.

  • PDF

Effect of Nonnormality on Bayes Decision Function for Testing Normal Mean

  • Bansal, Ashok K.
    • Journal of the Korean Statistical Society
    • /
    • 제8권1호
    • /
    • pp.15-21
    • /
    • 1979
  • A zone of sensitivity is developed to investigate the effect of nonnormality on the Bayes decision function for testing mean of a normal population when either parent or prior belongs to Edgeworthian family of moderately nonnormal probability density functions.

  • PDF

Naive Bayes 분석기법을 이용한 유방암 진단 (Breast Cancer Diagnosis using Naive Bayes Analysis Techniques)

  • 박나영;김장일;정용규
    • 서비스연구
    • /
    • 제3권1호
    • /
    • pp.87-93
    • /
    • 2013
  • 선진국형 질병으로만 알려져 있던 유방암이 우리나라 현대 여성들에게 발병률이 꾸준히 증가하고 있다. 유방암은 보통 50대 이상의 여성에서 발병하는 병으로 알려져 있지만 우리나라의 경우 40대의 서양보다 젊은 여성들에게 발병률이 꾸준히 증가하고 있다. 따라서 우리나라 성인여성을 기준으로 유방암에 대한 정확한 진단을 할 수 있는 매뉴얼을 구축하는 것이 시급한 과제이다. 본 논문에서는 데이터마이닝기법을 이용하여 유방암을 예측하는 방법을 제시한다. 데이터마이닝이란 데이터베이스 내에 숨어 있는 일정한 패턴이나 변수들 간의 관계를 정교한 분석모형을 이용하여 쉽게 드러나지 않은 유용한 정보를 찾아내는 과정을 말한다. 실험을 통하여 Deicion Tree와 Naive Bayes 분석기법을 사용하여 유방암을 진단하는 분석기법을 비교분석을 하였다. Deicison Tree는 C4.5 알고리즘을 적용하여 분석하였고 두 알고리즘이 상당히 좋은 분류 정확도를 나타냈다. 그러나 Naive Bayes 분류방법이 Decision Tree방법보다 더 상회하는 정확도를 보였고 이는 의료데이터의 특성에 많이 기인한다고 볼 수 있다.

  • PDF

Bayes 판단 이론 기반 멀티미디어 워터마크 검출 알고리즘 (Multimedia Watermark Detection Algorithm Based on Bayes Decision Theory)

  • 권성근;이석환;김병주;권기구;하인성;권기룡;이건일
    • 한국통신학회논문지
    • /
    • 제27권7A호
    • /
    • pp.695-704
    • /
    • 2002
  • 멀티미디어에 삽입된 워터마크의 검출은 저작권 보호 및 인증 분야에서 매우 중요한 역할을 한다. 최근 워터마크의 검출에 많이 사용되는 유사도 기반 알고리즘은 대상 영상의 분포 특성을 이용하지 않기 때문에 검출 성능이 떨어지는 단점을 가진다. 따라서 본 논문에서는 웨이블릿 변환 영역에서 상승적 방법에 의하여 삽입된 워터마크에 대한 효율적인 검출 알고리즘을 제안하였다. 제안한 워터마크 검출 알고리즘은 통계적 판단 이론에 따라 Bayes 판단 이론, 웨이블릿 계수들의 확률 분포 모델, 및 Neyman-Pearson 정의에 기반을 둔다. 따라서 제안한 검출 알고리즘에서는 주어진 오류 검출 확률에 대하여 간과 검출 확률을 최소화할 수 있는 장점이 있다. 제안한 검출 알고리즘의 성능 평가는 견고성 측면에서 수행되었고, 실험 결과로부터 제안한 알고리즘이 유사도 기반 알고리즘에 비하여 우수한 성능을 나타냄을 확인하였다.

Empirical Bayes Pproblems with Dependent and Nonidentical Components

  • Inha Jung;Jee-Chang Hong;Kang Sup Lee
    • Communications for Statistical Applications and Methods
    • /
    • 제2권1호
    • /
    • pp.145-154
    • /
    • 1995
  • Empirical Bayes approach is applied to estimation of the binomial parameter when there is a cost for observations. Both the sample size and the decision rule for estimating the parameter are determined stochastically by the data, making the result more useful in applications. Our empirical Bayes problems with non-iid components are compared to the usual empirical Bayes problems with iid components. The asymptotic optimal procedure with a computer simulation is given.

  • PDF

소셜 복마킹 시스템의 스패머 탐지를 위한 기계학습 기술의 성능 비교 (Comparative Study of Machine learning Techniques for Spammer Detection in Social Bookmarking Systems)

  • 김찬주;황규백
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권5호
    • /
    • pp.345-349
    • /
    • 2009
  • 소결 북마킹(social bookmarking) 시스템은 사용자가 북마크를 저장하고 공유할 수 있는 플랫폼을 제공하는 웹 기반(web-based) 시스템으로 폭소노미(folksonomy)를 이용한 대표적인 웹2.0 서비스이다. 소셜 북마킹 시스템에서의 스패머(spammer)란 자신들의 이익을 위해서 시스템을 고의적으로 악용하는 사람을 말한다. 스패머는 많은 양의 잘못된 정보를 시스템에 포스팅(posting)하기 때문에 전체 소셜 북마킹 시스템의 리소스(resource)를 쓸모없게 만들어 버린다. 따라서, 스패머를 빠른 시간 안에 탐지하고 그들의 접근을 차단하는 것은 시스템의 붕괴를 방지하기 위해 중요하다. 본 논문에서는 사용자가 사용한 태그에 대한 데이터를 추출하여, 사용자가 스패머 인지 아닌지를 예측하는 모델을 기계학습의 다양한 방법을 적용하여 생성한 후 그 성능을 비교해 보았다. 구체적으로, 결정테이블 (decision table, DT), 결정트리(decision tree, ID3), 나이브 베이즈 분류기($na{\ddot{i}}ve$ Bayes classifier), TAN(tree-augmented $na{\ddot{i}}ve$ Bayes) 분류기, 인공신경망(artificial neural network)의 방법을 비교하였다. 그 결과 AUC(area under the ROC curve)와 모델 생성시간을 고려하였을 때 나이브 베이즈 분류기가 가장 만족할 만한 성능을 보였다. 나이브 베이즈 분류기의 분류 결과가 가장 좋았던 이유는 성능을 비교하는 데 사용된 AUC가 결정트리 계열의 방법(ID3 등)보다 나이브 베이즈 분류기에서 일반적으로 높게 나오는 경향이 있다는 것과, 스패머 탐지 문제가 선형으로 분리 가능한 경우(lineally separable)와 유사할 가능성이 높기 때문으로 여겨진다.

의사결정트리의 분류 정확도 향상 (Classification Accuracy Improvement for Decision Tree)

  • 메하리 마르타 레제네;박상현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.787-790
    • /
    • 2017
  • Data quality is the main issue in the classification problems; generally, the presence of noisy instances in the training dataset will not lead to robust classification performance. Such instances may cause the generated decision tree to suffer from over-fitting and its accuracy may decrease. Decision trees are useful, efficient, and commonly used for solving various real world classification problems in data mining. In this paper, we introduce a preprocessing technique to improve the classification accuracy rates of the C4.5 decision tree algorithm. In the proposed preprocessing method, we applied the naive Bayes classifier to remove the noisy instances from the training dataset. We applied our proposed method to a real e-commerce sales dataset to test the performance of the proposed algorithm against the existing C4.5 decision tree classifier. As the experimental results, the proposed method improved the classification accuracy by 8.5% and 14.32% using training dataset and 10-fold crossvalidation, respectively.

Empirical Bayes Problem With Random Sample Size Components

  • Jung, Inha
    • Journal of the Korean Statistical Society
    • /
    • 제20권1호
    • /
    • pp.67-76
    • /
    • 1991
  • The empirical Bayes version involves ″independent″ repetitions(a sequence) of the component decision problem. With the varying sample size possible, these are not identical components. However, we impose the usual assumption that the parameters sequence $\theta$=($\theta$$_1$, $\theta$$_2$, …) consists of independent G-distributed parameters where G is unknown. We assume that G $\in$ g, a known family of distributions. The sample size $N_i$ and the decisin rule $d_i$ for component i of the sequence are determined in an evolutionary way. The sample size $N_1$ and the decision rule $d_1$$\in$ $D_{N1}$ used in the first component are fixed and chosen in advance. The sample size $N_2$and the decision rule $d_2$ are functions of *see full text($\underline{X}^1$equation omitted), the observations in the first component. In general, $N_i$ is an integer-valued function of *see full text(equation omitted) and, given $N_i$, $d_i$ is a $D_{Ni}$/-valued function of *see full text(equation omitted). The action chosen in the i-th component is *(equation omitted) which hides the display of dependence on *(equation omitted). We construct an empirical Bayes decision rule for estimating normal mean and show that it is asymptotically optimal.

  • PDF