A Study on Incremental Learning Model for Naive Bayes Text Classifier

;;;

Proceedings of the Korea Database Society Conference (한국데이타베이스학회:학술대회논문집)

2001.06a
/
Pages.331-341
/
2001

Korea Data Strategy Society (한국데이터전략학회)

A Study on Incremental Learning Model for Naive Bayes Text Classifier

Naive Bayes 문서 분류기를 위한 점진적 학습 모델 연구

김제욱 (서울대학교 컴퓨터공학부) ;
김한준 (서울대학교 컴퓨터공학부) ;
이상구 (서울대학교 컴퓨터공학부)

Published : 2001.06.01

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

본 논문에서는 Naive Bayes 문서 분류기를 위한 새로운 학습모델을 제안한다. 이 모델에서는 라벨이 없는 문서들의 집합으로부터 선택한 적은 수의 학습 문서들을 이용하여 문서 분류기를 재학습한다. 본 논문에서는 이러한 학습 방법을 따를 경우 작은 비용으로도 문서 분류기의 정확도가 크게 향상될 수 있다는 사실을 보인다. 이와 같이, 알고리즘을 통해 라벨이 없는 문서들의 집합으로부터 정보량이 큰 문서를 선택한 후, 전문가가 이 문서에 라벨을 부여하는 방식으로 학습문서를 결정하는 것을 selective sampling이라 한다. 본 논문에서는 이러한 selective sampling 문제를 Naive Bayes 문서 분류기에 적용한다. 제안한 학습 방법에서는 라벨이 없는 문서들의 집합으로부터 재학습 문서를 선택하는 기준 측정치로서 평균절대편차(Mean Absolute Deviation), 엔트로피 측정치를 사용한다. 실험을 통해서 제안한 학습 방법이 기존의 방법인 신뢰도(Confidence measure)를 이용한 학습 방법보다 Naive Bayes 문서 분류기의 성능을 더 많이 향상시킨다는 사실을 보인다.

Keywords

Naive Bayes 문서 분류기;

Proceedings of the Korea Database Society Conference (한국데이타베이스학회:학술대회논문집)

A Study on Incremental Learning Model for Naive Bayes Text Classifier

Naive Bayes 문서 분류기를 위한 점진적 학습 모델 연구

Abstract

Keywords

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)