Automatic Text Classification by Learning from Unlabeled Data

;;;

Proceedings of the Korean Information Science Society Conference (한국정보과학회:학술대회논문집)

2001.04b
/
Pages.265-267
/
2001
/
1598-5164(pISSN)

Korean Institute of Information Scientists and Engineers (한국정보과학회)

Automatic Text Classification by Learning from Unlabeled Data

레이블이 없는 데이터로부터의 학습에 의한 자동 문서 분류

박성배 (서울대학교 컴퓨터공학부) ;
김유환 (서울대학교 컴퓨터공학부) ;
장병탁 (서울대학교 컴퓨터공학부)

Published : 2001.04.01

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

본 논문에서는 레이블이 없는 데이터를 이용하는 새로운 자동 문서 분류 방법을 제시한다. 제시된 방법은 적은 수의 레이블이 있는 데이터로부터 학습된 후 많은 수의 레이블이 없는 데이터로 보강되는 일련의 분류기(classifier)에 기반한다. 레이블이 없는 데이터를 활용하기 때문에, 필요한 레이블이 있는 데이터의 수가 줄어들고, 분류 정확도가 향상된다. 두 개의 표준 데이터 집합에 대한 실험 결과, 레이블이 없는 데이터를 사용함으로써 분류 정확도가 증가함을 보였다. 분류 정확도는 전체 데이터의 2/3만 사용하고도 NIPS 2000 워크숍 데이터 집합에 대해서는 약 7.9% 정도, WebKB 데이터 집합에 대해서는 9.2% 증가하였다.

Proceedings of the Korean Information Science Society Conference (한국정보과학회:학술대회논문집)

Automatic Text Classification by Learning from Unlabeled Data

레이블이 없는 데이터로부터의 학습에 의한 자동 문서 분류

Abstract

Keywords

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)