Classification of Multiclass Newsgroup Documents Using SVM Learning

SVM 학습을 이용한 다중 클래스 뉴스그룹 문서 분류

  • 오장민 (서울대학교 컴퓨터공학과) ;
  • 장병탁 (서울대학교 컴퓨터공학과) ;
  • 김영택 (서울대학교 컴퓨터공학과)
  • Published : 1999.10.01

Abstract

다중 클래스 문서분류는 주어진 여러 개의 관심사별로 문서를 선별해 주는 문제이다. 문서 분류 문제의 특징은 문서가 매우 높은 차원으로 표현된다는 것이다. 다른 학습 알고리즘에 비해 SVM 알고리즘은 차원을 전혀 줄이지 않고 문제를 해결한다. 본 논문에서는 SVM 학습 알고리즘을 이용하여 대규모의 뉴스 그룹 문서 분류 문제를 다룬다. 다중 클래스 문서 분류를 위해서 각 클래스에 대한 SVM학습 결과를 효과적으로 결합하였으며 실험을 통하여 SVM과 다른 학습 알고리즘과의 성능을 비교하였다.

Keywords