특정 속성과 Co-training을 이용한 전자메일 분류

E-Mail Filtering with Co-training Based on Specific Features

  • 류제 (호서대학교 벤처전문대학원) ;
  • 윤성희 (호서대학교 컴퓨터공학부) ;
  • 한광록 (호서대학교 컴퓨터공학부)
  • Ryu, Je (Graduate School of Venture, Hoseo University) ;
  • Yoon, Sung-Hee (Dept. of Computer Engineering, Hoseo University) ;
  • Han, Kwan-Rok (Dept. of Computer Engineering, Hoseo University)
  • 발행 : 2003.04.01

초록

본 논문은 점점 증가되고 있는 SPAM 메일 문제를 해결하기 위한 방법으로써, 특정 속성에 기반을 둔 학습 알고리즘의 co-training을 통한 전자메일 분류 기법을 제안한다. 전자메일 분류는 결국 문서 분류 기술과 다르지 않다. 이미 많은 연구에서 학습 알고리즘을 이용한 문서 분류 기법은 많이 제안되고 검증되었다. 본 논문에서는 이러한 학습 알고리즘들을 co-training을 통하여 해당 메일이 SPAM인지 아닌지 구분하며, 학습의 효율성을 높이기 위하여 전자메일의 특정한 속성들, 예를 들면, 핵심문구나 기타 특정한 문구 및 전자메일의 헤더 정보 등을 학습 기반으로 이용하였다.

키워드