E-mail Classification Using Dynamic Category Hierarchy and Automatic Generation of Category Label

분류 주제 자동 생성 및 동적분류체계 방법을 이용한 이메일 분류

  • Ahn, C.M. (School of Computer Science & Engineering, INHA Univ.) ;
  • Park, S. (School of Computer Science & Engineering, INHA Univ.) ;
  • Park, S.H. (School of Computer Science & Engineering, INHA Univ.) ;
  • Choi, B.K. (School of Computer Science & Engineering, INHA Univ.) ;
  • Lee, J.H. (School of Computer Science & Engineering, INHA Univ.)
  • 안찬민 (인하대학교 컴퓨터정보공학과) ;
  • 박선 (인하대학교 컴퓨터정보공학과) ;
  • 박상호 (인하대학교 컴퓨터정보공학과) ;
  • 최범기 (인하대학교 컴퓨터정보공학과) ;
  • 이주홍 (인하대학교 컴퓨터정보공학과)
  • Published : 2004.04.01

Abstract

이메일 사용이 보편화됨에 따라 점차 수신되는 메일의 량이 증가하고 있다. 이러한 메일 량의 증가는 사용자로 하여금 이메일을 좀더 효율적으로 분류할 수 있는 방법을 필요하게 한다. 그러나 현재의 이메일 분류는 규칙기반, 베이시안, SVM 등을 이용하여 스팸메일을 필터링 하는 이원분류가 주로 연구되고 있다. 이외에도 다원분류에 대한 연구로는 클러스터링을 이용한 방법이 있으나, 이는 단순히 유사도에 의해 메일을 묶는 수준에 그치고 있다. 본 논문에서는 벡터모델의 유사도를 기반으로 한 분류 주제 자동 생성 알고리즘과 동적분류체계 방법을 결합하여 새로운 이메일 자동 다원분류 방법을 제안했다. 본 논문에서 제안한 방법은 이메일을 자동으로 분류하여, 분류된 결과를 색인검색과 디렉토리 검색 방법을 지원하며 대량의 메일도 효율적으로 관리할 수 있다. 또한 메시지를 동적으로 재분류 할 수 있게 함으로써 디렉토리 검색시 재현율을 높였다.

Keywords