A Preprocessing for Efficient Classification of E-mail Messages

전자우편문서의 효율적인 분류를 위한 전처리

  • 강영순 (충남대학교 컴퓨터과학과) ;
  • 이용배 (충남대학교 컴퓨터과학과) ;
  • 김태현 (충남대학교 컴퓨터과학과) ;
  • 조숙현 (충남대학교 컴퓨터과학과) ;
  • 맹성현 (충남대학교 컴퓨터과학과)
  • Published : 2002.04.01

Abstract

인터넷 사용의 증가는 의사소통 매체의 하나로 전자우편(e-mail)을 일반화되게 땠다. 전자우편은 개인적인 목적 뿐만 아니라, 광고, 판매, 서비스 흑은 제품구입 관련문의 등의 특정목적에 이용되고 있는 추세이므로 한꺼번에 많은 메일을 처리 및 관리하기 위해서는 전자우편문서의 자동분류가 필요하다. 전자우편문서는 일반문서와는 달리 반구조적(semi-structure)구성, 특수문자, 약어 및 속어 등의 특징들이 있으므로 이러한 특성들은 자동분류의 정확도에 영향을 기치는 요인이 될 수 있다. 본 논문에서는 분류 성능을 향상 시키기 위해 자동분류의 오류가 될 수 있는 특성들을 제거하고, 구조적인 특징을 활용한 분류기의 전처리기를 설계한 방법론을 제시하고자 한다

Keywords