사용자 행동 패턴을 기반으로 가중치를 부여한 스팸 메일 필터링

Weighting based User Behavior Pattern for Filtering Spam Mail

  • 한아성 (인하대학교 컴퓨터.정보공학과) ;
  • 김현준 (인하대학교 컴퓨터.정보공학과) ;
  • 조근식 (인하대학교 컴퓨터.정보공학과)
  • Han, A-Sung (School of Computer Science & Engineering, Inha University) ;
  • Kim, Hyun-Jun (School of Computer Science & Engineering, Inha University) ;
  • Jo, Geun-Sik (School of Computer Science & Engineering, Inha University)
  • 발행 : 2007.06.25

초록

스팸 메일의 비율은 지속적으로 증가하여 최근 전체 이메일의 92.6%가 스팸 메일인 것으로 드러났다. 본 논문에서는 시간의 경과에 따른 사용자의 액션 패턴을 기반으로 사용자의 관심에 따른 가중치를 적용하여 스팸 메일 여부를 가리는 방법을 다룬다. 액션간의 관계와 액션 사이의 시간에 따라 가중치를 차별화함으로써 얼마나 높은 필터링 성능을 보일 수 있는 지, 또한 학습 속도 향상에 얼마나 기여할 수 있는지를 측정할 것이다. 실험에서는 실제 메일 데이터를 이용하여 베이지안 분류자, 가중치가 부여된 베이지안 분류자와 본 논문이 제안하는 시스템의 학습 성능의 향상 속도를 비교할 것이다. 또한 제안된 시스템이 Concept Drift와 적응 학습, 그리고 개인화를 어떻게 다룰 지를 보일 것이다.

키워드