Designing a Spam Mail Filtering System Using User Reaction and Incremental Machine Learning

사용자의 행동과 점진적 기계학습을 이용한 쓰레기 편지 여과 시스템의 설계

  • Kim, Kang-Min (Department of Computer Engineering, Korea Maritime University) ;
  • Park, Eun-Jin (Department of Computer Engineering, Korea Maritime University) ;
  • Kim, Jae-Hoon (Department of Computer Engineering, Korea Maritime University)
  • 김강민 (한국 해양대학교 컴퓨터 공학과) ;
  • 박은진 (한국 해양대학교 컴퓨터 공학과) ;
  • 김재훈 (한국 해양대학교 컴퓨터 공학과)
  • Published : 2005.05.13

Abstract

본 논문은 쓰레기 편지를 여과하기 위해 대상 편지에 따른 사용자들의 행동(reaction)을 묵시적(implicitly)으로 수집한 후 이를 점진적(incrementally) 기계학습기의 자질(feature)로 사용하여 편지 여과 작업의 증거가 되는 단어들을 지속적으로 학습하면서 최적의 편지 여과 결과를 제공하는 기법과 시스템 구조를 제안한다. 사용자 개인의 컴퓨터에 행동 정보와 학습 데이터를 저장하도록 설계하여 묵시적 정보 수집에서 자주 제기되는 개인 프라이버시 문제를 해결하였으며, 점진적 기계학습 기법을 사용하여 개인 정보를 포함하는 대량의 편지 학습 데이터를 모으기 힘들다는 문제를 해결하였다. 또 향후 제안하는 시스템을 이용하여 여러 종류의 기계학습 기법 중 쓰레기 편지 여과 작업을 가장 효과적으로 수행할 수 있는 기법을 선택하는 작업을 수행할 계획이다.

Keywords