Spam Filtering by False Negative(FN) Value Analysis based on User Pattern

사용자 패턴 기반의 부정오류(FN) 수준 평가를 활용한 스팸메일 분류

  • Nam, Myoung-Kuk (Dept of Computer Science & Information, Korea National Defense University) ;
  • Lee, Sang-Hoon (Dept of Computer Science & Information, Korea National Defense University)
  • 남명국 (국방대학교 전산정보학과) ;
  • 이상훈 (국방대학교 전산정보학과)
  • Published : 2008.06.30

Abstract

전자 메일의 사용이 급증함에 따라 스팸메일의 양도 함께 증가하고 있다. 증가되는 스팸으로 인한 피해를 줄이기 위하여 여러 가지 기법들이 사용되고 있지만, 지능화되어가는 스패머들의 기술에 완전한 스팸메일의 차단은 불가능하며, 수신된 메일에 대해 사용자는 자신만의 기준으로 스팸메일 여부를 판단하고 있다. 본 논문에서는 스팸메일임에도 불구하고 수신되는 메일(FN)에 대해, 사용자의 반응 패턴을 통하여 이를 판단하고자 한다. 수신된 메일의 송신자와 제목, 보관 편지함 등에서 형태소 추출을 하고 이를 PN_DB(Positive형태소와 Negative형태소로 구성된 DB, 이하 PN_DB)로 구축한 뒤, Negative 형태소들을 Balcklist로 사용하여 FN 메일을 판단한다. FN 메일로 판단된 경우에 PN_DB에서 계산된 각각의 가중치 값을 적용하여 사용자의 과거 스팸 판단 성향이 반영된 FN_value를 시각적으로 표현함으로써 사용자의 판단을 용이하게 하는 시스템을 제안한다.

Keywords