효과적인 대용량 이메일 분류 및 아카이빙 시스템 설계 및 구현

Implementation and Design of Efficient Classification and Archiving System for Large Amount of Email

  • Kim, eungjin (Korea National University of Transportation) ;
  • Moon, jihye (Korea National University of Transportation) ;
  • Jung, hoyoung (Korea National University of Transportation) ;
  • Lim, jisu (Korea National University of Transportation) ;
  • Song, seokil (Korea National University of Transportation)
  • 발행 : 2016.05.20

초록

이 논문에서는 대용량의 이메일을 분류하여 아카이빙하는 시스템을 설계하고 구현한다. 이 논문에서 개발하는 이메일 아카이빙 시스템은 업무영역 별로 이메일을 분류하여 업무 관련 이메일에 대해 업무영역 카테고리별로 아카이빙을 수행한다. 분류의 정확도를 위해 온톨로지를 이용한 텀벡터의 확장 방법을 사용하였으며, 빠른 분류 및 아카이빙을 수행하도록 인메모리 기반의 분산 및 병렬 처리 프레임워크인 Spark을 기반으로 구현한다.

키워드