DOI QR코드

DOI QR Code

데이터 마이닝 기술을 적용한 사용자 선호 스팸 대응 온톨로지 구축

Constructing User Preferred Anti-Spam Ontology using Data Mining Technique

  • 김종완 (대구대학교 컴퓨터.IT공학부) ;
  • 김희재 (대구대학교 컴퓨터.IT공학부) ;
  • 강신재 (대구대학교 컴퓨터.IT공학부)
  • 발행 : 2007.04.25

초록

사용자마다 임의의 메일에 대한 반응은 자신의 취향에 따라 다를 수 있다. 본 논문에서는 사용자 선호 온톨로지를 구축함으로서 스팸 메일을 줄이고자 한다. 사용자의 행동양식을 기술하는 온톨로지를 정의하기 위하여, 사용자들의 선호도 정보와 그들의 이메일에 대한 반응을 연구하기 위한 연관성 분류 마이닝 방법을 적용했다. 생성된 분류 규칙은 정형화된 온톨로지 언어로 표현된다. 사용자 선호 온톨로지는 어떤 메일이 느팸 또는 비스팸 인지를 의미있는 양식으로 설명할 수 있다. 또한 사용자들의 온톨로지에 대한 이해력 향상을 위해 논리합성에 기반한 새로운 규칙 최적화 절차를 제안하여 불필요한 규칙들을 제거한다.

When a mail was given to users, each user's response could be different according to his or her preference. This paper presents a solution for this situation by constructing a user preferred ontology for anti-spam systems. To define an ontology for describing user behaviors, we applied associative classification mining to study preference information of users and their responses to emails. Generated classification rules can be represented in a formal ontology language. A user preferred ontology can explain why mail is decided to be spam or ron-spam in a meaningful way. We also suggest a new rule optimization procedure inspired from logic synthesis to improve comprehensibility and exclude redundant rules.

키워드

참고문헌

  1. Cormack, G. V., Overview of the TREC 2005 Spam Track, http://plg.uwaterloo.ca/~gvcormac/ trecspam-track05
  2. Wolfe, P., Scott, C., and Erwin, M., Anti-Spam Tool Kit, McGraw Hill, 2004
  3. Gray, A. and Haahr, M, 'Personalized Collaborative Spam Filtering,' in Proc. of the First Conference on Email and Anti-Spam, 2004
  4. Ravi,J., Shi, W., and Xu, C., 'Personalized Email Management at Network Edges,' IEEE Internet Computing, Vol. 9, No .2, pp, 54-60, 2005 https://doi.org/10.1109/MIC.2005.44
  5. Anti-Spam Firewall, http://www.barracuda- networ- ks.com/ns/products/ anti_spam_tech.php
  6. Kang, S., Semi-Automatic Construction of Practical Ontology and its Application for Word Sense Disambiguation, POSTECH, PhD. Thesis, 2002
  7. Maedche, A., 'Ontology Learning for the Semantic Web,' The Kluwer International Series. in Engineering and Computer Science, Vol .665, 2003
  8. Files, C. M. and Perkowski, M. A., 'Multi-Valued Functional Decomposition as a Machine Learning Method,' in Proc. of ISMVL, pp. 173-178, 1998
  9. Chan, A. and Freitas, A., 'A New Classification Rule Pruning Procedure for an Ant Colony Algorithm,' LNCS 3871, pp. 25-36, 2005
  10. 강신재, 김종완, '텍스트정보와 하이퍼링크에 기반한 지능형 스팸 메일 필터링', 한국 퍼지 및 지능시스템학회 논문지, 제14권 제7호, pp.895-901, 2004
  11. Witten, I. H. and Frank, E., Data Mining: practical machine learning tools and techniques, 2nd ed, Morgan Kaufmann, 2005
  12. http://en.wikipedia.org/wiki/Karnaugh_map
  13. McDermott, D. and Dou D., 'Representing disjunction and quantifiers in RDF,' in Proc. Int'l Semantic Web Conference, pp. 250-263, 2002
  14. Dou, D' McDermott, V., and Qi, P., 'Ontology translation on the semantic web,' Journal of Data Semantics, Vol. 2, pp. 35-57, 2004