DOI QR코드

DOI QR Code

Personalized Mobile Junk Message Filtering System

사용자 맞춤형 스팸 문자 필터링 시스템

  • 이승재 (전남대학교 전자컴퓨터공학과) ;
  • 최덕재 (전남대학교 전자컴퓨터공학과)
  • Received : 2011.10.17
  • Accepted : 2011.11.22
  • Published : 2011.12.28

Abstract

Mobile spam message is a harmful factor which makes receivers to be annoyed and leads to unnecessary social cost. Unwanted junk messages flowing to a smart phone ruin main purpose of the smart work system to enhance the productivity, so we need to study on this area. In this paper, we proposed a novel spam filter on the smartphone in order to reduce computing process and improve the accuracy rate by feedback of error results to a training sample set. As the spam classifier operates on the smartphone independently with training on only user's received data, it could reflect user preference. The authorized personal computer takes on heavy works, such as preprocessing, feature selecting and training process, and the smartphone takes on light works to block junk messages. Experimental results showed reasonable accuracy rate of over 95%, and we found that the application occupied constant computing resources while running on the phone.

스팸 문자 메시지는 모바일 이용자에게 불쾌감을 줄 뿐만 아니라 불필요한 사회비용을 유발하는 유해 요소이다. 특히 스마트워크 시스템에서 핵심 단말인 스마트폰으로 유입되는 스팸 문자는 업무능률 향상이라는 스마트워크의 취지를 무색하게 만들 수 있어 이에 대한 연구가 필요하다. 본 논문에서는 스팸 자동분류기로 스팸 메시지를 차단함에 있어서, 오분류 결과를 학습군에 재반영하여 연산량을 줄이고 인식 성능을 개선할 수 있는 방법을 제안하였다. 스팸 분류기는 스마트폰에서 독립적으로 동작하고, 사용자의 수신 메시지만으로 학습하므로 사용자의 분류 판단 성향을 반영할 수 있다. 많은 컴퓨팅 자원을 소비해야 하는 전처리, 특징 선정, 훈련 과정은 사용자의 인증 컴퓨터가 담당하고 필터링 과정만을 스마트폰에서 처리한다. 실험 결과 95%이상의 양호한 결과를 보였고 스팸 분류기는 스마트폰의 일정 자원만을 점유하면서 동작하였다.

Keywords

References

  1. http://www.smartwork.go.kr.
  2. 방송통신위원회, 스팸방지 종합대책, 2011, http://spam.kisa.or.kr/kor/notice/noticeView.jsp?mode=view&p_No=10&b_No=10&d_No=64.
  3. P. He, Y. Sun, and W. Zheng, "Filtering Short Message Spam of Group Sending Using CAPTCHA," in Proc. of Workshop on Knowledge Discovery and Data Mining, Adelaide, Australia, pp.558-561, 2008.
  4. X. Hu and F. Yan, "Sampling of Mass SMS Filtering Algorithm Based on Frequent Time-Domain Area," in Proc. of Third International Conference on Knowledge Discovery and Data Mining, Phuket, Thailand, pp.548-551, 2010.
  5. W. Qian, H. Xue, and W. Xiayou, "Studying of Classifying Junk Messages Based on The Data Mining," in Proc. of International Conference on Management and Service Science, Beijing, China, pp.1-4, 2009.
  6. K. Yadav, P. Kumaraguru, A. Goyal, A. Gupta, and V. Naik, "SMSAssassin: Crowdsourcing Driven Mobile-based System for SMS Spam Filtering," in Proc. of 12th Workshop on Mobile Computing Systems and Applications, 2011.
  7. M. Taufiq, "Independent and Personal SMS Spam Filtering," in Proc. Of 11th IEEE International Conference on Computer and Information Technology, Sep. 2011.
  8. C. M. Bishop, Pattern Recognition and Machine Learning, Springer-Verlag, 2006.
  9. 조인휘, "휴대폰 SMS를 위한 SVM 기반의 스팸 필터링 시스템", 한국통신학회논문지, 제34권, 제 9호, pp.908-913, 2009.
  10. 손기준, 임수연,"베이지안 분류기를 이용한 문서 필터링", 한국콘텐츠학회논문지, 제5권, 제3호, pp.227-235, 2005.
  11. 임양원, 임한규,"사용자 패턴을 이용한 지능형 e-메일 시스템의 연구", 한국콘텐츠학회논문지, 제6권, 제1호, pp.65-72, 2006.
  12. 조종근, 하상은, "모바일 환경에서 파일 검색 엔진을 위한 효과적인 방식", 한국콘텐츠학회논문지, 제8권, 제11호, pp.41-48, 2008. https://doi.org/10.5392/JKCA.2008.8.11.041
  13. C. D. Manning, Introduction to Information Retrieval, Cambridge University Press, 2009.
  14. 강승식, "한국어 수사어절의 유형 분류 및 정규화", 한국정보과학회 1999년도 가을 학술발표논문집, 제26권, 제2호, pp.187-189, 1999.