Implementation of a Harmful Website′s Automatic Classification System based on Morphological Analysis and Skin-Color Distribution′s Human Detection Algorithm

형태소 분석과 Skin-Color분포의 Human Detection 알고리즘을 이용한 유해사이트 자동 분류 시스템의 구현

  • 이승만 (고려대학교 컴퓨터과학기술 대학원) ;
  • 장영헌 (고려대학교 컴퓨터과학기술 대학) ;
  • 임정환 (고려대학교 컴퓨터과학기술 대학원)
  • Published : 2004.04.01

Abstract

인터넷은 유익하고 건전한 정보의 유통이 대부분이지만 최근에는 익명성과 상업성으로 인해 유해 정보가 급속하게 늘어나고 있는 추세이다. 이러한 부정적인 영향으로부터 청소년들과 어린이들을 보호하기 위하여, 본 논문은 유해사이트 분류를 자동으로 할 수 있는 시스템을 제안한다. 기존의 유해사이트 구축은 검색 요원들이 유해사이트를 돌아다니며 일일이 데이터를 수집하여 분류하거나 유해사이트의 내용 중에 텍스트만을 추출하여 패턴 매칭 방법으로 분류하는 것이 대부분이었지만, 본 논문은 기존 방법의 문제점을 해결하기 위하여 형태소 분석을 이용한 사이트의 유해도 측정과 Skin-Color 분포의 분석 결과를 병합하여 95% 이상의 정확도(Precision) 성능을 보이며. 신뢰도가 높은 유해사이트 자동 분류 시스템을 구현할 수 있다는 것을 증명하였다.

Keywords