Ontology-Based Focused Crawling Combined with Neural Network

신경망을 적용한 온톨로지 기반의 Focused Crawling

  • Zheng, Hai-Tao (Biomedical Knowledge Engineering Lab., Seoul National University) ;
  • Kang, Bo-Young (Biomedical Knowledge Engineering Lab., Seoul National University) ;
  • Namgoong, Hyun (Biomedical Knowledge Engineering Lab., Seoul National University) ;
  • Kim, Hong-Gee (Biomedical Knowledge Engineering Lab., Seoul National University)
  • ;
  • 강보영 (서울대학교 지식공학연구실) ;
  • 남궁현 (서울대학교 지식공학연구실) ;
  • 김홍기 (서울대학교 지식공학연구실)
  • Published : 2007.10.12

Abstract

Focused crawling은 검색시스템의 구축을 위한 웹 문서 수집단계에서, 미리 정의된 토픽 집합들과 관련성을 가지는 웹 문서를 수집하기 위하여 제안되었다. 이러한 focused crawling 연구에서 보다 효과적인 웹 문서 수집을 위해 주어진 토픽에 대한 양질의 배경지식을 제공할 수 있도록 온톨로지가 활발히 활용되어왔다. 그러나 기존의 온톨로지 기반 focused crawling 연구는 토픽과 웹 문서 간의 관련성 측정을 위하여, 주어진 토픽과 관련있는 온톨로지 내 각 개념들에 직관에 의존한 가중치를 부여하여 활용하였다. 하지만 이러한 직관에 의존한 가중치부여 기법은 안정된 수집결과를 도출할 수 있는 최적화된 가중치 값을 얻기가 힘든 한계가 있다. 따라서 본 논문에서는 이러한 개념에 대한 가중치가 학습에 의하여 자동으로 결정되도록, 인공신경망을 적용한 온톨로지 기반 focused crawling 기법을 제안한다. 웹 상에서 제안된 시스템의 성능을 실험한 결과 기존의 온톨로지 기반 수집 기법에 비하여 보다 향상된 결과를 보임을 알 수 있었다.

Keywords