Directed Graph by Integrating Web Document Hyperlink and Web Access Log for Web Mining

웹 마이닝을 위한 웹 문서 하이퍼링크와 웹 접근로그를 통합한 방향그래프

  • Park, Chul-Hyun (Dept. of Computer Engineering, Korea Maritime University) ;
  • Lee, Seong-Dae (Dept. of Computer Engineering, Korea Maritime University) ;
  • Kwak, Yong-Won (Dept. of Computer Engineering, Korea Maritime University) ;
  • Jeon, Sung-Hwan (Dept. of Computer Engineering, Korea Maritime University) ;
  • Park, Hyu-Chan (Dept. of Computer Engineering, Korea Maritime University)
  • 박철현 (한국해양대학교 컴퓨터공학과) ;
  • 이성대 (한국해양대학교 컴퓨터공학과) ;
  • 곽용원 (한국해양대학교 컴퓨터공학과) ;
  • 전성환 (한국해양대학교 컴퓨터공학과) ;
  • 박휴찬 (한국해양대학교 컴퓨터공학과)
  • Published : 2005.11.01

Abstract

웹은 사용자가 원하는 정보를 쉽고 정확하게 검색할 수 있도록 웹 문서를 자료구조화하여 보다 신뢰성 있는 패턴을 추출하고 사용자의 특성과 행동 패턴을 적용하여 개인화 하여야한다. 본 논문에서는 개인화하기 위한 전처리 과정으로서 웹 문서를 구조화 하는 방법을 제안한다. 제안 방법은 기본적으로 웹 문서 태그의 하이퍼링크를 깊이 우선 탐색 알고리즘을 사용하여 방향그래프를 만드는 것이다. 이때 웹 문서 태그 탐색 시 플래시, 스크립트 등의 찾기 힘든 하이퍼링크를 찾는 문제와 '뒤로' 버튼 사용 시 웹 접근로그에 기록되지 않는 문제점을 보완한다. 이를 위해 클릭 스트림을 스택에 저장하여 이미 만들어진 방향그래프와 비교하여 새롭게 찾은 정점과 간선을 추가함으로써 보다 신뢰성높은 방향그래프를 만든다.

Keywords