한국정보과학회:학술대회논문집 (Proceedings of the Korean Information Science Society Conference)
- 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
- /
- Pages.16-18
- /
- 2005
- /
- 1598-5164(pISSN)
웹 마이닝을 위한 웹 문서 하이퍼링크와 웹 접근로그를 통합한 방향그래프
Directed Graph by Integrating Web Document Hyperlink and Web Access Log for Web Mining
- 박철현 (한국해양대학교 컴퓨터공학과) ;
- 이성대 (한국해양대학교 컴퓨터공학과) ;
- 곽용원 (한국해양대학교 컴퓨터공학과) ;
- 전성환 (한국해양대학교 컴퓨터공학과) ;
- 박휴찬 (한국해양대학교 컴퓨터공학과)
- Park, Chul-Hyun (Dept. of Computer Engineering, Korea Maritime University) ;
- Lee, Seong-Dae (Dept. of Computer Engineering, Korea Maritime University) ;
- Kwak, Yong-Won (Dept. of Computer Engineering, Korea Maritime University) ;
- Jeon, Sung-Hwan (Dept. of Computer Engineering, Korea Maritime University) ;
- Park, Hyu-Chan (Dept. of Computer Engineering, Korea Maritime University)
- 발행 : 2005.11.01
초록
웹은 사용자가 원하는 정보를 쉽고 정확하게 검색할 수 있도록 웹 문서를 자료구조화하여 보다 신뢰성 있는 패턴을 추출하고 사용자의 특성과 행동 패턴을 적용하여 개인화 하여야한다. 본 논문에서는 개인화하기 위한 전처리 과정으로서 웹 문서를 구조화 하는 방법을 제안한다. 제안 방법은 기본적으로 웹 문서 태그의 하이퍼링크를 깊이 우선 탐색 알고리즘을 사용하여 방향그래프를 만드는 것이다. 이때 웹 문서 태그 탐색 시 플래시, 스크립트 등의 찾기 힘든 하이퍼링크를 찾는 문제와 '뒤로' 버튼 사용 시 웹 접근로그에 기록되지 않는 문제점을 보완한다. 이를 위해 클릭 스트림을 스택에 저장하여 이미 만들어진 방향그래프와 비교하여 새롭게 찾은 정점과 간선을 추가함으로써 보다 신뢰성높은 방향그래프를 만든다.
키워드