GUI Based Generalized Fine-Grain Web Information Extractor

사용자 인터페이스 기반 범용 웹 정보 추출

  • Hur Jeong-Soo (Computer Science and Engineering, Soonchunghyang University) ;
  • Ha Sang-Ho (Computer Science and Engineering, Soonchunghyang University)
  • 허정수 (순천향대학교 컴퓨터학부) ;
  • 하상호 (순천향대학교 컴퓨터학부)
  • Published : 2006.06.01

Abstract

인터넷이 보급되면서 사용자는 자신이 원하는 정보를 인터넷으로 접근하였으며, 정보에 대한 수요는 늘어나 검색이나 포털을 통한 정보의 접근이 이루어지고 있다. 사용자들이 원하는 정보를 통합하더라도 사용자들은 자신이 원하는 정보를 얻기 위해 불필요한 정보에 노출된다 최근에 사용자가 필요한 웹 정보를 추출하는 연구가 진행되고 있으나, 이러한 연구는 추출 단위가 HTML 문서 수준이거나 일반적이지 못하다. 본 논문에서는 사용자가 원하는 임의의 웹 정보를 항목 단위의 수준에서 추출할 수 있는 사용자 인터페이스 기반 범용 웹 정보 추출기를 UML에 기반하여 설계하고 구현한다. 또한, 구현된 시스템에 대한 실행 예를 보인다.

Keywords