Implementation of an Extractor of User Selected Parts for Improvement of Web Information Extraction

웹 정보추출의 성능향상을 위한 사용자 관심 부분 추출기의 구현

  • Choi, Cheol-Hee (Dept. of Computer Science & Engineering, Hanyang University) ;
  • Hong, Kwang-Hee (Dept. of Computer Science & Engineering, Hanyang University) ;
  • Choi, Joong-Min (Dept. of Computer Science & Engineering, Hanyang University)
  • 최철희 (한양대학교 컴퓨터공학과) ;
  • 홍광희 (한양대학교 컴퓨터공학과) ;
  • 최중민 (한양대학교 컴퓨터공학과)
  • Published : 2005.11.01

Abstract

인터넷이 발전할수록 정보의 양이 늘어나게 되어 방대한 양의 데이터 속에서 적합한 정보를 추출하는 방법이 필요하다. 그리고 같은 데이터라 하더라도 유용한 정보라고 판단하는 것은 개인의 관심도에 따라 다르다. 따라서 우리는 사용자 관심 정보 추출이라는 목표 아래에서 개인간의 차이에도 명확히 정보를 추출할 수 있는 방법의 필요성을 인지하여 정보추출의 사전 단계에서 사용자가 원하는 정보가 있는 블록을 식별하는 방법에 대해서 연구하였다. 사용자가 선호하는 정보가 들어있는 블록들에 대해서만 정보 추출 기법을 적용하면 정확성과 속도면에서 좋은 결과를 얻을 수 있을 것으로 예상된다. 또한 XML-QL[7]형식의 질의를 통해 사용자의 요구 변화에 유연하게 대처하는 방법을 제안한다.

Keywords