DOI QR코드

DOI QR Code

XML Fulltext Retrieval System by Extracting Navigation Information

네비게이션 정보추출에 의한 XML 본문검색시스템

  • 강남규 (한국과학기술정보연구원 정보시스템연구실) ;
  • 이응봉 (충남대학교 문헌정보학과) ;
  • 이석형 (한국과학기술정보연구원 정보시스템연구실)
  • Published : 2002.09.01

Abstract

Recently, to overcome the limit of keyword based retrieval system, the study based structured document has been studied. But it is hard for structured retrieval system to adapt a real service, in this paper, we propose a method of retrieval mechanism for the fulltext of XML documents. We explain DTD of XML based report, extracting navigation information and planing to adapt the retrieval system for article retrieval. Using the fulttext retrieval scheme, suggested system can be an alternative plan of professional structured based retrieval system.

최근, 키워드 기반 정보검색의 한계를 극복하기 위한 구조문서 기반의 연구가 활발하게 진행되고 있지만, 실제 적용에는 많은 어려움이 존재한다. 본 고에서는 구조문서에 대한 본문검색시스템을 제안한다. 본문검색시스템에 적용된 문서는 XML로 구축된 국가 연구개발보고서를 대상으로 하였으며, XML 연구보고서의 DTD. 본문 간의 이동을 위한 네비게이션 정보추출, 본문검색을 위한 검색엔진의 적용 방안에 관하여 살펴본다. 본 시스템은 XML 문서에 대해 문서의 구조정보를 저장하고 이를 검색하여 다양한 형태로 열람할 수 있는 검색엔진의 부재 상황을 본문검색이라는 방법으로 극복하기 위한 것이다.

Keywords

References

  1. 조윤기, 조정길, 이병렬, 구연설. 2001. XML 문서에 포함된 구조 정보의 표현과 검색. 정보처리학회지, 8(4): 361-366.
  2. Brain Lowe, Justin Zobel, Ron Sacks-Davis. 1995. "A Formal Model for Databases of Structured Text." Proceedings of the 4th International Conference on Database Systems for Advanced Applications.
  3. Toung Dao. 1998. "An Indexing Model for Structured Documents to Support Queries on Content. Structure and Attributes." Proceedings of Advances in Digital Libraries '98.
  4. David Hunter 외. 2000. Beginning XML. 정보문화사.
  5. 정회경. 1999. 차세대 웹 문서 표준 XML. 정보처리학회지, 6(3): 25-35.
  6. W3C. 2002. “http://www.w3.org/”, W3C .
  7. 정보시스템연구실. 2002. KRISTAL 매뉴얼, 한국과학기술정보연구원.