Conversion of linear, paper-based documents into Hypertext

선형문서를 하이퍼텍스트문서로 자동변환시키기 위한 연구 및 구현

  • Kim, Jin-Soo (Department of Computer Science, PaiChai University) ;
  • Park, Dong-won (Department of Computer Science, PaiChai University)
  • 김진수 (배재대학교 전자계산학과) ;
  • 박동원 (배재대학교 전자계산학과)
  • Published : 1995.09.20

Abstract

The purpose of this work is to develop automatic techniques for converting linear, paper-based documents to a non-linear format suitable for use in hypertext systems. The selected document was partially converted to hypertext manually, and a prototype was created using the rules derived from the manual conversion process. The full conversion was divided into three passes: correcting the electronic linear form of the document, generating a listing of the links in the document, and creating the hypertext document. Passes 2 and 3 were entirely automatic. From this study, it may be concluded that many classes of paper-based documents can be automatically converted to hypertext.

정보의 양이 늘어남에 따라, 필요한 정보를 빠르고 쉽게 추출할 수 있는 하이퍼텍스트 문서화에 대한 요구는 증가하고 있다. 기존의 서류문서를 하이퍼텍스트 전자문서로 변환시키기 위한 기술을 고찰하고 이를 구현하기 위한 소프트웨어를 개발하였다. 이 변환 작업은 세 과정은 세 과정으로 나누어져 있다. 첫 번째 과정에서는 스캐너를 이용하여 서류문서를 일단 전자문서화 시키고, 두 번째 과정에서는 첫 번째 과정의 output인 선형 전자문서를 전역 하이퍼텍스트 전자문서로 변환시킨다. 세 번째 과정에서는 이를 타겟 하이퍼텍스트 시스템의 포맷에 맞게끔 다시 변환시킨다. 이 작업을 통하여 실현가능성을 증명하였고, 또한 일반화시키기 위한 문제점들을 제시하였다.

Keywords