A Service Strategy of Binary Document Images based on JBIG in Digital Library

전자도서관에서의 JBIG 기반 이전 문서영상 서비스 방안

  • 한영미 (부산대학교 컴퓨터공학과) ;
  • 김민환 (부산대학교 컴퓨터공학과)
  • Published : 1998.06.01

Abstract

While the SGML(standard generalized markup language) tend to be used in multimedia document management systems, still binary document images are widely used in servicing the information of printed documents at digital libraries. But the printed documents are scanned in 200 dpi resolution and the scanned binary document images are compressed by the ITU-T T.6 method, so they have difficulties in representing them in good quality and compressing them very efficiently. In this paper, by considering quality of the binary document images and expandability and effectiveness of database of them, we show that the suitable scanning resolution of them is 600 dpi and the best compression method is the JBIG. A staged service strategy of them is also suggested to solve the difficulty caused from long decompression time of the JBIG by analyzing characteristics of retrieving the binary document images in monitor and printer. In experiments for several typical binary document images, high compression rate of the JBIG and effectiveness of the staged service strategy are verified.

최근 SGML을 이용한 문서정보와 구축에 관한 연구가 많이 이루어지고 있으나, 현재 운영되고 있는 전자도서관에서는 기존의 출판물 문서를 이진 문서영상으로 스캐닝하여 사용자에게 그대로 서비스하는 방식을 이용하고 있다. 이때, 주로 200dpi로 스캐닝한 문서영상에 대하 TIFF 영상포맷에서의 ITU-T T.6 압축방법을 사용하여 제공하고 있는데, 이진 문서영상의 질 저하 현상과 낮은 압축율로 인해 어려움을 겪고 있다. 이에, 본 연구에서는 문서영상 데이터베이스의 확장성 및 효용성과 서비스 질의 향상성을 고려하여, 문서영상의 스캐닝 해상도는 600dpi가 적당하며, 압축방법은 JBIG이 타당함을 제시하였다. 아울러, 사용자 장비인 모니터와 프린터를 통한 서비스의 특성을 분석하여 이진 문서영상의 해상도를 단계별로 높여 서비스하는 방안을 제시함으로써, JBIG의 단점인 과다한 복구시간 문제를 해결하였다. 대표적인 문서영상들에 대한 실험을 통해, JBIG의 높은 압축율 및 제시된 단계별 서비스 방안의 타당성을 확인하였다.

Keywords