DOI QR코드

DOI QR Code

Web Document Transcoding Technique for Small Display Devices

소형 화면 단말기를 위한 웹 문서 변환 기법

  • 신희숙 (한국전자통신연구원 컴퓨터소프트웨어기술연구소) ;
  • 마평수 (한국전자통신연구원 컴퓨터소프트웨어기술연구소) ;
  • 조수선 (한국전자통신연구원 컴퓨터소프트웨어기술연구소) ;
  • 이동우 (한국전자통신연구원 컴퓨터소프트웨어기술연구소)
  • Published : 2002.12.01

Abstract

We propose a web document transcoding technique that translates existing web pages designed for desktop computers into an appropriate form for hand-held devices connected to the wireless internet. By defining a content block based on a visual separation and using it as a minimum unit for analyzing and converting processes, we can get web pages converted more exactly. We also apply the reallocation of the content block and the generation of new index in order to provide convenient interface without left-right scrolling in small screen devices. These methods, compared with existing ways such as text level summary or partial extraction method, can provide efficient navigation and a full recognition of web documents. To gain those transcoding benefits, we propose the Layout-Forming Tag Analysis Algorithm that analyzes structural tags, which motivate visual separation and the Component Grouping Algorithm that extracts the content block. We also classify and rearrange the content block and generate the new index to produce an appropriate form of web pages for small display devices. We have designed and implemented our transcoding system in a proxy server and evaluated the methods and the algorithms through an analysis of transcoded results. Our transcoding system showed a good result on most of popular web pages that have complicated structures.

본 논문에서는 기존의 일반 PC 화면에 적합하도록 작성된 웹 문서를 무선 환경의 핸드헬드 계열의 소형 단말기 화면에서도 효율적으로 표현되어지도록 변환하는 기법을 제시한다. 이는 선행 연구에서 나타나는 단순한 텍스트 위주의 추출 및 요약 형식의 변환과는 달리, 시각적인 분리에 근거한 내용 블록 단위를 설정하고 이를 기본으로 변환을 수행함으로써 보다 정확한 변환 결과를 얻으며, 내용 블록 단위들의 재배치와 새로운 인덱스 형식의 재표현을 통하여 편리한 인터페이스로 좌우스크롤 없는 웹 문서를 제공한다 이를 위하여 본 논문에서는 Layout-Forming Tag Analysis Algorithm과 Component Grouping Algorithm을 사용하여 시각적 표현을 주도하는 태그 정보에 대한 구조적인 분석 및 내용 블록 단위의 추출을 시도하고, 분리된 블록들의 분류와 재구성 및 인덱스 생성 과정을 통하여 소형 단말에 적합한 웹 문서를 생성한다. 웹문서 변환 시스템은 프락시 서버에서 동작하도록 설계되었고, 프로토타입의 구현을 통하여 제시하는 변환 기법을 평가하였다. 실제 웹 문서에 대한 검증 과정을 거쳤고, 복잡한 구조의 웹 문서에 대해 적합한 변환 결과를 보였다.

Keywords

References

  1. E. A. Brewer, R. H. Katz, Y. Chawathe, et al. 'A Network Architecture for Heterogeneous Mobile Computing,' IEEE Personal Communications, Vol.5, pp.8-24, October, 1998 https://doi.org/10.1109/98.729719
  2. 박천교, 이윤철, '이동컴퓨팅 단말 동향', 한국전자통신연구원 주간기술동향, 제1027호, 2001
  3. 배찬권, '정보통신산업동향 정보통신기기편 제7절 PDA', 정보통신정책연구원, 2001
  4. T. Bickmore, A. Girgensohn and J. W. Sullivan, 'Web Page Filtering and Re-Authoring for Mobile Users,' The Computer Journal, Vol.42, No.6, pp.534-546, 1999 https://doi.org/10.1093/comjnl/42.6.534
  5. T. Bickmore and W. Schilit, 'Digestor : Device-Independent Access to the World Wide Web,' Computer Networks and ISDN Systems, Vol.29, No.8, pp.1075-1082, 1997 https://doi.org/10.1016/S0169-7552(97)00026-3
  6. Y. H. Whang, C. H. Jung, J. H. Kim and S. K. Chung, 'Web Alchemist : A Web Trtanscoding System for Mobile Web Access in Handheld Devices,' SPIE's International Symposium on The Convergence of Information Technologies and Communications (ITCOM 2001), Aug., 2001
  7. Y. D. Yang and H. J. Zhang, 'HTML Page Analysis Based on Visual Clues,' IEEE International Conference on Document Analysis and Recognition(ICDAR 2001), pp.859-864, September, 2001 https://doi.org/10.1109/ICDAR.2001.953909
  8. J. Hammer, H. Garcia-Molina, J. Cho, R. Aranha and A. Crespo, 'ACM PODS/SIGMOD'97, May, 1997
  9. M. Hori, G. Kondoh, K. Ono, S. Hirose and S. Singhal, 'An notation Based Web Content Transcoding,' 9th World Wide Web Conference, 2000 https://doi.org/10.1016/S1389-1286(00)00068-2
  10. D. W. Embley, Y. Jiang and Y. K. Ng, 'Record-Boundary Discovery in Web Documents,' ACM SIGMOD International Conference on Management of Data(SIGMOD'99), pp.467-478, May, 1999 https://doi.org/10.1145/304181.304223
  11. B. Bederson and J. Hollan, 'Pad++ : A Zooming Graphical Interface for Exploring Alternate Interface Physics,' ACM User Interface Software and Technology, pp.17-26, 1994 https://doi.org/10.1145/192426.192435
  12. E. Brewer, A. Fox, I. Goldberg, D. Lee and A. Polito, 'Experience with Top Gun Wingman : A Proxy-Based Graphical Web Browser for the 3Com PalmPilot,' IFIP Middleware'98, pp.407-424, 1998
  13. N. Milic-Frayling and R. Sommerer, 'SmartView : Flexible Viewing of Web Page Contents,' World Wide Web Conference 2002, 2002
  14. H. Bharadvaj, A. Joshi and S. Auephanwiriyakul, 'An Active Transcoding Proxy to Support Mobile Web Access,' IEEE Symposium on Reliable Distributed Systems, 1998 https://doi.org/10.1109/RELDIS.1998.740482
  15. B. Zenel, 'A General Purpose Proxy Filitering Mechanism Applied to the Mobile Environment,' Wireless Networks Journal, Vol.5, pp.391-409, 1999 https://doi.org/10.1023/A:1019131902063
  16. A. Joshi, 'On Proxy Agents, Mobility, and Web Access,' Mobile Networks and Applications Journal, Vol.5, pp.233-241, 2000 https://doi.org/10.1023/A:1019120915034
  17. 최훈일, 장영건, 'HTMLtoVoiceXML 변환기의 설계 및 구현', 정보과학회논문지 : 컴퓨팅의 실제, 제7권 제6호, pp.559-568, 2001
  18. H. Takagi, C. Asakawa, 'Transcoding Proxy for Nonvisual Web Access,' ACM ASSETS'00, pp.172-171, November, 2000 https://doi.org/10.1145/354324.354371
  19. IBM, WebSphere Transcoding Publisher, http://www-3.ibm.com/software/webservers/transcoding/index.html
  20. OpenTV, SpyGlass Prism, http://www.opentv.com/support/ed_services/spyglass_prism.html
  21. Argo, WAP Tool, http://www.argogroup.com/waptool/
  22. World Wide Web Consortium, http://www.w3c.org/
  23. W3C, HTML Tidy, http://www.w3c.org/People/Raggett/tidy/
  24. W3C, Jigsaw, http://www.w3c.org/Jigsaw/
  25. 한국인터넷정보센터(KRNIC), http://www.nic.or.kr/