다층신경망을 이용한 모바일 자동 변환 시스템

Mobile Automatic Conversion System using MLP

  • 한은정 (숭실대학교 문화콘텐츠기술 연구소) ;
  • 장창혁 (숭실대학교 IT대학 미디어학부 미디어공학) ;
  • 정기철 (숭실대학교 IT대학 미디어학부)
  • 발행 : 2009.02.28

초록

모바일 기술의 발전으로 오프라인 컨텐츠가 아닌 온라인 매체로 다양한 영상 컨텐츠를 제공받는 수요층이 늘어나고 있다. 그러나 모바일 단말기의 작은 화면에 맞게 수작업으로 편집/수정하기 위해서는 비용과 노력이 많이 드는 단점이 있다. 따라서 본 논문에서는 영상 컨텐츠 가운데 가장 다양한 형태를 지닌 인쇄 만화를 모바일 단말기 환경에 맞게 자동 변환하는 Automatic Comics Conversion(ACC) 시스템을 제안한다. 모바일 단말기 화면에 적합한 형태로 기존 오프라인 만화책 각 한 면의 프레임으로 분할하기 위해 다층신경망(MLP: Multi-Layer Perceptorn)을 이용하였으며, 각 프레임은 영상의 의미 구조 (Semantic Structure)의 손실을 최소화하여 적합한 크기로 분할된 영상들을 자동 변환하여 제공한다. 또한 동적인 만화 영상을 애니메이션으로 제공하기 위하여 텍스처 분석 연구를 더 했다. 이에 본 연구는 만화뿐만 아니라 프레임 단위로 되어있는 사진, 웹사이트, 다양한 영상 등을 언제 어디서나 제공받을 수 있도록 모바일 단말기에 제공함으로써 효율성을 검증한다. 또한 오프라인의 정지 영상을 분할된 영상 프레임 정보를 통해 움직이는 영상으로 제공할 수도 있다.

The recent mobile industry is providing of a lot of image on/off-line contents are being converted into the mobile contents for architectural design. However, it is difficult to provide users with the existing on/off-line contents without any considerations due to the small size of the mobile screen. In existing methods to overcome the problem, the comic contents on mobile devices are manually produced by computer software such as Photoshop. In this paper, I describe the Automatic Comics Conversion(ACC) system that provides the variedly form of offline comic contents into mobile device of the small screen using Multi-Layer Perceptorn(MLP). ACC produces an experience together with the comic contents fitting for the small screen, which introduces a clustering method that is useful for variety types of comic images and characters as a prerequisite as a stage for preserving semantic meaning. An application is to use the frame form of pictures, website and images in order into mobile device the availability and can bounce back the freeze images contents into dynamic images content.

키워드

참고문헌

  1. Y.Chen, W.Y.Ma and H.J.Zhang, 'Detecting Web Page Structure for Adaptive Viewing on Small Form Factor Devices,' International WWW Conference, pp. 225-233, 2003.
  2. Baldonado Lizhen Lin, Junjie Chen and Hantao Song, 'The research of Web mining,' World Congress on Intelligent Control and Automation, Vol.3, No.4, pp. 2333-23337, 2002.
  3. Hao Liu, Xing Xie, Wei- Ying Ma and Hong-Jiang Zhang, 'Automatic Browsing of Large Pictures on Mobile Devices,' Eleventh ACM International Conference on Multimedia, pp.148-153, 2003.
  4. J. Casares, K. Cross and A. Klein, 'Redesigning Traditional media and Assessing Entertainment value With Online Comics,' Conference on Human Factors in Computing systems CHI'01,Vol.34, No.10, pp. 427-428, 2001.
  5. D.Wang and S.N.Srihari, 'Classification of newspaper image blocks using texture analysis,' Computer Vision Graphics, and Image Processing, Vol.47, pp. 327-352, 1989. https://doi.org/10.1016/0734-189X(89)90116-3
  6. K. etemad, D.S. Doerrnann, and R Chellappa, 'Multiscale segmentation of unstructured document pages using soft decision integration,' IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.19, pp. 92-96, 1997. https://doi.org/10.1109/34.566817
  7. N. Amamoto, S. Torigoe, and Y. Hirogaki, 'Block Segmentation and Text Area Extraction of Vertically/Horizontally Written Document,' Document Analysis and Recognition, pp. 739-742, 1993.
  8. J.Li and RM.gray, 'Text and picture segmentation by distribution analysis of wavelet coefficients,' International conference on Image Processing, (Chicago, Illinois), pp. 790-794, 1998.
  9. 김원철, 이수철, 황인준, 변광준, '모바일 환경에서 사용자 검색 성향을 반영한 웹 방송 정보 재구성 기법', 정보처리학회논문지 D, 제11-D권, 제5호, pp. 149-1158, 2004.
  10. 강신상, 옥경달, 이상범, '모바일 단말기 상에서의 효율적인 영상 및 폰트 처리,' 한국정보과학회지, 제31권, 제1호, pp. 0685-0687, 2004.
  11. Haykin, 'Neural Networks: a comprehensive foundation,' Prentice Hall, 2003.
  12. H. Fujisawa and Y. Nakano, 'A Top-Down Approach for the Analysis of Documents,' Pattern Recognition, No.10, pp. 113-122, 1990.
  13. Y. Chenevoy and A. Belaid, 'Hypothesis Management for Structured Document Recognition,' Document Analysis and Recognition, pp. 121-129, 1991.
  14. R. Ingold and D. Arrnangil, 'A Top-Down Document Analysis Method for Logical Structure Recognition,' Document Analysis and Recognition, pp. 41-49, 1991.
  15. Euniung H., Sungkuk J., Anjin P. and Kecchul J, 'Automatic Conversion System for Mobile Cartoon Contents,' International Conference on Asian Digital Libraries, Vol. 3815, pp. 416-423, 2005.
  16. J. Ha, R. Haralick, and I. Phillips, 'Document Page Decomposition by the Bounding-Box Projection Technique,' Document Analysis and Recognition, pp. 1,119-1,122, 1995.
  17. K. Kise, O. Yanagida and S. Takamatsu, 'Page Segmentation Based on Thinning of Background,' The 13th Int'l Conf. Pattern Recognition, pp, 788-792, 1996.
  18. K. K. Sung and T. Poggio, 'Example-based Learning for View-based Human Face Detection,' IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.20, No.1, pp. 39-51, 1998. https://doi.org/10.1109/34.655648
  19. Anil K. Jain and Kalle Karu, 'Learning Texture Discrimination Masks,' IEEE Transactions on pattern analysis and machine intelligence, Vol.18, No.2, pp. 195-205, 1996. https://doi.org/10.1109/34.481543