DOI QR코드

DOI QR Code

AdaBoost를 이용한 윈도우 영상의 하위 영상 검출

Subimage Detection of Window Image Using AdaBoost

  • 길종인 (강원대학교 IT대학 컴퓨터정보통신공학과) ;
  • 김만배 (강원대학교 IT대학 컴퓨터정보통신공학과)
  • Gil, Jong In (Dept. of Computer and Communications Engineering, Kangwon National University) ;
  • Kim, Manbae (Dept. of Computer and Communications Engineering, Kangwon National University)
  • 투고 : 2014.07.13
  • 심사 : 2014.08.18
  • 발행 : 2014.09.30

초록

윈도우 영상은 흔히 컴퓨터에서 응용프로그램을 실행하였을 때, 모니터를 통해 출력되는 화면을 의미하여, 웹페이지, 동영상 플레이어 및 여러 가지 응용프로그램을 모두 포함한다. 웹페이지는 다른 어플리케이션에 비해 다양한 종류의 정보를 다양한 형태로 전달한다. 이러한 웹페이지와 같은 윈도우 영상은 카메라로부터 획득할 수 있는 자연영상과 달리 텍스트, 로고, 아이콘 및 하위 영상과 같은 여러 가지 요소들을 포함하고 있고, 각 요소들은 서로 다른 형식의 정보를 사용자에게 전달한다. 그러나 텍스트와 영상은 정보가 다른 형태로 제공되기 때문에, 엄연히 다른 특성을 가지고 있는 요소들을 지역적으로 분리할 필요성이 있다. 본 논문에서는 윈도우 영상을 지역적인 특성에 따라 다수의 블록으로 분할한 후, 분할된 각 영역을 배경, 텍스트, 하위영상으로 분류하였다. 이러한 분류기법을 통해 분류된 하위 영상은 3D입체영상 변환, 영상 검색, 영상 브라우징등과 같은 응용을 가질 수 있다. 영상을 분류하는 방법에는 여러 가지가 존재할 수 있으나, 본 논문에서는 기계학습 기반의 알고리즘이 하위 영상 검출에도 좋은 접근법이 될 수 있음을 증명하기 위해 AdaBoost를 이용하였고, 실험결과로부터 93.4%의 검출률, 13%의 거짓 긍정률을 보임으로서, 이를 입증하였다.

Window image is displayed through a monitor screen when we execute the application programs on the computer. This includes webpage, video player and a number of applications. The webpage delivers a variety of information by various types in comparison with other application. Unlike a natural image captured from a camera, the window image like a webpage includes diverse components such as text, logo, icon, subimage and so on. Each component delivers various types of information to users. However, the components with different characteristic need to be divided locally, because text and image are served by various type. In this paper, we divide window images into many sub blocks, and classify each divided region into background, text and subimage. The detected subimages can be applied into 2D-to-3D conversion, image retrieval, image browsing and so forth. There are many subimage classification methods. In this paper, we utilize AdaBoost for verifying that the machine learning-based algorithm can be efficient for subimage detection. In the experiment, we showed that the subimage detection ratio is 93.4 % and false alarm is 13 %.

키워드

참고문헌

  1. J. Kim, A. Baik, Y. Jung and D. Park, "2D-to-3D image/video conversion by using visual attention analysis," Int' Conf. on Image Processing (ICIP), 2009.
  2. S. Battiato, A. Carpa, S. Curti and M. laCascia, "3D Stereoscopic Image Pairs by Depth-Map Generation," Proceedings of 3DPVT, 2004.
  3. W. Tam and L. Zhang, "3D-TV Content Generation: 2D-to-3D Conversion," Proceedings of IEEE ICME, 2006.
  4. L. Zhang and W. Tam, "Stereoscopic image generation based on depth image for 3DTV," IEEE Trans. on Broadcasting. Vol. 51, Issue 2, June 2005.
  5. M. Khodadadi and A. Behrad, "Text Localization, Extraction and Inpainting in Color Images," 20th Iranian Conference on Electrical Engineering (ICEE), pp. 1035-1030, May 2012.
  6. Y. Song, A. Liu, L. Pang, S. Lin, Y. Zhang and S. Tang, "A Novel Image Text Extraction Method Based on K-means Clustering," 7th Int'l Conf' on Computer and Information Science, pp. 185-190, May 2008.
  7. G. L. Nagy, S. Seth, and M. Viswanathan. "A prototype document image analysis system for technical journals," Computer, 25(7):10-22, July 1992.
  8. J. Ha, "Recursive X-Y cut using bounding boxes of connected components," Document Analysis and Recognition, Volume: 2, pp, 952-955, 1995,
  9. M. Sonka V. Hlavac and R. boyle, "Image processing analysis and Machine Vision, 3rd Ed"., Thomson Press, 2008.
  10. T. Ojala, M. Pietikainen and D. Harwood, "A comparative study of texture measures with classification based on feature distributions," Pattern Recognition 29, pp. 51-59. 1996. https://doi.org/10.1016/0031-3203(95)00067-4
  11. T. Ojala, M. Pietikainen and T. Maenpaa, "Multiresolution gray-scale and rotation invariant texture classification with local binary patterns," IEEE Trans. on Pattern Analysis and Machine Intelligence 24, pp. 971-987. 2002. https://doi.org/10.1109/TPAMI.2002.1017623
  12. P. Viola and M. Jones, "Robust Real-Time Face Detection," International Journal of Computer Vision, 57(2), 137-154, 2004. https://doi.org/10.1023/B:VISI.0000013087.49260.fb
  13. P. Viola and M. Jones, "Rapid Object Detection using a Boosted Cascade of Simple Features," IEEE Conference on Computer Vision and Pattern Recognition, Vol. 1, 2001. pp. 511-518, 2001.
  14. J. Gil and M. Kim, "3D Conversion of Webpages Using Image Region Detection," 3DSA, June 2013.
  15. J. Gil and M. Kim, "2D-to-3D Conversion of Window Images," IWAIT, pp. 462-465, Jan, 2014.
  16. J. Gil and M. Kim, "2D-to-3D Conversion of Pictures mixed with Text and Images," ICIC Express Letters, Vol 8, No 1, pp. 303-319, Jan, 2014.