모양공간 모델을 이용한 영상분할 알고리즘

An Image Segmentation Algorithm using the Shape Space Model

  • 김대희 (한국전자통신연구원 방송시스템연구그룹) ;
  • 안충현 (한국전자통신연구원 방송시스템연구그) ;
  • 호요성 (광주과학기술원 정보통신공학과)
  • 발행 : 2004.03.01

초록

MPEG-4 표준에서는 객체 단위의 부호화를 수행하기 위해 자연영상으로부터 비디오 객체를 분리하는 영상분할(segmentation) 기술이 필요하다. 영상분할 방법은 크게 자동 영상분할(automatic segmentation)과 반자동 영상분할(semi-automatic segmentation)의 두 부류로 나눌 수 있다. 지금까지 개발된 대부분의 자동 영상분할 방법은 비디오 객체의 명확한 수학적인 모델을 제시하기 곤란하며 한 화면에서 개별 객체를 추출하기 어렵기 때문에 그 성능에 한계가 있다. 본 논문에서는 이러한 문제점을 극복하기 위해 active contour 알고리즘을 이용한 반자동 영상분할 알고리즘을 제안한다. 초기 곡선으로부터 변화 가능한 모든 곡선의 집합을 모양공간으로 정의하고 그 공간을 선형공간이라고 가정하면, 모양공간(shape space)은 모양 행렬에 의해 행(column) 공간과 남은 빈(left null) 공간으로 나뉘어진다. 본 논문에서 제안하는 알고리즘은 행공간의 모양공간 벡터를 이용하여 초기 곡선으로부터 영상의 특징점까지의 변화를 기술하고 동적 그래프 검색 알고리즘을 이용하여 객체의 세밀한 부분을 묘사한다. 모양 행렬과 객체의 윤곽을 추정하기 위한 SUSAN 연산자의 사용으로 제안한 알고리즘은 저수준 영상처리로부터 생성되는 불필요한 특징점을 무시할 수 있다. 또한, 모양 행렬의 사용으로 생긴 제약은 동적 그래프 검색 알고리즘으로 보상한다.

Since the MPEG-4 visual standard enables content-based functionalities, it is necessary to extract video objects from video sequences. Segmentation algorithms can largely be classified into two different categories: automatic segmentation and user-assisted segmentation. In this paper, we propose a new user-assisted image segmentation method based on the active contour. If we define a shape space as a set of all possible variations from the initial curve and we assume that the shape space is linear, it can be decomposed into the column space and the left null space of the shape matrix. In the proposed method, the shape space vector in the column space describes changes from the initial curve to the imaginary feature curve, and a dynamic graph search algorithm describes the detailed shape of the object in the left null space. Since we employ the shape matrix and the SUSAN operator to outline object boundaries, the proposed algorithm can ignore unwanted feature points generated by low-level image processing operations and is, therefore, applicable to images of complex background. We can also compensate for limitations of the shape matrix with a dynamic graph search algorithm.

키워드

참고문헌

  1. ISO/IEC FDIS 14496-2: 'Information technology generic coding of audio-visual objects, Part 2: visual,' ISO/IEC JTC1/SC29/WG11, Oct, 1998
  2. 김대희, 김민호, 호요성, 'MPEG-4 동영상 부호화를 위한 영상 객체 추출 기법,' 대한전자공학회지, 제26권, 제7호, pp. 714-723, 1999년 7월
  3. C. Gu and M.C. Lee, 'Semiautomatic segmentation and tracking of semantic video objects,' IEEE Trans. Circuit and System for Video Technology, vol. 8, no. 5, pp. 572-584, sept. 1998 https://doi.org/10.1109/76.718504
  4. M. Kass, A. Witkin and D. Terzopoulos, 'Snakes: Active contour models,' Proceedings of First International Conference on Computer Vision, pp.259-269, 1987
  5. A. Amimi, T. Weymouth and R.C. Jain, 'Using dynamic programming for solving variational problems in vision,' IEEE Trans. Patt. Anal. Mach. Intel, vol. 12, no. 9, pp. 855-867, Sept. 1990 https://doi.org/10.1109/34.57681
  6. D.J. Williams and M. Shah, 'A fast algorithm for active contours and curvature estimation,' CVGIP:Image Understanding, vol. 55, no. 1, pp. 14-26, Jan. 1992 https://doi.org/10.1016/1049-9660(92)90003-L
  7. J.D. Foley, A. Dam, S.K. Feiner, J.F. Hughes and R.L. Philips, Introduction to Computer Graphics, Addison-Wesley, New York, 1995
  8. G. Strang, Linear Algebra and Its Application, 3rd edn., Harcourt Brace Jovanovich, 1988
  9. A. Blake and M. Isard, Active Contours, Springer, London, 1998
  10. S.M. Smith, 'Flexible filter neighborhood designation,' Proc. 13th Int. Conf. on Pattern Recognition, vol.1, pp. 206-212, 1996 https://doi.org/10.1109/ICPR.1996.546020
  11. S.M. Smith, 'SUSAN nonlinear noise reduction,' http://www.fmrib.ox.ac.uk/fsl/susan
  12. E. N. Mortensen and W. A. Barrett, 'Interactive segmentation with intelligent scissors,' Graphical Models and Image Processing, pp. 349-384, 1998 https://doi.org/10.1006/gmip.1998.0480
  13. D. Marr and E. Hildreth, 'Theory of edge detection,' Proc. R.Soc. Lond., B 270, pp. 187-217, 1980
  14. R. M. Haralick and L. G. Shapiro, Computer and Robot Vision, Addison-Wesley Publishing, 1992
  15. E. N. Mortensen and W. A. Barrett, 'Intelligent scissors for image compositions,' Proc. of the ACM SIGGRAPH 95: Computer Graphics and Interactive Techniques, pp. 191-198, 1995 https://doi.org/10.1145/218380.218442
  16. D. Kim and Y. S. Ho, 'A user-assisted segmentation algorithm using B-Spline curves,' Proceedings of SPIE Visual Communications and Image Processing, pp. 734-744, Jan. 2001 https://doi.org/10.1117/12.411853