A Study on Video Object Segmentation using Nonlinear Multiscale Filtering

비선형 다중스케일 필터링을 사용한 비디오 객체 분할에 관한 연구

  • 이웅희 (인하대학교 전자공학과) ;
  • 김태희 (한국전자통신연구원 전파방송연구소) ;
  • 이규동 (인하대학교 전자공학과) ;
  • 정동석 (인하대학교 전자공학과)
  • Published : 2003.10.01

Abstract

Object-based coding, such as MPEG-4, enables various content-based functionalities for multimedia applications. In order to support such functionalities, as well as to improve coding efficiency, each frame of video sequences should be segmented into video objects. In this paper. we propose an effective video object segmentation method using nonlinear multiscale filtering and spatio-temporal information. Proposed method performs a spatial segmentation using a nonlinear multiscale filtering based on the stabilized inverse diffusion equation(SIDE). And, the segmented regions are merged using region adjacency graph(RAG). In this paper, we use a statistical significance test and a time-variant memory as temporal segmentation methods. By combining of extracted spatial and temporal segmentations, we can segment the video objects effectively. Proposed method is more robust to noise than the existing watershed algorithm. Experimental result shows that the proposed method improves a boundary accuracy ratio by 43% on "Akiyo" and by 29% on "Claire" than A. Neri's Method does.

MPEG-4와 같은 객체 기반 부호화는 멀티미디어 응용을 위한 다양한 내용 기반 기능들을 제공한다. 압축 효율의 향상과 더불어 이러한 기능들이 지원되도록 하기 위해서는 비디오 데이터의 각 프레임은 비디오 객체로 분할되어야 한다. 본 논문에서는 비선형 다중스케일 필터링과 시공간 정보를 사용한 효과적인 비디오 객체 분할 기법을 제안한다. 제안된 방법은 안정화된 역 확산 방정식(Stabilized Inverse Diffusion Equation : SIDE)에 기반한 비선형 다중스케일 필터링을 사용하여 공간적 분할을 수행한다. 또한 구해진 초기 분할된 영역들은 인접 영역 그래프 (Region Adjacency Graph : RAG)를 사용하여 병합된다. 본 논문에서는 통계적 유의성 검사(Statistical significance test)와 시변 메모리(Time-variant memory)를 시간적 분할 방법으로 사용하며 구해진 공간적 분할과 시간적 분할을 결합하여 최종 객체 영역을 효과적으로 분할한다. 본 논문에서 제안된 공간적 분할 방법은 기존의 형태학적 Watershed 알고리즘에 비해 잡음에 강인한 분할 특성을 나타내었으며 기존의 A. Neri의 방법과 비교하였을 때, 최종 분할된 객체 영역의 정확도 비율이 Akiyo는 43%, Claire는 29% 정도 향상됨을 확인할 수 있었다.

Keywords

References

  1. Y. Tsaig and A. Averbuch, 'Automatic segm entation of moving objects in video sequences: A region labeling approach,' IEEE Trans. on C ircuits and Syst. Video Technol, vol. 12, no. 7, pp. 597-612, July 2002 https://doi.org/10.1109/TCSVT.2002.800513
  2. S. Y. Chien, S. Y. Ma, and L. G. Chen, 'Efficient moving object segmentation algorithm using background registration technique,' IEEE Trans. on Circuit and Syst. Video Technol., vol. 12, no. 7, PP. 577-586, July 2002 https://doi.org/10.1109/TCSVT.2002.800516
  3. D. Wang, 'Unsupervised video segmentation based on watersheds and temporal tracking,' IE EE Trans. on Circuit and Syst. Video Technol., vol. 8, no. 5, PP. 539-546, Sept. 1998 https://doi.org/10.1109/76.718501
  4. M. Kim, J. G. Choi, D. Kim, H. Lee, M. H. Lee, C. Ahn, and Y. Ho, 'A VOP generati on tool : Automatic segmentation of moving ob jects in image sequences based on spatio-tempo ral information,' IEEE Trans. on Circuit and S yst. Video Technol., vol. 9, no. 8, PP. 1216-122 6, Dec. 1999 https://doi.org/10.1109/76.809157
  5. T. Aach, A. KauP, and R. Mester, 'Statistica 1 model-based change detection in moving vide o,' Signal Processing, vol. 31, PP. 165-180, Mar. 1993 https://doi.org/10.1016/0165-1684(93)90063-G
  6. A. Neri, S. Colonnese, G. Russo, and P. Tal one, 'Automatic moving object and background separation,' Signal Processing, vol. 66, PP. 219 -232, Apr. 1998 https://doi.org/10.1016/S0165-1684(98)00007-3
  7. R. Mech and M. Wollborn, 'A noise robust method for 2D shape estimation of moving objects in video sequences considering a moving c amera,' SignaI Processing, vol. 66, PP. 203-21 7, Apr. 1998 https://doi.org/10.1016/S0165-1684(98)00006-1
  8. F. Long, D. Feng, H. Peng, and W. Siu, 'Extractmg semantic video objects,' IEEE Computer Graphics and Apptications, vol. 21, no. 1, PP. 48-55, January/February 2003
  9. P. Perona and J. Malik, 'Scale-space and edg e detection using anisotropic diffusion,' IEEE T rans. on Pattern Anal. Machine Intell., vol. 12, no. 7, PP. 629-639, July 1990 https://doi.org/10.1109/34.56205
  10. I. Pollak, 'Segmentation and restoration via nonlinear multiscale filtering,' IEEE Signal Pro cessing Mag., vol. 19, PP. 26-36, Sept. 2002 https://doi.org/10.1109/MSP.2002.1028350
  11. I. Pollak, 'Image segmentation and edge en hancement with stabilized inverse diffusion equa tions,' IEEE Trans. on Image Processing, vol. 9, no. 2, PP. 256-266, Feb. 2000 https://doi.org/10.1109/83.821738
  12. I. Pollak, 'Nonlinear scale space analysis in image processing,' Ph.D. dissertation, Massachus etts Institute of technology, Aug. 1999
  13. L. Vincent and P. Soille, 'Watershed in digital spaces: an efficient algorithm based on immersion simulations,' IEEE Trans. on Pattern Ana/. Machine Intell., vol. 13, no. 6, PP. 583-598, June 1991 https://doi.org/10.1109/34.87344