DOI QR코드

DOI QR Code

Tracking and Interpretation of Moving Object in MPEG-2 Compressed Domain

MPEG-2 압축 영역에서 움직이는 객체의 추적 및 해석

  • Published : 2004.02.01

Abstract

This paper proposes a method to trace and interpret a moving object based on the information which can be directly obtained from MPEG-2 compressed video stream without decoding process. In the proposed method, the motion flow is constructed from the motion vectors included in compressed video. We calculate the amount of pan, tilt, and zoom associated with camera operations using generalized Hough transform. The local object motion can be extracted from the motion flow after the compensation with the parameters related to the global camera motion. Initially, a moving object to be traced is designated by user via bounding box. After then automatic tracking Is performed based on the accumulated motion flows according to the area contributions. Also, in order to reduce the cumulative tracking error, the object area is reshaped in the first I-frame of a GOP by matching the DCT coefficients. The proposed method can improve the computation speed because the information can be directly obtained from the MPEG-2 compressed video, but the object boundary is limited by macro-blocks rather than pixels. Also, the proposed method is proper for approximate object tracking rather than accurate tracing of an object because of limited information available in the compressed video data.

본 논문에서는 MPEG-2비디오 스트림에서 복호화 과정 없이 압축비디오에서 직접 얻을 수 있는 정보들을 활용하여 움직이는 객체를 추적하고 해석하는 방법을 제안한다. 제안된 방법에서는 먼저 MPEG-2의 움직임 벡터로부터 근사적으로 움직임 플로우(motion new)를 구성하고, 전역 적인 움직임 플로우로부터 일반화된 Hough 변환을 이용 카메라의 기본적인 움직임인 팬(pan), 틸트(tilt), 줌(zoom)량 등을 계산하였다. 계산된 카메라 움직임은 국부적으로 일어나는 객체의 움직임을 보정하는데 사용하였다. 움직이는 객체의 추적은 사용자가 원하는 객체를 바운딩 박스 형태로 정의함으로 시동된다. 이후의 객체의 추적은 카메라 움직임이 보정된 객체의 움직임 플로우를 한 GOP(Group of Pictures)단위로 면적 기여도에 따라 누적하여 추적하였다. 또한 추적오차의 누적을 막기 위해 매 GOP마다 DCT(Discrete Cosine Transform) 정보를 이용하여 초기 바운딩 박스와 매칭을 통해 객체의 영역을 재 설정하였다. 제안된 방법은 압축된 비디오 스트림에서 직접 정보를 얻음으로써 계산속도의 향상을 기할 수 있으나, 압축된 MPEG-2 비디오에서 얻을 수 있는 정보들이 최대 블록 단위이므로 객체의 정의도 블록단위 이상의 객체로 제한되며, 이용한 수 있는 정보가 제한되어 있기 때문에 정확한 객체추적보다는 근사적인 객체추적에 적합하다.

Keywords

References

  1. J. Meng and S.-F. Chang, 'Tools for Compressed domain Video Indexing and Editing', SPIE Storage and Retrieval for Still Image and Video Databases, Vol.2670, pp.180-191, 1996 https://doi.org/10.1117/12.234795
  2. V. Kobla and D. Doermann, 'Compressed domain video indexing techniques using DCT and motion vector information in MPEG video', Proc. Of SPIE, Vol.3022, pp.200-211, 1997 https://doi.org/10.1117/12.263408
  3. Isaac Cohen, and Gerard Medioni, 'Detection and Tracking of Objects in Airborne Video Imagery', CVPR'98 Workshop on Interpretation of Visual Motion, 1998
  4. ISO-IEC I-1/ISO-IEC 13812-2 International Standards, 1st Ed., 1996
  5. Y. Nakajima, A. Yoneyama, H. Yanagihara and M. Sugano, 'Moving object detection from MPEG coded data', SPIE Visual Communications and Image Processing, Vol.3309, pp.988-996, 1998 https://doi.org/10.1117/12.298412
  6. R. Milanese, F. Deguillaume, A. Jacot-Descombes, 'Efficient Segmentation and Camera Motion Indexing of Compressed Video', Real-Time Imaging, Vol.5, No.4, pp.231-241, Aug., 1999 https://doi.org/10.1006/rtim.1998.0138
  7. Maurizio Pilu, 'On using raw MPEG motion vectors to determine global camera motion', SPIE Vol.3309, pp.449-459, 1998 https://doi.org/10.1117/12.298354
  8. Y. Nakajima, A. Yoneyama, H. Yanagihara and M. Sugano, 'Moving object detection from MPEG coded data', SPIE Visual Communications and Image Processing, Vol.3309, pp.988-996, 1998 https://doi.org/10.1117/12.298412
  9. Favalli, L., Mecocci, A., Moshetti, F., 'Object tracking for retrieval applications in MPEG-2', IEEE Transactions on Circuits and Systems for Video Technology, Vol.10, pp.427-432, April, 2000 https://doi.org/10.1109/76.836288
  10. 고성제, 김종옥, MPEG-4의 세계, 영풍문고, 2000
  11. 김대희, 호요성, 'MPEG-4 표준을 위한 동영상 객체분할 기술', Telecmmunication Review, 제13권 제2호, Apr., 2003
  12. Cigdem Eroglu Erden, A. Murat Tekalp, and Bulent Sankur, 'Video Object Tracking with Feedback of Performance Measure', Transactions on Circuits and Systems for Video Technology, Vol.13, No.4, pp.310-324, April, 2003 https://doi.org/10.1109/TCSVT.2003.811361