스캔 포맷 변환이 있는 효율적인 MPEG-2 동영상 트랜스코딩을 위한 고속 움직임 추정 기법

Fast Motion Estimation Algorithm for Efficient MPEG-2 Video Transcoding with Scan Format Conversion

  • 송병철 (삼성전자 디지털미디어 연구소) ;
  • 천강욱 (삼성전자 디지털미디어 연구소)
  • 발행 : 2003.09.01

초록

ATSC (Advanced Television System Committee)에서는 18가지의 DTV (Digital Television)를 위한 동영상 포맷들을 제정하였다. ATSC 포맷들은 스캔 포맷, 크기 포맷, 프레임율 포맷 등의 적당한 조합들이다. 효과적인 MPEG-2 트랜스코딩을 위해서는 이런 포맷들 간의 변환도 지원할 수 있어야 한다. 여러 포맷 변환들 중에서 특히 스캔 포맷 변환은 프레임율과 크기 변화가 함께 일어나기 때문에 상대적으로 구현하기가 힘들다. 스캔포맷 변환으로 픽쳐 타입도 함께 변하기 때문에 트랜스코더의 움직임 추정부 (motion estimation; ME)에 상당한 연산량 부담을 주게 된다. 이런 문제를 해결하기 위해 본 논문은 스캔포맷 변환을 지원하는 MPEG-2 동영상 트랜스코딩을 위한 고속 움직임 추정 알고리즘을 제안한다. 먼저, 트랜스코더의 수신단은 입력 비트열로부터 재 부호화(re-encoding)에 적합한 후보 움직임 벡터들을 추출한다. 그런 다음. 가중치 중간값 선택기(weighted median selector)를 이용하여, 여러 후보 움직임 벡터들 중에서 최적의 움직임 벡터를 선택한다. 모의 실험 결과는 제안한 움직임 추정 알고리즘이 전역 탐색 기법(Full Search Algorithm: FSA)에 비해 현저하게 적은 연산량을 가지면서, FSA와 거의 동일한 PSNR 성능을 가짐을 증명한다.

ATSC (Advanced Television System Committee) has specified 18 video formats for DTV (Digital Television), e.g., scan format, size format, and frame rate format conversion. Effective MPEG-2 video transcoders should support any conversion between the above-mentioned formats. Scan format conversion Is hard to Implement because it may often induce frame rate and size format conversion together. Especially. because of picture type conversion caused by scan format conversion, the computational burden of motion estimation (ME) in transcoding becomes serious. This paper proposes a fast ME algorithm for MPEG-2 video transcoding supporting scan format conversion. Firstly, we extract and compose a set of candidate motion vectors (MVs) from the input bit-stream to comply with the re-encoding format. Secondly, the best MV is chosen among several candidate MVs by using a weighted median selector. Simulation results show that the proposed ME algorithm provides outstanding PSNR performance close to full search ME, while reducing the transcoding complexity significantly.

키워드

참고문헌

  1. J. Moura, R. Jasinschi, H. Shiojiri, and C. Lin, 'Scalable video coding over heterogeneous networks,' Proc. SPIE, vol. 2602, pp.294-306, 1996.
  2. M. Ghanbari, 'Two-layer coding of video signals for VBR networks,' IEEE J. Select. Areas Commun., vol. 7, pp. 771-781, June 1989.
  3. MPEG2, 'Information technology-generic coding of moving pictures and associated audio,'Tech. Rep., ISO/IEC 13818-2, Committee Draft, Mar. 1994.
  4. W. Li, 'Overview of fine granularity scalability in MPEG-4 video standard,' IEEE Trans. Circ. Syst. Video Technol., vol. 11, no. 3, pp. 301-317, March 2001.
  5. H. Sun, W. Kwok, and J. W. Zdepski, 'Architectures for MPEG compressed bitstream scaling,' IEEE Trans. Circ. Syst. Video Technol., vol. 6, no. 2, pp. 191-199, April 1996.
  6. B. Shen, I. K. Sethi, and B. Vasudev, 'Adaptive motion-vector resampling for compressed video down sampling,' IEEE Trans. Circ. Syst. Video Technol., vol. 9, no. 6, pp. 929-936, Sept. 1999.
  7. T. Shanableh and M. Ghanbari, 'Heterogeneous video transcoding to lower spati-temporal resolutions and different encodingformats,' IEEE Trans. Multimedia, vol. 2, no. 2, pp. 101-110, June 2000.
  8. M. Sugano, Y. Nakajima, H. Yanagihara, and A. Yoneyama, 'An efficient transcoding from MPEG-2 to MPEG-1,' IEEE Conf. ICIP, pp. 417-420, Thessaloniki, Greece, Oct. 2001.
  9. V. Bhaskaran and K. Konstantinides, Image and Video Compression Standards, Algorithms and Architectures, Boston, MA: Kluwer Academic, 1995.
  10. N. Bjork and C. Christopoulos, 'Transcoder architecture for video coding,' IEEE Trans. Consumer Electronics, vol. 44, no. 1, pp.88-98, Feb. 1998.
  11. M. R. Hashemi, L. Winger, and S. Panchanathan, 'Compressed domain motion vector downscaling of MPEG video,' IEEE Conf. ICIP, pp. 276-279, Kobe, Japan, Oct. 1999.
  12. J. K. Han and H. M. Kim, 'Modified cubic convolution scaler with minimum loss of information,' Optical Engineering, vol. 40, pp. 540-546, April 2001.
  13. R. G. Keys, 'Cubic convolution interpolation for digital image processing,' IEEE Transactions on Acoustics, Speech, and Signal Processing, vol. 29, no. 6, pp. 1153-1160, Dec. 1981.
  14. G. Shen, B. Zeng, Y.-Q. Zhang, and Ming L. Liou, 'Transcoder with arbitrarily resizing capability', IEEE Conf. ISCAS, vol. 5, pp.25-28, Sydney, Australia, May 2001.
  15. S. J. Wee, J. G. Apostolopoulos, and N. Feaster, 'Field-to-frame transcoding with spatial and temporal downsampling,' IEEE Conf. ICIP, Oct. 1999.
  16. N. Feaster and S. J. Wee, 'An MPEG-2 to H.263 transcoder,' SPIE Intl. Symp. Voice, Video, and Data Commun., Sept. 1999