은닉 마르코프 모델을 이용한 MPEG 압축 비디오에서의 점진적 변환의 검출

Detection of Gradual Transitions in MPEG Compressed Video using Hidden Markov Model

  • 발행 : 2004.03.01

초록

비디오 요약의 첫 걸음은 샷(shot) 변환의 검출이다. 이러한 샷 변환은 점진적인 변환과 급진적인 변환이 있다. 지금까지 급진적인 샷 변환은 이미 주어진 한계치나 연속된 두 프레임의 이미지에 기반을 둔 거리를 이용하여 검출하였고 점진적 변환 또한 일반적으로 한계치를 이용하여 검출하였다. 그러나 한계치에 따라 그 결과가 확연히 달라지고 또한 그 한계치를 정하는 것도 어려운 문제이다. 이 논문에서는 이런 문제의 해결과 MPEG 압축 비디오 상에서 점진적 변화의 검출뿐만 아니라 분류를 해결하는 방법을 제시하였다. 논문에서는 한계치를 사용하지 않은 은닉 마르코프 모델과 MPEG의 근사 DC 값을 이용하여 보다 빠르고 정확한 결과를 얻도록 하였다. 그리고 히스토그램의 차이뿐만 아니라 매크로 블록 (macro block)의 차이라 불리는 새로운 척도를 도입하여 보다 정확한 값을 얻도록 하였다. 은닉 마르코프 모델은 샷, 페이드(fade), 디졸브(dissolve), 컷(cut) 등의 4개의 상태를 갖게 하고 학습은 Baum-Welch 알고리즘으로 필요한 변수들을 추정하였다. 그리고 특정 벡터에 Viterbi 알고리즘을 적용하여 원하는 상태를 얻을 수 있다. 대부분의 실험 결과를 보면 새로 제안한 척도를 사용한 방법이 히스토그램의 차만을 이용한 방법보다 더 좋은 결과를 나타내었으며 이산적 마르코프 모델보다 연속적 마르코프 모델이 좋은 결과를 보여준다.

Video segmentation is a fundamental task in video indexing and it includes two kinds of shot change detections such as the abrupt transition and the gradual transition. The abrupt shot boundaries are detected by computing the image-based distance between adjacent frames and comparing this distance with a pre-determined threshold value. However, the gradual shot boundaries are difficult to detect with this approach. To overcome this difficulty, we propose the method that detects gradual transition in the MPEG compressed video using the HMM (Hidden Markov Model). We take two different HMMs such as a discrete HMM and a continuous HMM with a Gaussian mixture model. As image features for HMM's observations, we use two distinct features such as the difference of histogram of DC images between two adjacent frames and the difference of each individual macroblock's deviations at the corresponding macroblock's between two adjacent frames, where deviation means an arithmetic difference of each macroblock's DC value from the mean of DC values in the given frame. Furthermore, we obtain the DC sequences of P and B frame by the first order approximation for a fast and effective computation. Experiment results show that we obtain the best detection and classification performance of gradual transitions when a continuous HMM with one Gaussian model is taken and two image features are used together.

키워드

참고문헌

  1. Ullas Gargi, Rangachar Kasturi and Susan H Strayer, 'Performance Characterization of Video-Shot-Change Detection Methods,' IEEE Transaction on circuits and systems for video technology, Vol. 10, No.1, pp. 1-13, Feb. 2000 https://doi.org/10.1109/76.825852
  2. N. Garnaz, X. Huang and S. Panchanathan, 'Scene change detection in MPEG domain,' IEEE Southwest Symposium on Image Analysis and Interpretation, pp. 12-17, 1998 https://doi.org/10.1109/IAI.1998.666852
  3. W.A.C. Fernando, C. N. Canagaraiah, D. R. Bull, 'Fade, dissolve and wipe production in MPEG-2 compressed video,' IEEE transaction on Consumer Electronics, Vol. 46, No.3, pp. 717-727, Aug. 2000 https://doi.org/10.1109/30.883437
  4. Jong-Hyun Park, Soon-Young Park, Warr-Hyun Cho, 'Video Scene Change Detection Using Hierarchical Hidden Markov Model,' IPIU, pp. 196-201, 2001
  5. John S. Boreczky, Lynn D.Wilcox, 'A Hidden Markov Model framework for video segmentation using audio and image features,' Proceedings of the 1998 IEEE International Conference on Acoustics, Speech and Signal processing, Vol. 6, pp. 3741-3744 https://doi.org/10.1109/ICASSP.1998.679697
  6. Boon-Lock Yeo, Bede Liu, 'Rapid scene analysis on compressed video,' IEEE transaction on circuits and systems for video technology, Vol. 5, No.6, pp. 533-544, Dec. 1995 https://doi.org/10.1109/76.475896
  7. Boon-Lock Yeo, Bade Liu, 'On the extraction of DC sequence from MPEG compressed video,' ICIP, Vol. 2, pp. 260-263, 1995 https://doi.org/10.1109/ICIP.1995.537464
  8. Lawrence R. Rabiner, 'A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition,' Proceeding of IEEE, Vol. 77, Issue. 2, pp. 257-286, Feb. 1989 https://doi.org/10.1109/5.18626