DOI QR코드

DOI QR Code

Multi-modal Detection of Anchor Shot in News Video

다중모드 특징을 사용한 뉴스 동영상의 앵커 장면 검출 기법

  • Published : 2007.07.29

Abstract

In this paper, an efficient detection algorithm of an anchor shot in news video is presented. We observed the audio visual characteristics of news video and proposed several low level features which are appropriate for detecting an anchor shot in news video. The overall structure of the proposed algorithm is composed of 3 stages: the pause detection, the audio cluster classification, and the matching with motion activity stage. We used the audio features as well as the motion feature in order to improve the indexing accuracy and the simulation results show that the performance of the proposed algorithm is quite satisfactory.

본 논문에서는 뉴스 동영상 정보의 생성을 위해 뉴스 단위의 기준이 되는 앵커 장면을 효과적으로 검출하는 기법을 제안한다. 우선 뉴스 동영상의 오디오 및 비디오 구성 요소에 대한 관찰을 통하여 앵커 장면 검출에 적합한 기본적인 특징들을 선택하였다. 제안 알고리듬에서는 색인의 정확도를 높이기 위해 몇몇 오디오 특징과 함께 비디오 특징으로서 움직임 특징을 함께 이용하였으며, 전체적인 구조는 '오디오 정지 구간 검출', '오디오 클러스터 분류', 그리고 '움직임 활동도와의 매칭'의 3단계로 구성된다. MPEG-2 방식으로 부호화된 뉴스 동영상에 대한 실험을 통해 제안 알고리듬의 성능이 만족스러움을 확인하였다.

Keywords

References

  1. C.G.M. Snoek and M. Worring, 'Multimodal Video Indexing: A Review of the State-of-the-art,' Multimedia Tools and Applications, vol.25, no.1, pp.5-35, 2005 https://doi.org/10.1023/B:MTAP.0000046380.27575.a5
  2. W. Qi, L. Gu. H. Jiang, X.-R. Chen, and H.-J. Zhang, 'Integrating Visual, Audio and Text Analysis for News Video,' Proc. IEEE International Conference on Image Processing, vol.3, pp.520-523, 2000
  3. W. Hsu, L. Kennedy, C-W. Huang, S.-F. Chang, C.-Y. Lin, and G. Iyengar, 'News Video Story Segmentation using Fusion of Multi-level Multi-modal Features in TRECVID 2003,' Proc. IEEE International Conference on Acoustics, Speech, and Signal Processing, vol.3, pp.645-648, 2004
  4. L. Chaisorn, T.-S. Chua, and C.-H. Lee, 'A Multi-Modal Approach to Story Segmentation for News Video,' World Wide Web, vol. 6, no.2, pp.187-208, 2003 https://doi.org/10.1023/A:1023622605600
  5. X. Wu, C.-W. Ngo, and Q. Li, 'Threading and Autodocumenting News Videos,' IEEE Signal Processing Magazine, vol.23, no.3, pp.59-68, 2006
  6. S. Quadri, S. Krishnan, and L. Guan, 'Indexing of NFL Video using MPEG 7 Descriptors and MFCC Features,' Proc. IEEE International Conference on Acoustics, Speech, and Signal Processing, vol.2, pp.429-432, 2005
  7. P. Salembier B.S. Manjunath and T. Sikora, 'Introduction to MPEG 7: Multimedia Content Description Interface,' John Wiley and Sons, England, UK, 2002
  8. D. Li, I.K Sethi, N. Dimitrova, and T. McGee, 'Classification of General Audio Data for Content based Retrieval,' Pattern Recognition Letters, vol.22, no.5, pp.533-544, 2005
  9. I.K. Sethi, and G.P.R. Sarvarayudu, 'Hierarchical Classifier Design using Mutual Information,' IEEE Transactions on Pattern Recognition Machine Intelligence, vol. 4, no.4, pp.441-445, 1982 https://doi.org/10.1109/TPAMI.1982.4767278