Content Based Video Retrieval by Example Considering Context

문맥을 고려한 예제 기반 동영상 검색 알고리즘

  • Published : 2003.12.01

Abstract

Digital Video Library System which manages a large amount of multimedia information requires efficient and effective retrieval methods. In this paper, we propose and implement a new video search and retrieval algorithm that compares the query video shot with the video shots in the archives in terms of foreground object, background image, audio, and its context. The foreground object is the region of the video image that has been changed in the successive frames of the shot, the background image is the remaining region of the video image, and the context is the relationship between the low-level features of the adjacent shots. Comparing these features is a result of reflecting the process of filming a moving picture, and it helps the user to submit a query focused on the desired features of the target video clips easily by adjusting their weights in the comparing process. Although the proposed search and retrieval algorithm could not totally reflect the high level semantics of the submitted query video, it tries to reflect the users' requirements as much as possible by considering the context of video clips and by adjusting its weight in the comparing process.

효율적인 동영상 검색 방법은 많은 양의 동영상 데이터를 관리하는 디지털 비디오 라이브러리 시스템에서 필수적으로 요구되는 기능이다. 본 논문에서는 샷 단위 동영상을 문맥, 전경, 배경, 오디오로 나누어 비교하여 질의 동영상과 비슷한 동영상을 찾아내는 예제 기반 동영상 검색 알고리즘을 제안하였고, 제안한 알고리즘에 따라서 저작 및 검색도구를 구현하였다. 샷간의 관계 정보 즉, 문맥을 고려한다는 것은 인접한 샷들 간의 오디오, 움직임 정보들과 같은 저급 수준 내용 정보 간에 변화 패턴을 비교한다는 것이다. 두 번째 비교 요소인 전경은 움직이는 객체들의 집합을 의미하고, 세 번째 비교 요소인 배경은 전경을 제외한 나머지 비디오 정보를 의미한다. 이러한 비교 방법은 동영상 제작 과정에 근거한 것으로써 사용자로 하여금 직관적인 비교를 할 수 있게 한다. 또한 질의 신을 직접 구성할 수 있게 하였고, 각각의 비교요소에 가중치를 부여할 수 있도록 하여서 사용자의 검색의도를 자유롭게 반영할 수 있도록 하였다. 본 논문에서는 동영상이 가지고 있는 의미 정보를 검색에 완전히 반영하지는 못하지만, 문맥을 통해서 부분적인 의미 정보를 사용할 수 있도록 하였으며, 질의 신 구성과 직관적인 비교 요소를 사용함으로써 사용자의 검색 의도를 최대한 반영하고자 하였다.

Keywords

References

  1. M. Flickner, et. al. , 'Query By Image and Video Content: The QBIC System,' IEEE Computer Magazine, Vo.28, pp.23~32, 1995 https://doi.org/10.1109/2.410146
  2. ISO/IEC JTCl/SC29/WGll Information TecfulologyMultimedia Content Description Interface- Partd: Visual, 2001
  3. ISO/IEC JTC1/SC29/WGll Information Tecfu1ologyMultimedia Content Description Interface-Parts: Audio, 2001
  4. D.Zhong and S.F.Chang, 'An Integrated Approach for Content Based Video Object Segmentation and Retrieval,' IEEE Transactions on Circuits and Systems for Video Technology, Vol.9, No.8, pp.1259-1268, 1999 https://doi.org/10.1109/76.809160
  5. M.M. Yeung and B.Liu, 'Efficient Matching and Clustering of Video Shots,' Proceeding of the IEEE International Conference on Image Processing, Vol.1, pp.338-341, 1995 https://doi.org/10.1109/ICIP.1995.529715
  6. H.Zhang, AWang and Y.Altunbask, 'Content Based Video Retrieval and Compression: A Unified Solution,' Proceeding of the IEEE International Conference on Image Processing, Vol.1, pp.13-16, 1997 https://doi.org/10.1109/ICIP.1997.647372
  7. S.F Chang, W. Chen, H.J.Meng, H.Sundaram and D.zhong, 'A Fully Automated Content Based Video Search Engine Supporting Spatia-Temporal Queries,' IEEE Transactions on Circuits and Systems for Video Technology, Vo1.8, No.5, pp.602615, 1998 https://doi.org/10.1109/76.718507
  8. M.RNaphade, R Wang and T.S. Huang, 'Audio-Visual Query and Retrieval : A System that Uses Dynamic Programming and Relevance Feedback,' faunal of Electronic Imaging, Val.10, pp.861-870, 2001 https://doi.org/10.1117/1.1407822
  9. M.R.Naphade, M.M.Yeung and B.L.Yeo, 'A Novel Scheme for Fast and Efficient Video Sequence Matching using Compact Signature,' Proceeding of SPIE Storage and Retrieval for Media Database 2000, Vol.3972, pp.564 -572, 2000 https://doi.org/10.1117/12.373590
  10. N.Y.Patel and I.K.Sethi, 'Video Shot Detection and Characterization for Video Databases,' Proceeding of SPIE Storage and Retrieval for Image and Video Database, pp.218-225,1997
  11. J F.Long, et al., 'Extracting Semantic Video Objects,' IEEE Computer Graphics and Applications, Vo1.21, pp.48-55, 2001 https://doi.org/10.1109/38.895132
  12. R.J.Qian, P.J.L. van Beek and M.L.Sezan, 'Image Retrieval Blob Histogram,' Proceeding of IEEE Multimedia and Expo 2000, Vol.1, pp.125-128, 2000 https://doi.org/10.1109/ICME.2000.869560
  13. S.Pfeiffer, S.Fischer and W.Effelsberg, 'Automatic Audio Content Analysis,' Proceeding of ACM Multimedia 96, pp.21-30, 1996 https://doi.org/10.1145/244130.244139
  14. S.D.Katz, Film Directing : Shot by Shot, Michael Wiese Production, 1991
  15. 김재홍, MPEG 시스템 스트림 상에서 오디오 정보를 이용한 신경계 검출 방법, 서강대학교 석사학위 논문, 1998
  16. S.Blackbum and D.Deroure, 'A Tool for Content Based Navigation of Music,' Proceeding of ACM Multimedia 98, pp.361-368, 1998 https://doi.org/10.1145/290747.290802
  17. Proceeding of ACM Multimedia 98 A Tool for Content Based Naviagation of Music S.Blackburn;D.Deroure