DOI QR코드

DOI QR Code

Content based Video Segmentation Algorithm using Comparison of Pattern Similarity

장면의 유사도 패턴 비교를 이용한 내용기반 동영상 분할 알고리즘

  • Received : 2011.06.21
  • Accepted : 2011.09.07
  • Published : 2011.10.31

Abstract

In this paper, we propose the comparison method of pattern similarity for video segmentation algorithm. The shot boundary type is categorized as 2 types, abrupt change and gradual change. The representative examples of gradual change are dissolve, fade-in, fade-out or wipe transition. The proposed method consider the problem to detect shot boundary as 2-class problem. We concentrated if the shot boundary event happens or not. It is essential to define similarity between frames for shot boundary detection. We proposed 2 similarity measures, within similarity and between similarity. The within similarity is defined by feature comparison between frames belong to same shot. The between similarity is defined by feature comparison between frames belong to different scene. Finally we calculated the statistical patterns comparison between the within similarity and between similarity. Because this measure is robust to flash light or object movement, our proposed algorithm make contribution towards reducing false positive rate. We employed color histogram and mean of sub-block on frame image as frame feature. We performed the experimental evaluation with video dataset including set of TREC-2001 and TREC-2002. The proposed algorithm shows the performance, 91.84% recall and 86.43% precision in experimental circumstance.

본 논문은 내용기반 동영상 분할을 위한 장면의 유사도 패턴 비교 방법을 제안한다. 동영상 장면 전환의 종류는 크게 급진적 전환과 디졸브(dissolve), 페이드인(fade-in), 페이드아웃(fade-out), 와이프 전환(wipe transition)을 포함하는 점진적 전환 형태로 나눌 수 있다. 제안하는 방법은 모든 종류의 장면 전환 검출 문제를 단지 발생 유무의 문제로 간단 정의하고, 장면 전환 종류는 별도로 구분하지 않는다. 장면 전환을 검출하기 위해서는 프레임간의 유사도를 정의해야 한다. 본 논문에서는 장면 내 유사도(within similarity)와 장면 간 유사도(between similarity)를 정의하며 두 유사도의 통계적 패턴 비교를 통하여 최종적으로 장면 전환을 검출하게 된다. 장면 내 유사도와 장면 간 유사도의 비율을 구하는 방법을 통해 플래시라이트나영상 내 물체 움직임에 대한 거짓 양성 검출을 별도의 후처리 과정 없이도 방지할 수 있음을 확인하였다. 프레임의 특징 값으로는 컬러 히스토그램과 프레임 내 평균 화소값을 이용하였다. TREC-2001, TREC-2002 동영상 셋을 포함한 실험 셋에서 성능을 평가한 결과 제안하는 알고리즘의 경우 총 91.84%의 재현율(recall)과 86.43%의 정확도(precision)의 성능을 보임을 확인할 수 있었다.

Keywords

References

  1. B. L. Yeo and B. Liu, "Rapid Scene Analysis on Compressed Video," IEEE Trans. on Circuit and System for Video Technology, Vol.5, pp. 533-544, 1995. https://doi.org/10.1109/76.475896
  2. H. J. Zhang, C. Y. Low, and S. W. Smoliar, "Video Parsing and Browsing using Compressed data," Multimedia Tools and Applications, Vol.1, pp. 89-111, 1995. https://doi.org/10.1007/BF01261227
  3. J. Cao and A. Cai, "A Robust Shot Transition Detection Method Based on Support Vector Machine in Compressed Domain," Journal of LSEVIER, Pattern Recognition Letter , Vol. 28, pp. 1534-1540, 2007. https://doi.org/10.1016/j.patrec.2007.03.011
  4. C. W. Su, H. Y. M. Liao, H. R. Tyan, and L. H. Chen, "A Motion Tolerant Dissolve Detection Algorithm," IEEE Trans. on Multimedia, Vol.7, pp. 1106-1113, 2005. https://doi.org/10.1109/TMM.2005.858394
  5. H. J. Zhang, A. Kanakanhall, and S. W. Smoliar, "Automatic Partitioning of Full-Motion Video," Video and Image Processing on Multimedia System, Vol.1, pp. 10-28, 1993.
  6. A. Nagasaka and Y. Tanaka "Automatic Video Indexing and Full-Video Search for Object Appearances," Proceeding of IFIP 2nd Working Conference. Visual Databases System, Vol.2, pp. 113-127, 1992.
  7. C. L. Huang and B. Y. Liao, "A Robust Scene- Change Detection Method for Video Segmentation," IEEE Trans. on Circuits and System for Video Technology, Vol.11, pp. 1281-1288, 2001. https://doi.org/10.1109/76.974682
  8. Z. Rasheed and M. Shah, "Video Categorization using Semantics and Semiotics," Video mining, pp. 185-217, 2003.
  9. 고경철, 이양원, "변형된 $x^2$-테스트와 자동 임계치-결정 알고리즘을 이용한 장면전환 검출 기법," 전자공학회논문지, 제42권, 제4호, pp. 51-58, 2005.
  10. B. Truong, C. Dorai, and S. Venkatesh, "New Enhancements to Cut, Fade, and Dissolve Detection Processes in Video Segmentation," Proceedings of the 8th ACM International Conference on Multimedia, pp. 219-227, 2000.
  11. 고경철, 최영일, 이양원, "플래시라이트에 강건한 장면전환 검출 알고리즘," 전자공학회논문지, 제43권, 제6호, pp. 83-91 2006년.
  12. R. Lienhart, "Reliable Dissolve Detection," Proceeding of SPIE in Storage and Retrieval for Media Databases, Vol.4315, pp. 219-230, 2001.
  13. A. Hanjalic and H. Zhang "Optimal Shot Boundary Detection Based on Robust Statistical Models," Proceedings of the IEEE International Conference on Multimedia Computing and Systems, Vol.2, pp. 710-714, 1999.
  14. C. W. Ngo, T. C. Pong, and H. J. Zhang. "Motion Analysis and Segmentation Through Spatio-Temporal Slices Processing," IEEE Trans. on Image Processing, Vol.12, pp. 341-355, 2003. https://doi.org/10.1109/TIP.2003.809020
  15. 원인수, 이준우, 임대규, 정동석, "개선된 적응적임계값 결정 알고리즘과 후처리 기법을 적용한 동영상 분할 방법," 멀티미디어학회논문지, Vol. 13, pp. 663-673, 2010.

Cited by

  1. Analysis and Evaluation of Video Search Services of Korean Search Portals: Naver versus Google Korea vol.31, pp.3, 2014, https://doi.org/10.3743/KOSIM.2014.31.3.181
  2. 열차 경로 패턴기반 애니메이션 성능 개선 기술 개발 vol.11, pp.5, 2011, https://doi.org/10.12815/kits.2012.11.5.136