초록
본 논문에서는 MPEG-4 동영상을 완전히 디코딩하지 않은 상태에서 근사화된 형상 정보를 추출하여 형상의 유사도에 의해 VOP를 클러스터링 하여 VO의 동작을 요약, 검색하는 새로운 방법을 제안한다. 제안하는 형상 추출방법은 Erol의 방법을 단순화한 것으로서, 키 VOP 형상의 정확도는 개선되면서도 실행시간은 감소한다. 제안하는 방법에서는 근사화된 형상 사이의 유사도를 Normalized Mean Hausdorff Distance로 구하며, 이를 2-means 클러스터링하여 VOP를 선정한다. VOP 검색은 질의 형상과 키 VOP의 형상 사이의 Mean Hausdorff Distance를 계산하여 가장 일치하는 키 VOP를 선택하는 방식으로 이루어진다. 제안하는 방법을 표준 MPEG-4 테스트 영상 열에 대해 시험한 결과, 기존의 방법에 비해 근사화된 형상 정보를 더 짧은 시간에 얻을 수 있고, 재귀적 클러스터링 방법을 사용하여 키 VOP들의 정확도도 개선되었다.
We propose a novel method of selecting key VOPs from MPEG-4 compressed domain without fully decoding the compressed data. Approximated shapes of VOPs are obtained from the shape coding mode and then VOPs are clustered by shape similarity to generate key VOPs. The proposed method reduces the computation time of shape approximation, compared with Erol's method. Nevertheless, the resulting VOPs have a good summarizing capability of a video sequence. NMHD (normalized mean Hausdorff distance) values are 2-means clustered to generate key VOPs. In the video search, the MHD of a query VOP from key VOPs are computed and the VOP with the lowest distance is returned. Tests on standard MPEG-4 test sequences show that the computational complexity is very low. Recursive clustering proved to be very effective for generating suitable key VOPs.