Abstract
In this paper, a semi-automatic approach is adopted to extract a semantic object from real-world video sequences human-aided segmentation for the first frame and automatic tracking for the remaining frames. The proposed algorithm has a hierarchical structure using watershed algorithm. Each hierarchy consists of 3 basic steps: First, seeds are extracted from the simplified current frame. Second, region growing bv a modified watershed algorithm is performed to get over-segmented regions. Finally, the segmented regions are classified into 3 categories, i.e., inside, outside or uncertain regions according to region probability values, which are acquired by the probability map calculated from an estimated motion-vector field. Then, for the remaining uncertain regions, the above 3 steps are repeated at lower hierarchies with less simplified frames until every region is classified into a certain region. The proposed algorithm provides prospective results in studio-quality sequences such as 'Claire', 'Miss America', 'Akiyo', and 'Mother and daughter'.
본 논문에서는, 동영상에서 의미 있는 객체 영역을 추출하기 위해서, 첫 장의 영상 분할은 사람에 의해서 주어진 것으로 가정하고, 그 다음 프레임부터는 사람의 도움 없이 객체를 추적해 가는 반자동 방식의 이동체 추적 알고리즘을 제안한다. 제안하는 알고리즘은 계층적인 구조를 가지며, 각각의 계층에서는 seed 추출, watershed 알고리즘을 이용한 영상 분할, 영역 구분의 단계를 거쳐 영상 분할을 수행한다. 영역 구분 단계에서는, 순방향으로 추정된 움직임 벡터장으로부터 영역 분할의 판단 기준을 만들고 이를 이용하여 각각의 영역을 '객체 영역', '배경 영역', '불확실 영역'으로 구분한다. 이때, '불확실 영역'으로 구분된 영역들에 대해서는 좀 더 낮은 계층에서 위의 단계들을 반복하여 다시 수행하게 한다. 제안한 알고리즘은 컴퓨터 모의실험을 통해서 'Claire', 'Miss America', 'Akiyo', 'Mother and daughter'의 영상에서 바람직한 추적 결과를 나타냄을 확인하였다.