• 제목/요약/키워드: Video shot modeling

검색결과 6건 처리시간 0.022초

샷 경계 검출을 이용한 영상 클립 생성 (Generation of Video Clips Utilizing Shot Boundary Detection)

  • 김혁만;조성길
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제7권6호
    • /
    • pp.582-592
    • /
    • 2001
  • 대용량 영상을 다루는 디지털 비디오 라이브러리나 웹 방송에서는 영상 색인이 매우 중요한 역할을 하며, 이는 영상을 내용 단위로 분할하는 알고리즘에 기반한다. 본 논문에서 구현된 V2Web Studio는 영상 색인을 지원하는 시스템으로서, 샷 경계 검출 알고리즘을 이용한 영상 클립 생성 시스템이다. V2Web Studio는 영상 클립 생성 과정을 1) 영상 신호를 분석하여 샷 경계를 자동 검출하는 단계, 2) 검출된 결과에 포함될 수 있는 오류를 수작업으로 제거하는 단계, 3) 물리적인 샷 경계를 논리적인 계층구조로 모델링하는 단계, 4) 계층구조로 모델링된 각 모델링 인스턴스를 다양한 표준 압축 포맷으로 생성하는 단계로 구분하고, 각 단계에 해당하는 작업은 샷 검출기, 샷 검증기, 영상 모델기, 클립 생성기라는 독립적인 소프트웨어 도구로 구현하였다.

  • PDF

Background memory-assisted zero-shot video object segmentation for unmanned aerial and ground vehicles

  • Kimin Yun;Hyung-Il Kim;Kangmin Bae;Jinyoung Moon
    • ETRI Journal
    • /
    • 제45권5호
    • /
    • pp.795-810
    • /
    • 2023
  • Unmanned aerial vehicles (UAV) and ground vehicles (UGV) require advanced video analytics for various tasks, such as moving object detection and segmentation; this has led to increasing demands for these methods. We propose a zero-shot video object segmentation method specifically designed for UAV and UGV applications that focuses on the discovery of moving objects in challenging scenarios. This method employs a background memory model that enables training from sparse annotations along the time axis, utilizing temporal modeling of the background to detect moving objects effectively. The proposed method addresses the limitations of the existing state-of-the-art methods for detecting salient objects within images, regardless of their movements. In particular, our method achieved mean J and F values of 82.7 and 81.2 on the DAVIS'16, respectively. We also conducted extensive ablation studies that highlighted the contributions of various input compositions and combinations of datasets used for training. In future developments, we will integrate the proposed method with additional systems, such as tracking and obstacle avoidance functionalities.

비디오 셧의 감정 관련 특징에 대한 통계적 모델링 (Statistical Model for Emotional Video Shot Characterization)

  • 박현재;강행봉
    • 한국통신학회논문지
    • /
    • 제28권12C호
    • /
    • pp.1200-1208
    • /
    • 2003
  • 비디오 데이터에 존재하는 감정을 처리하는 것은 지능적인 인간과 컴퓨터와의 상호작용을 위해서 매우 중요한 일이다. 이러한 감정을 추출하기 위해서는 비디오로부터 감정에 관련된 특징들을 검출하기 위한 컴퓨팅 모델을 구축하는 것이 바람직하다. 본 논문에서는 비디오 셧에 존재하는 저급 특징들의 확률적인 분포를 이용하여 감정 이벤트 발생에 관련된 통계학적인 모델을 제안한다. 즉, 비디오 셧의 기본적인 특징을 추출하고 그 특징을 통계적으로 모델화 하여 감정을 유발하는 셧을 찾아낸다. 비디오 셧의 특징으로는 칼라, 카메라 모션 및 셧 길이의 변화를 이용한다. 이러한 특징들을 EM(Expectation Maximization) 알고리즘을 이용하여 GMM(Gaussian Mixture Model) 으로 모델링하고, 감정과 시간과의 관계를 MLE(Maximum Likelihood Estimation)를 이용하여 시간에 따른 확률분포 모델로 구성한다. 이런 두 개의 통계적인 모델들을 융합하여 베이시안 분류법을 적용하여 비디오 데이터로부터 감정에 관련된 셧을 찾아낸다.

계층화된 비디오 내용 모델링 및 브라우징 (Layered Video Content Modeling and Browsing)

  • 복경수;이낙규;허정필;유재수;조기형;이병엽
    • 정보처리학회논문지D
    • /
    • 제10D권7호
    • /
    • pp.1115-1126
    • /
    • 2003
  • 본 논문에서는 비디오 데이터 대한 구조적 내용과 의미적 내용에 효과적으로 표현하기 위해 비디오 모델링을 제안한다. 또한 사용자가 비디오 데이터에 대한 내용 정보를 쉽게 파악하고 재생할 수 있도록 하는 브라우징 기법을 제안한다. 제안하는 모델링은 원시 데이터 계층, 내용 계층 그리고 키프레임 계층의 세 계층으로 구성되며 비디오 데이터에 대한 논리적인 계층 구조와 의미적 내용은 내용 계층에 표현한다. 비디오 브라우징은 비디오 재생과 내용 정보를 나타내는 두 가지 브라우저를 구현하였다. 비디오 재생 브라우저는 비디오를 재생과 현재화면 정보를 나타내는 기능을 수행한다. 내용 정보 브라우저는 원시데이터, 구조적 내용 그리고 의미적 내용에 대한 정보를 브라우징하는 기능을 제공한다.

Terrain Geometry from Monocular Image Sequences

  • McKenzie, Alexander;Vendrovsky, Eugene;Noh, Jun-Yong
    • Journal of Computing Science and Engineering
    • /
    • 제2권1호
    • /
    • pp.98-108
    • /
    • 2008
  • Terrain reconstruction from images is an ill-posed, yet commonly desired Structure from Motion task when compositing visual effects into live-action photography. These surfaces are required for choreography of a scene, casting physically accurate shadows of CG elements, and occlusions. We present a novel framework for generating the geometry of landscapes from extremely noisy point cloud datasets obtained via limited resolution techniques, particularly optical flow based vision algorithms applied to live-action video plates. Our contribution is a new statistical approach to remove erroneous tracks ('outliers') by employing a unique combination of well established techniques-including Gaussian Mixture Models (GMMs) for robust parameter estimation and Radial Basis Functions (REFs) for scattered data interpolation-to exploit the natural constraints of this problem. Our algorithm offsets the tremendously laborious task of modeling these landscapes by hand, automatically generating a visually consistent, camera position dependent, thin-shell surface mesh within seconds for a typical tracking shot.

많은 통행량과 조명 변화에 강인한 빠른 배경 모델링 방법 (A Fast Background Subtraction Method Robust to High Traffic and Rapid Illumination Changes)

  • 이광국;김재준;김회율
    • 한국멀티미디어학회논문지
    • /
    • 제13권3호
    • /
    • pp.417-429
    • /
    • 2010
  • 배경 제거를 위한 많은 연구가 있어왔음에도 기존의 방법들을 실제 환경에 효과적으로 적용하기에는 아직도 많은 어려움이 있다. 본 논문에서는 배경 제거를 실제 환경에 적용하면서 만나게 되는 다양한 문제들을 해결하기 위해 기존의 가우시안 혼합 모델 방법을 개선하는 배경 제거 방법을 제안한다. 첫째로 제안한 방법은 낮은 계산량을 얻기 위하여 고정 소수점 연산을 이용하였다. 배경 모델링 과정은 변수들의 높은 정밀도를 요구하지 않기 때문에 제안한 방법에서는 고정 소수점 변수를 이용함으로서 정확도를 유지한 채 연산 속도를 크게 향상시킬 수 있었다. 두 번째로 보행자들의 높은 통행량 하에서 흔히 발생되는 전경 객체가 배경으로 학습되는 문제를 피하기 위하여 각 화소의 정적인 정도를 이용하여 배경 모델의 학습 속도를 동적으로 조절하였다. 즉 최근 화소 값에 큰 차이가 발생한 화소들은 배경 영역이 아닐 가능성이 높으므로, 이에 대해 낮은 학습 비율을 적용함으로써 높은 통행량을 보이는 영상에서도 유효한 배경 모델을 유지하는 것이 가능했다. 마지막으로 영상의 빠른 밝기값 변화에 대응하기 위하여 연속한 두 프레임 간의 밝기 변화를 선형 변환으로 추정하였으며, 훈련된 배경 모델을 이 선형 변환에 의해 직접적으로 변환시켜 주었다. 제안한 고정 소수점 연산에 의해 기존의 가우시안 혼합 배경 모델링 방법을 구현한 결과 배경 제거에 기존 방법의 약 30%의 연산시간 만을 필요로 하였다. 또한 제안한 방법을 실제 환경의 영상에 적용한 결과 기존의 배경 제거 방법에 비해 검출률이 약 20% 향상되었으며, 오검률은 5~15% 가량 낮아지는 것을 확인하였다.