• 제목/요약/키워드: 비디오 객체 분할

검색결과 72건 처리시간 0.031초

클라우지우스 엔트로피와 적응적 가우시안 혼합 모델을 이용한 움직임 객체 검출 (Moving Object Detection using Clausius Entropy and Adaptive Gaussian Mixture Model)

  • 박종현;이귀상;또안;조완현;박순영
    • 전자공학회논문지CI
    • /
    • 제47권1호
    • /
    • pp.22-29
    • /
    • 2010
  • 비디오 시퀀스에서 움직임 있는 객체의 실시간 검출 및 추적은 스마트 감시 시스템에서 매우 중요한 요소로 분류되고 있다. 본 논문에서 우리는 움직임이 있는 객체의 검출을 위해 클라우지우스 엔트로피와 적응적 가우시안 혼합모델을 사용한 객체 검출 방법을 제안한다. 먼저, 엔트로피의 증가는 일반적으로 불안전한 조건에서 많은 엔트로피의 변화가 발생한 경우 복잡성 및 객체의 움직임이 증가함을 의미한다. 만약 순간적으로 엔트로피 변화가 큰 화소는 움직임 객체에 속한다고 고려하여 움직임 분할 특성을 적용한다. 따라서 우리는 먼저 클라우지우스 엔트로피 이론을 적용하여 엔트로피에 대한 에너지 변화량을 dense 맵으로 변환한다. 두 번째로 우리는 움직임 객체를 검출하기 위해 적응적 가우시안 혼합 모델을 적용하였다. 실험 결과에서 제안된 방법이 효율적으로 움직임이 있는 객체를 검출할 수 있었다.

안정화된 역 확산 방정식을 사용한 다중해상도 영상 분할 기법 (A Multiresolution Image Segmentation Method using Stabilized Inverse Diffusion Equation)

  • 이웅희;김태희;정동석
    • 전자공학회논문지CI
    • /
    • 제41권1호
    • /
    • pp.38-46
    • /
    • 2004
  • 영상 분할은 영상을 의미 있는 영역들로 분할하기 위한 기법으로 컴퓨터 비전과 영상 처리 분야에서 중요하게 다루어져 왔다. 또한 영상 분할은 MPEG-4 비디오 표준과 같은 객체 기반 동영상 압축 분야에서도 영상에서 객체 영역을 분할하기 위해 많이 사용된다. 보다 정확한 영역 경계를 얻기 위해 Watershed 알고리즘이 많은 분야에서 적용되고 있다. 그러나 Watershed 알고리즘은 영상내의 경계선 잡음에 매우 취약하고 과분할된 결과가 나타난다고 알려져 있다. 이러한 문제를 해결하기 위해 본 논문에서는 안정화된 역 확산 방정식(Stabilized Inverse Diffusion Equation : SIDE)을 사용하여 잡음에 강인한 분할 특성을 가지면서 다중해상도 접근 방식을 통해 효율도 향상시키는 영상 분할 기법을 제안한다. 또한 본 논문에서는 인접 영역의 레이블을 사용한 영역 투영법과 영역 인접 그래프(Region Adjacency Graph : RAG)를 사용한 영역 병합법도 사용하였다. 제안된 기법을 잡음이 포함된 영상의 분할에 적용시킨 결과 과분할을 감소시키고 분할 효율이 개선됨을 확인할 수 있었다.

객체이동 및 밝기변화를 고려한 샷 전환 탐지 알고리즘 (Shot Detection robust to object movement and brightness changes)

  • 이준구;한기선;유병문;황두성
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.531-534
    • /
    • 2012
  • 기존의 히스토그램을 이용한 샷 전환 탐지 방법은 연속적인 두 프레임의 전체 또는 대응되는 동일한 크기의 소 영역의 히스토그램을 사용하며, 객체의 이동이나, 프레임의 밝기 변화에 취약한 문제점이 있다. 본 논문에서는 이 문제점들을 해결하기 위하여 연속적인 두 프레임(현재와 참조 프레임)을 소영역으로 분할한 후, 현재 프레임의 소 영역과 두 프레임사이에서 발생할 수 있는 객체의 이동을 고려한 참조 프레임에서의 소 영역의 비교, 그리고 참조 프레임의 소 영역에서 얻은 화소 밝기 히스토그램에 밝기 변화를 보상한 후, 현재 프레임의 소 영역에서 얻은 화소 밝기 히스토그램과 비교하는 방법을 제안한다. 제안한 방법은 영화와 뉴스 같은 비디오 데이터에 좋은 결과를 보였다.

인접 블록 상관도를 이용한 적응형 4분할 블록기반 고속 새차예측 기법 (Adaptive Quad Block-based Disparity Estimation Algorithm Using Adjacent Predictors)

  • 송혁;배진우;최병호;유지상
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 추계학술발표대회(상)
    • /
    • pp.294-297
    • /
    • 2003
  • 최근 3차원 영상의 압축 방법에 대한 연구가 여러 분야에서 활발히 이루어지고 있으며, 특히 MPEG에서는 이와 관련하여 Exploration Experiment를 통하여 효율적인 기법을 연구하고 있다. 본 논문에서는 EE3를 위하여 스테레오 비디오 압축을 위한 효율적인 블록기반 시차예측 기법을 제안한다. 제안된 알고리즘은 스테레오 영상의 특성 중 주변 블록의 시차 벡터가 유사하다는 점을 이용하여 주변의 시차벡터를 예측 파라미터로 사용함으로써 계산량을 감소시킬 수 있었다. 또한, 예측 오차가 큰 객체의 경계면에서 블록의 크기를 4분할로 분할하여 시차 벡터를 재검색 하는 기법으로 경계 블록에 대한 예측 오차를 감소시킬 수 있었다. 모의 실험 결과 기존의 블록정합기법(BMA)에 비해 최대 75%의 계산량이 감소하였으며, PSNR 측면에서도 0.3dB이상 개선되었다.

  • PDF

객체추적을 위한 웨이블릿 기반 계층적 능동형태 모델 (Wavelet transform-based hierarchical active shape model for object tracking)

  • 기현종;신정호;이성원;백준기
    • 한국통신학회논문지
    • /
    • 제29권11C호
    • /
    • pp.1551-1563
    • /
    • 2004
  • 여기는 본 논문에서는 움직이는 물체 추적을 위한 윤곽선 및 형태 파라미터 추출을 위해 웨이블릿 변환을 이용한 능동형태모델의 계층적인 접근방법에 대해 제안한다. 능동형태 모델의 여러 단계 중 지역구조 모델링은 비정형 객체의 형태를 추출하기 위해 가장 중요한 비중을 차지한다. 제안한 알고리듬은 웨이블릿을 이용하여 계층적인 접근은 물론 지역구조 모델링단계를 웨이블릿 대역 분할을 이용하여 복잡한 환경에서의 객체를 강건하게 추적할 수 있도록 하였다. 또한 비정형객체를 실시간 비디오 추적에 이용하기 위해 웨이블릿을 이용한 계층적 움직임 추정방법을 적용하여 객체의 움직임을 예측, 보정하는 효과적인 방법을 제시하였다. 제안하는 알고리듬은 객체 추적에 대한 성능을 평가하기 위해 다양한 실험영상을 통해 우수함을 확인하였다.

앵커 객체 추출을 이용한 앵커 프레임 검출 (Anchor Frame Detection Using Anchor Object Extraction)

  • 박기태;황두선;문영식
    • 대한전자공학회논문지SP
    • /
    • 제43권3호
    • /
    • pp.17-24
    • /
    • 2006
  • 본 논문에서는 뉴스 비디오에서 앵커 프레임 검출을 위한 알고리즘을 제안한다. 제안된 알고리즘은 다음과 같이 4단계로 구성된다. 첫 번째 단계에서, 뉴스 비디오를 비디오 샷들로 분할하기 위해 누적 히스토그램(cumulative histogram) 기법을 이용하여 샷 경계(shot boundary)를 검출한다. 두 번째 단계에서는 각 비디오 샷 경계에서 얼굴 영역들을 찾기 위해서 피부 컬러(skin color) 정보를 이용하고, 세 번째 단계에서는, 앵커 객체를 추출하기 위해서 사람의 상체 부분의 컬러 정보를 이용하여 앵커 후보 프레임을 검출하며, 마지막 단계에서, 후보 프레임들에 대해서 앵커 프레임과 비앵커 프레임을 분류하기 위해서 그래프 이론을 이용한 클러스터 분석 알고리즘을 적용한다. 실험 결과를 통해서 제안한 알고리즘이 효과적으로 앵커 프레임을 검출하는 것을 보여준다.

글로벌 가우시안 모델링 기반의 이동 외부 그림자 영역 검출 (Moving Cast Shadow Detection based on Global Gaussian Modeling)

  • 김철문;곽재호;김회율
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2009년도 추계학술대회
    • /
    • pp.259-262
    • /
    • 2009
  • 본 논문에서는 정확한 비디오 객체 분할을 위한 글로벌 가우시안 모델 기반의 이동 외부 그림자영역 검출방법을 제안한다. 이 방법은 현재 픽셀과 배경 픽셀의 컬러 벡터간의 사이 각을 가중치 함수로 변환하고, 이를 그림자 모델의 확률 밀도에 곱하여 구한 값을 그림자 검출에 사용하고 이를 다시 그림자 모델의 입력으로 하여 검출된 픽셀 들의 분포가 자동으로 영상의 실제 그림자 분포에 근접하게 하였다. 또한, 잘못 검출된 그림자 영역을 제거하기 위해 영역의 위치 정보를 이용한다. 실험 결과를 통해 제안하는 방법은 적응적으로 그림자를 검출하면서도 높은 분할 정확도를 가지고 있음을 보인다.

  • PDF

정규화를 이용한 새로운 샷 경계 검출 방법 (New Shot Boundary Detection Method Using Normalization)

  • 신성윤;백성은;표성배;이양원
    • 한국컴퓨터정보학회지
    • /
    • 제15권1호
    • /
    • pp.197-201
    • /
    • 2007
  • 비디오 분할은 샷 경계 검출이라고도 하는데, 비디오를 계층적이고 구조적인 형태로 표현하기 위하여 영상, 문자, 오디오와 같은 매체 속에 포함되어 있는 내용들을 특징별로 분석하여 계층별로 분류하는 작업을 말한다. 본 논문에서는 카메라와 객체의 모션에 보다 강건하고 보다 정확한 결과를 산출하여 충분한 공간 정보를 가지는 지역적 $X^2$-히스토그램 비교 방법을 이용하여 샷 경계를 검출한다. 또한 영상처리에서 영상의 명암 값 향상을 위하여 사용되는 로그함수와 상수를 변형하여 차이 값에 적용하는 정규화 방법을 제시한다. 그리고 샷 경계 검출 알고리즘을 제시하여 일반적인 샷과 갑작스런 샷의 특징을 기반으로 검출한다.

  • PDF

깊이정보를 이용한 HEVC의 인코더 고속화 방법 (HEVC Encoder Optimization using Depth Information)

  • 이윤진;배동인;박광훈
    • 방송공학회논문지
    • /
    • 제19권5호
    • /
    • pp.640-655
    • /
    • 2014
  • 최근 영상시스템 환경은 2D 비디오카메라에 깊이 카메라가 부착되어 2D 및 3D 어플리케이션을 지원하는 형태로 보편화 되고 있다. 이러한 3차원 멀티미디어 시스템 환경으로의 변화는 비디오 시스템에서 깊이정보 획득을 용이하게 만들었다. 깊이정보는 객체 구분, 배경영역 인지 등에 이용할 수 있는데, 2D 부호화에 이를 이용한다면 높은 부호화 효율을 얻을 수 있다. 따라서, 본 논문에서는 차세대 2D 비디오 코덱인 HEVC 인코더에 반영한 깊이정보 이용 비디오 부호화 방법을 제안한다. 제안방법으로, 현재 부호화하려는 CU가 배경영역에 위치할 경우 1) 주변블록의 SKIP 모드를 참조하여 결정하는 CU 분할 조기 결정, 2) 시간적 위치의 CU 정보를 이용하여 수행하는 CU 분할 구조 제한, 3) 배경영역에 따른 움직임 예측 탐색 범위 제한이 있다. 실험은 HEVC 참조 소프트웨어인 HM 12.0에 적용하였고, 실험결과 40% 이상의 부호화 복잡도가 감소했으며, BD-Bitrate는 0.5% 손실되었다. 특히, 마이크로소프트사에서 개발한 키넥트를 통해 획득한 영상을 이용한 실험 결과에서는 영상 품질의 큰 열화 없이 기존대비 최대 53%의 부호화 복잡도가 감소하는 결과를 나타내어, 향후 실시간 화상통신, 모바일 또는 핸드헬드 환경에서의 비디오 서비스 등에서 광범위하게 적용할 수 있을 것으로 기대된다.

Multi-task 수행을 위한 압축 심층신경망 기반 VCM (VCM based on Compression Neural Network for Multi-task)

  • 이해림;이주영;조승현
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 하계학술대회
    • /
    • pp.43-46
    • /
    • 2021
  • 최근 기계 임무수행에 사용되는 데이터양이 증가함에 따라 기계를 위한 효율적인 영상 압축방식의 필요성이 높아졌다. 기존의 비디오 코덱은 HVS (Human Visual System) 특성을 고려한 기술이기 때문에 부호화 과정에서 기계 임무수행에 필요하지 않은 정보를 효과적으로 제거할 수 없다. 반면 심층신경망 기반 압축네트워크의 경우, 원본 영상으로부터 기계 임무수행에 필수적인 데이터만을 추출하여 부호화 하도록 학습할 수 있는 장점이 있다. 본 논문에서는 압축 심층신경망과 기계 임무수행 네트워크로 구성되는 VCM (Video Coding for Machine) 프레임워크를 제안하고 학습에 의한 압축효율 향상을 검증한다. 이를 위해 압축 심층신경망을 객체탐지 임무수행 네트워크와 함께 학습시킨 결과, VVC (Versatile Video Coding) 대비 평균 61.16%의 BD-rate 감소가 확인되었다. 뿐만 아니라, 학습된 압축 심층신경망은 객체분할 임무수행에서도 VVC 대비 평균 58.43%의 BD-rate 감소를 보여 다중 기계 임무의 효율적 수행이 가능함을 확인할 수 있었다.

  • PDF