• 제목/요약/키워드: Descriptor Vectors

검색결과 30건 처리시간 0.03초

비-파라미터 기반의 움직임 분류를 통한 비디오 검색 기법 (Video retrieval method using non-parametric based motion classification)

  • 김낙우;최종수
    • 대한전자공학회논문지SP
    • /
    • 제43권2호
    • /
    • pp.1-11
    • /
    • 2006
  • 본 논문에서는 샷(shot) 기반 비디오 색인 구조에서 비-파라미터(non-parametric) 기반의 움직임 분류를 통한 비디오 영상 검색 기법을 제안한다. 본 논문에서 제안하는 비디오 검색 시스템은 장면 전환 기법을 통해 얻은 샷 단위의 짧은 비디오로부터 대표 프레임과 움직임 정보를 취득한 후, 이를 통해 시각적 특징과 움직임 특징을 추출하여 유사도를 비교함으로써 시-공간적 특징을 이용한 실시간 검색이 가능하도록 구현되었다. 비-파라미터 기반의 움직임 특징의 추출은 MPEG 압축 스트림으로부터 정규화된 움직임 벡터계(界)를 추출한 후, 각각의 정규화된 움직임 벡터를 여러 개의 각도 빈(bin)으로 양자화하고 이의 평균과 분산, 방향 등을 고려함으로써 효과적으로 이루어진다. 대표 프레임에서의 시각 특징 검출을 위해서는 에지 기반의 공간 기술자를 이용하였다. 실험 결과는 영상 색인 및 검색에 있어서 제안된 시스템이 매우 효과적임을 잘 나타내고 있다. 데이터베이스 내 영상의 색인을 위해서는 R*-tree 구조를 이용한다.

실시간 다중 객체 인식 및 추적 기법 (Real-time Multi-Objects Recognition and Tracking Scheme)

  • 김대훈;노승민;황인준
    • 한국항행학회논문지
    • /
    • 제16권2호
    • /
    • pp.386-393
    • /
    • 2012
  • 본 논문에서는 객체의 관심점(interest points)에 대한 지역 특징 기술자를 이용하여 이미지나 동영상에서 다수의 관심 객체를 효과적으로 인식하고 추적하기 위한 기법을 제안한다. 이를 위해 먼저 대상이 되는 객체를 포함하는 다양한 이미지를 수집하고 SURF 알고리즘을 적용하여 객체의 관심점과 그들에 대한 지역 특징 기술자를 생성한다. 지역 특징에 대한 통계적인 분석을 통하여 관심점들 중에서 해당 객체의 특성을 가장 잘 표현하는 대표점(representative points)을 선택하고 이를 바탕으로 이미지에 존재하는 객체를 인식한다. 또한, 지역 특징 기술자의 정합을 응용하여 각 SURF 지점들의 움직임 벡터를 생성하고 이를 기반으로 실시간으로 객체를 추적한다. 제안하는 기법은 모든 객체를 독립적으로 다루기 때문에, 여러 개의 객체를 동시에 인식하고 추적할 수 있다. 다양한 실험을 통해, 동영상에서 객체의 존재 여부 및 종류를 신속하게 판별하고 관심 객체의 추적을 효과적으로 수행할 수 있음을 보인다.

객체의 모양과 색상특징을 이용한 내용기반 영상검색 기법 (A Content-Based Image Retrieval Technique Using the Shape and Color Features of Objects)

  • 박종현;박순영;오일환
    • 한국통신학회논문지
    • /
    • 제24권10B호
    • /
    • pp.1902-1911
    • /
    • 1999
  • 본 논문에서는 객체들의 공간적 특성이 반영된 시각적인 특징벡터를 이용한 내용기반 영상검색 알고리즘을 제안한다. 제안된 검색 기법은 여러 색상으로 이루어진 객체들을 표현하기 위하여 가우시안 혼성 모델을 적용하여 모델의 최대유사 파라미터는 EM 알고리즘을 사용하여 추정한다. GMM을 기반으로 하여 분할된 각 객체들로부터 Fourier descriptor의 색상 히스토그램을 사용하여 모양과 색상 특징을 추출하게 된다. 영상 검색은 두 단계로 구성되는데 첫 단계에서는 공간적인 모양 특성을 추출하여 모양이 유사한 객체들을 후보 영상으로 압축하게 되며 마지막으로 객체의 색상 히스토그램에 의하여 검색이 수행된다. 실험 결과 제안된 알고리즘은 분할된 객체의 공간적, 시각적 특징을 이용하여 효율적으로 검색을 수행할 수 있음을 보여준다.

  • PDF

비디오 검색을 위한 통계적 움직임 활동 기술자 (Statistical Motion Activity Descriptor for Video Retrieval)

  • 심동규;정재원;오대일;김해광
    • 방송공학회논문지
    • /
    • 제5권1호
    • /
    • pp.2-9
    • /
    • 2000
  • 본 논문은 동영상으로부터 추출된 움직임 크기와 방향을 이용한 통계적 움직임 활동(Motion Activity) 특징 기술(Description) 방법과 이를 이용한 비디오 검색에 관한 것이다. 본 논문의 움직임 활동 기술자를 이용하여 동영상 전체, 대표 영상 사이, 시간상 특정 구간에 대한 시공간적 분포 및 변화 정도에 패턴 등에 대한 지각적 특징을 기술할 수 있어, 이러한 움직임 정도가 중요한 특징이 되는 동영상 검색(video retrieval), 원격감시(surveilance), 멀티미디어 데이터베이스, 방송 필터링(broadcasting filtering) 등의 디지털 비디오 서비스 응용들에 효과적으로 활용될 수 있다. 제안한 방법의 효율성을 보이기 위하여 MPEG-7 표준화 과정에서 사용된 다양한 비디오를 가지고 검색 결과를 보인다.

  • PDF

A Frame-Based Video Signature Method for Very Quick Video Identification and Location

  • Na, Sang-Il;Oh, Weon-Geun;Jeong, Dong-Seok
    • ETRI Journal
    • /
    • 제35권2호
    • /
    • pp.281-291
    • /
    • 2013
  • A video signature is a set of feature vectors that compactly represents and uniquely characterizes one video clip from another for fast matching. To find a short duplicated region, the video signature must be robust against common video modifications and have a high discriminability. The matching method must be fast and be successful at finding locations. In this paper, a frame-based video signature that uses the spatial information and a two-stage matching method is presented. The proposed method is pair-wise independent and is robust against common video modifications. The proposed two-stage matching method is fast and works very well in finding locations. In addition, the proposed matching structure and strategy can distinguish a case in which a part of the query video matches a part of the target video. The proposed method is verified using video modified by the VCE7 experimental conditions found in MPEG-7. The proposed video signature method achieves a robustness of 88.7% under an independence condition of 5 parts per million with over 1,000 clips being matched per second.

내용 기반 영상 검색을 위한 에지 기반의 공간 기술자 (Edge-based spatial descriptor for content-based Image retrieval)

  • 김낙우;김태용;최종수
    • 대한전자공학회논문지SP
    • /
    • 제42권5호
    • /
    • pp.1-10
    • /
    • 2005
  • 오늘날 급격한 멀티미디어 정보의 증가에 따라 영상에서의 시각적 특성을 이용하여 멀티미디어 데이터를 검색하는 내용 기반 영상 검색 기법에 대한 관심이 크게 늘어나고 있다. 본 논문에서는 효과적인 영상 검색을 위한 새로운 접근으로서 edge correlogram과 color coherence vector를 이용한 에지 기반의 공간 기술자를 제안한다. 우선 color vector angle기법을 이용하여 주어진 영상을 고주파 성분과 저주파 성분의 영상으로 나눈다. 저주파 성분의 영상에서는 color coherence vector를 이용하여 평탄 화소의 공간적인 색상 분포를 추출함으로써 이를 평탄 영역에서의 특징 정보로서 활용한다. 반면, 고주파 성분의 영상에서는 edge correlogram으로부터 에지 화소들 간의 분포를 추출하여 이를 에지 영역에서의 특징 정보로 이용한다. 제안된 방법은 색상 간의 지엽적인 특성과 전체적인 특성을 모두 가지고 있기 때문에, 영상 간의 비교에 있어서 영상의 모양과 크기의 급격한 변화로 인한 오검출 등에 매우 강건하다. 또한, 영상에서의 구조적인 특징을 이용함으로써 복잡한 영상에 대해서도 간단하고 유연한 특징을 제공한다. 실험 결과는 영상 색인 및 검색에 있어서 제안된 알고리즘이 최근의 여러 히스토그램 정밀화 기법에 비하여 더 효과적임을 보여준다. 데이터베이스 내 영상의 색인을 위해서는 R*-tree 구조를 이용하였다.

인공위성 영상의 객체인식을 위한 영상 특징 분석 (Feature-based Image Analysis for Object Recognition on Satellite Photograph)

  • 이석준;정순기
    • 한국HCI학회논문지
    • /
    • 제2권2호
    • /
    • pp.35-43
    • /
    • 2007
  • 본 논문은 특징검출(feature detection)과 특징해석(feature description) 기법을 이용하여, 영상 매칭 (matching)과 인식(recognition)에 필요한 다양한 파라미터의 변화에 따른 인식률의 차이를 분석하기 위한 실험 내용을 다룬다. 본 논문에서는 영상의 특징분석과 매칭프로세스를 위해, Lowe의 SIFT(Scale-Invariant Transform Feature)를 이용하며, 영상에서 나타나는 특징을 검출하고 해석하여 특징 데이터베이스로 구축한다. 특징 데이터베이스는 구글 어스를 통해 획득한 위성영상으로부터 50여개 건물에 대해 구축되는데, 이는 각 건물 영상으로부터 추출된 특징 점들의 좌표와 128차원의 벡터의 값으로 이루어진 특징 해석데이터로 저장된다. 구축된 데이터베이스는 각 건물에 대한 정보가 태그의 형식으로 함께 저장되는데, 이는 카메라로부터 획득한 입력영상과의 비교를 통해 입력영상이 가리키는 지역 내에 존재하는 건물에 대한 정보를 제공하는 역할을 한다. 실험은 영상 매칭과 인식과정에서 작용하는 내-외부적 요소들을 제시하고, 각 요소의 상태변화에 따라 인식률의 차이를 비교하는 방법으로 진행되었으며, 본 연구의 최종적인 시스템은 모바일기기의 카메라를 이용하여 카메라가 촬영하고 있는 지도상의 객체를 인식하고, 해당 객체에 대한 기본적인 정보를 제공할 수 있다.

  • PDF

지능형 자동차를 위한 조명 변화에 강인한 도로표지판 검출 및 인식 (An Illumination Invariant Traffic Sign Recognition in the Driving Environment for Intelligence Vehicles)

  • 이태우;임광용;배건태;변혜란;최영우
    • 정보과학회 논문지
    • /
    • 제42권2호
    • /
    • pp.203-212
    • /
    • 2015
  • 본 논문은 도로주행 영상에서 도로표지판을 인식하는 방법을 제안한다. 지능형 차량에서 얻어지는 도로표지판 영상은 일반적인 사물 영상과는 다른 두 가지 특징이 있다. 첫째는 대상이 되는 사물들은 종류가 제한적이고 형태가 단순한 도형인 경우가 대부분이다. 둘째는 일반적인 도로주행 영상은 다양한 조명 환경과 날씨 상태로 인해서 선명한 영상을 취득하기 어려운 점이다. 본 논문에서는 조명 변화가 심한 도로주행 영상에 대해서 효과적으로 특징을 추출하기 위해서 Modified Census Transform(MCT)을 개선한 특징추출 방법을 제안한다. 추출된 특징들은 히스토그램으로 쌓여지고 영상 전반에 걸쳐 아주 고차원의 기술자(Descriptor)로 변환되며, 변환된 수많은 기술자들은 가우시안 혼합 모델(Gaussian Mixture Model)을 활용한 Fisher-vector 방법에 의해서 저차원으로 변형하여 특징으로 사용한다. 본 논문에서 제안하는 방법은 일반적인 표지판 인식 방법에 비해서 조명변화에 강한 검출 결과를 보여주었으며, 실시간 검출 및 인식도 가능하였다.

압축 영역에서의 양방향 예측 구조를 이용한 움직임 흐름 분석 (Motion Flow Analysis using Bi-directional Prediction-Independent Framework in MPEG Compressed Domain)

  • 김낙우;김태용;최종수
    • 대한전자공학회논문지SP
    • /
    • 제41권5호
    • /
    • pp.13-22
    • /
    • 2004
  • 비디오 시퀀스는 일반적으로 다양한 움직임을 가지는 객체들로 구성되어 있기 때문에, 움직임 특징은 비디오 검색 등에서 매우 중요한 역할을 한다. 본 논문에서는 MPEG 압축 영상에서의 움직임 벡터를 비디오 영상의 움직임 표현 서술자로 활용하는 새로운 방법이 제안된다. 즉, 압축 영상에서의 다양한 움직임 벡터를 프레임이나 매크로블록 예측 구조에 관계없이 단일 움직임 방향만을 갖도록 하여, 이것을 해당 영상의 서술자로 활용한다. 이를 위하여, 본 논문에서는 양방향 예측 구조를 이용한 벡터 재해석 기법을 제안한다. 보통, 압축 영역에서의 각 프레임 움직임 해석 시, 움직임 벡터가 없는 I 프레임과 그 외 프레임들의 직접 비교는 불가능하지만, 제안 기법은 1, B, p 프레임 등의 모든 프레임에서 동등하게 벡터 해석을 할 수 있게 한다. 제안된 알고리즘은 압축 영상의 전체 복원과정 없이 매크로 블록 영역 상에서 처리함으로써 시간 손실을 줄이고 있으며, 실험 결과는 제안된 방법의 높은 성능을 잘 나타내어 주고 있다.

효과적인 증강현실 구현을 위한 특징점 분석 기반의 마커영상 평가 방법 (Evaluation of Marker Images based on Analysis of Feature Points for Effective Augmented Reality)

  • 이진영;김종호
    • 한국산학기술학회논문지
    • /
    • 제20권9호
    • /
    • pp.49-55
    • /
    • 2019
  • 본 논문에서는 효과적인 마커기반의 증강현실 구현을 위하여 영상 내 객체의 분포에 대한 분석과 반복 패턴을 포함하는 영상의 분류를 통한 마커영상의 평가 방법을 제안한다. 객체의 분포는 영상의 부분적 가림 현상에 따라 객체추적성능에 영향을 미치기 때문에 특징점 좌표의 분산을 이용하여 가림 현상에 취약한 마커영상을 구분할 수 있도록 하였고, 일반 영상과 반복 패턴을 포함하는 영상의 특징점 기술자 벡터의 분포가 현저하게 다르다는 사실에 기반하여 객체의 인식 및 추적에 적합한 영상을 구분할 수 있는 방법을 제안한다. 다양한 실험 결과 제안하는 마커 평가 방법이 가림 현상에 취약한 영상 및 반복 패턴 영상을 구분하는데 우수한 성능을 보이는 것을 확인하였다. 또한 마커영상에 대한 객체 추적 등의 안정성 측면에서 SURF보다 SIFT 기법이 우수한 성능을 보임을 확인할 수 있었다. 이러한 결과를 이용하여 다양한 종류의 마커영상에 대한 적합성 정보를 사용자에게 제공함으로써 효과적인 증강현실 시스템을 구현할 수 있을 것으로 판단된다.