• 제목/요약/키워드: indexing video

검색결과 198건 처리시간 0.029초

HEVC 스트림 상에서의 객체 추적 방법 (Object Tracking in HEVC Bitstreams)

  • 박동민;이동규;오승준
    • 방송공학회논문지
    • /
    • 제20권3호
    • /
    • pp.449-463
    • /
    • 2015
  • 동영상에서의 객체 추적은 보안, 색인 및 검색, 감시, 통신, 압축 등 다양한 분야에서 중요하다. 본 논문은 HEVC 비트스트림 상에서의 객체 추적 방법을 제안한다. 복호화를 수행하지 않고, 비트스트림 상에 존재하는 움직임 벡터(MV : Motion Vector)와 부호화 크기 정보를 Spatio-Temporal Markov Random Fields (ST-MRF) 모델에 적용해 객체 움직임의 공간적 및 시간적 특성을 반영한다. 변환계수를 특징점으로 활용하는 객체형태 조정 알고리즘을 적용해 ST-MRF 모델 기반 객체 추적방법에서 나타나는 과분할에 의한 오차전파 문제를 해결한다. 제안하는 방법의 추적성능은 정확도 86.4%, 재현율 79.8%, F-measure 81.1%로 기존방법 대비 평균 F-measure는 약 0.2% 향상하지만 기존방법에서 과분할 및 오차전파가 두드러지는 영상에 대해서는 최대 9% 정도의 성능향상을 보인다. 전체 수행시간은 프레임 당 평균 5.4ms이며 실시간 추적이 가능하다.

하이브리드 클러스터링을 이용한 샷 전환 검출 (The Shot Change Detection Using a Hybrid Clustering)

  • 이지현;강오형;나도원;이양원
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 추계종합학술대회
    • /
    • pp.635-638
    • /
    • 2005
  • 비디오 분할은 비디오 질의 시스템을 만드는 첫 번째 단계로서 각 샷이 같은 내용을 가지는 프레임들의 순서를 표현하는 샷들에 대한 비디오 시퀀스 분할을 목적으로 한다. 샷 전환의 형태는 급진적인 샷 전환과 점진적인 샷 전환으로 구분된다. 샷 전환 검출 접근의 중요한 문제는 샷 전환 검출의 실행을 결정하는 정확한 경계값을 구체화하기 어렵다는 것이다. 또한 클러스터 접근에서는 클러스터의 올바를 수를 찾기가 어렵다. 이러한 문제점들을 개선하고자 컬러-X$^2$ 명도 히스토그램 기반 퍼지 c-means 클러스터링 방법을 이용하여 하이브리드 형태의 샷 전환 검출 방법을 제안 하였다.

  • PDF

샷의 타입을 이용한 뉴스 아카이브 시스템의 설계 및 구현 (Design and Implementation of a news Archive System using Shot Types)

  • 한근주;낭종호;하명환;정병희;김경수
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제7권5호
    • /
    • pp.416-428
    • /
    • 2001
  • 뉴스 아카이브 시스템을 구축하기 위하여서는 먼저 뉴스 비디오 스트림을 기사 단위로 인덱싱하고, 사용자가 기사 비디오를 모두 시청하지 않아도 그 내용을 이해할 수 있도록 하는 추상화 방법이 필요하다. 본 논문에서는 뉴스 비디오 스트림에 대하여 샷 타입을 이용하여 기사 단위로 인덱싱할 수 있는 새로운 기사 경계 검출 방법 및 기사 추상화 방법을 제안하다. 제안한 인덱싱 방법에서는 뉴스 비디오의 샷들을 앵커 샷, 인터뷰 샷, 연설 샷, 보도 샷, 그래픽 자료 샷 등으로 나눈다. 모든 기사는 앵커 샷으로 시작하고, 앵커 샷은 다른 샷에 비하여 길이가 길고 특별한 화면 구조를 가지고 있기 때문에 이를 이용하여 기사 단위의 인덱싱을 수행한다. 또한 각 기사에 대한 효과적인 추상화를 위하여 앵커 샷의 오른쪽 위에 있는 그래픽 데이타와 기사를 이루는 다른 샷들의 키 프레임들을 이용한 기사 포스터를 구성하는 방법을 제안하였다. 여러 종류의 뉴스 비디오 스트림에 대한 실험 결과에 의하면 본 논문에서 제안한 기사 경계 검출 알고리즘의 검출율(recall) 및 정확도 (precision)값이 각각 0.92 및 0.96 이상 됨을 알 수 있다. 또한 본 논문에서는 WWW상에서 수행되는 뉴스 아카이브 시스템의 프로토타입 시스템의 설계 및 구현에 대하여서도 설명한다.

  • PDF

다양한 장서 접근을 위한 디지털 도서관의 프로토타입 구축 (A Digital Library Prototype for Access to Diverse Collections)

  • Choi Won-Tae
    • 한국문헌정보학회지
    • /
    • 제32권2호
    • /
    • pp.295-307
    • /
    • 1998
  • 본 논문은 다양한 유형으로 구성되어 있는 디지털 도서관의 장서가 어떠한 역할을 수행하는지를 나타내는 디지털 도서관의 구축에 관한 것이다. 본 연구에서 구축된 디지털도서관의 프로토타입은 디지털 리포지토리, 필터, 색인 및 검색, 클라이언트의 구조로 되어 있다. 디지털 리포지토리는 여러 가지 유형의 문서유형과 다양한 형태의 데이터베이스로 구성된다. 필터는 다양한 문헌의 포맷을 인식하고 문헌 각각의 조직적인 요소를 지능적으로 구분하는 역할을 수행한다. 본 시스템은 관계형 데이터베이스 관리 시스템인 ORACLE과 ConText를 이용하여 구성되었으며 새로운 객체의 분석 및 조직화, 색인기술의 적용을 용이하게 처리할 수 있다. 클라이언트는 여러 유형의 데이터 포맷(이미지, 오디오 비디오 SGML, PDF, KORMARC 등)의 디스플레이를 위한 브라우저, 뷰어이다. 이용자는 이러한 도구들을 이용하여 문헌을 구분하고 각각의 아이템을 브라우징하고 탐색할 수 있다. 본 연구의 탐색 인터페이스는 HTML과 WWW의 CGI를 이용하여 구현되었다.

  • PDF

Feature-Based Image Retrieval using SOM-Based R*-Tree

  • Shin, Min-Hwa;Kwon, Chang-Hee;Bae, Sang-Hyun
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2003년도 Proceeding
    • /
    • pp.223-230
    • /
    • 2003
  • Feature-based similarity retrieval has become an important research issue in multimedia database systems. The features of multimedia data are useful for discriminating between multimedia objects (e 'g', documents, images, video, music score, etc.). For example, images are represented by their color histograms, texture vectors, and shape descriptors, and are usually high-dimensional data. The performance of conventional multidimensional data structures(e'g', R- Tree family, K-D-B tree, grid file, TV-tree) tends to deteriorate as the number of dimensions of feature vectors increases. The R*-tree is the most successful variant of the R-tree. In this paper, we propose a SOM-based R*-tree as a new indexing method for high-dimensional feature vectors.The SOM-based R*-tree combines SOM and R*-tree to achieve search performance more scalable to high dimensionalities. Self-Organizing Maps (SOMs) provide mapping from high-dimensional feature vectors onto a two dimensional space. The mapping preserves the topology of the feature vectors. The map is called a topological of the feature map, and preserves the mutual relationship (similarity) in the feature spaces of input data, clustering mutually similar feature vectors in neighboring nodes. Each node of the topological feature map holds a codebook vector. A best-matching-image-list. (BMIL) holds similar images that are closest to each codebook vector. In a topological feature map, there are empty nodes in which no image is classified. When we build an R*-tree, we use codebook vectors of topological feature map which eliminates the empty nodes that cause unnecessary disk access and degrade retrieval performance. We experimentally compare the retrieval time cost of a SOM-based R*-tree with that of an SOM and an R*-tree using color feature vectors extracted from 40, 000 images. The result show that the SOM-based R*-tree outperforms both the SOM and R*-tree due to the reduction of the number of nodes required to build R*-tree and retrieval time cost.

  • PDF

MPEG으로 압축된 비디오에서 최소 복호화에 의한 빠른 장면전환검출 알고리듬 (Fast Scene Change Detection Algorithm in MPEG Compressed Video by Minimal Decoding)

  • 김강욱;이재승;김종훈;황찬식
    • 정보처리학회논문지B
    • /
    • 제9B권3호
    • /
    • pp.343-350
    • /
    • 2002
  • 비디오 데이터의 장면전환검출은 연속되는 두 개 샷(shot) 사이의 경계인 컷(cut)을 검출하는 것으로 비디오 검색과 색인에 있어서 매우 중요한 과정이다. 본 논문에서는 압축된 비디오에서 최소 복호화에 의한 빠르고 정확한 장면전환검출 알고리듬을 제안한다. 제안한 방법은 먼저 I-프레임간의 DC 영상을 비교해서 장면전환을 포함한 GOP(group of Picture)를 찾고 GOP 내에서 장면전환이 발생한 정확한 위치는 B-프레임에서 매크로블록의 부호화 형태에 관한 정보를 이용해서 찾는다. 실험결과 제안한 방법이 모든 DC 영상을 사용한 기존의 방법보다 Precision과 Recall 측면에서 더 좋은 성능을 나타내었다. 그리고 제안한 방법은 빠르고 정확하며 작은 저장공간을 필요로 한다는 장점을 가진다.

사용자 제어기반 OTT 콘텐츠 검색 알고리즘 (User control based OTT content search algorithms)

  • 김기영;서유화;박병준
    • 한국컴퓨터정보학회논문지
    • /
    • 제20권5호
    • /
    • pp.99-106
    • /
    • 2015
  • 본 논문에서는 비디오 콘텐츠 검색 및 관리를 위하여 OTT 디바이스 내부의 DB 개발과 이와 연동하여 비디오 질의 검색 서비스를 탑재할 인터페이스(리모콘 스마트폰) 어플리케이션에서 필수적인 요소인 검색 알고리즘의 개발 방법을 제안한다. 디지털 방송이 시작되고 각 가정에 보급이 됨으로써 사용자들이 선택하여 시청하는 채널 및 프로그램의 수와 종류는 공중파 환경과 비교하여 폭발적으로 증가하였다. 채널의 수가 수십에서 수백 개로 늘어남에 따라 사용자는 자신이 원하는 프로그램을 찾기가 점점 어려워지게 되었고 이 문제를 해결하기 위해 콘텐츠 공급자는 소비자의 취향에 맞는 프로그램을 추천해줄 방법이 필요하게 되었다. 시청자의 시청 패턴을 분석하여 사용자의 취향을 분석하여 적합한 프로그램을 추천해줄 수 있는 방법이 필요하다. 이러한 문제를 해결하기 위하여 시청자의 시청 패턴을 분석하여 시청자의 취향에 적합한 프로그램을 추천해줄 수 있는 방법이 필요하다. 본 연구는 개인의 시청 패턴과 히스토리를 바탕으로 OTT 프로그램의 콘텐츠를 추천하는 알고리즘을 구현하였다.

이동 객체의 내용 및 개념 기반 검색을 위한 시공간 모델링에 근거한 시그니쳐 기반 비디오 색인 기법 (A Signature-based Video Indexing Scheme using Spatio-Temporal Modeling for Content-based and Concept-based Retrieval on Moving Objects)

  • 심춘보;장재우
    • 정보처리학회논문지D
    • /
    • 제9D권1호
    • /
    • pp.31-42
    • /
    • 2002
  • 본 논문에서는 비디오 데이터가 지니는 이동 객체의 궤적(Moving Object's Trajectory)을 효과적으로 모델링할 수 있는 시공간 표현 기법(Spatio-Temporal Representation Scheme)과 궤적을 이용한 사용자 질의에 대해 효율적인 검색을 위한 새로운 시그니쳐 기반 접근 기법을 제안한다. 제안하는 시공간 표현 기법은 궤적을 기반으로 하는 내용 기반 검색(Content-based Retrieval)과 궤적에서 일어나는 위치 정보를 통해 얻어진 개념(의미)을 이용한 개념 기반 검색(Concept-based Retrieval)을 지원한다. 아울러, 제안하는 시그니쳐 기반 접근 기법은 데이터 파일을 직접 접근하기 전에 전체 시그니쳐들은 탐색하여 필터링을 수행한 후, 검색된 후보 시그니쳐들에 대해서만 디스크를 접근하기 때문에 순차 탐색에 비해 많은 수의 디스크 접근 횟수를 감소시킴으로써 검색 성능을 향상시킨다. 마지막으로, 성능 평가를 통해 제안하는 방법이 검색 효과(Retrieval Effectiveness) 및 효율(Retrieval Efficiency) 측면에서 기존의 방법인 Li나 Shan의 방법에 비해 우수함을 보인다.

은닉 마르코프 모델을 이용한 MPEG 압축 비디오에서의 점진적 변환의 검출 (Detection of Gradual Transitions in MPEG Compressed Video using Hidden Markov Model)

  • Choi, Sung-Min;Kim, Dai-Jin;Bang, Sung-Yang
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권3호
    • /
    • pp.379-386
    • /
    • 2004
  • 비디오 요약의 첫 걸음은 샷(shot) 변환의 검출이다. 이러한 샷 변환은 점진적인 변환과 급진적인 변환이 있다. 지금까지 급진적인 샷 변환은 이미 주어진 한계치나 연속된 두 프레임의 이미지에 기반을 둔 거리를 이용하여 검출하였고 점진적 변환 또한 일반적으로 한계치를 이용하여 검출하였다. 그러나 한계치에 따라 그 결과가 확연히 달라지고 또한 그 한계치를 정하는 것도 어려운 문제이다. 이 논문에서는 이런 문제의 해결과 MPEG 압축 비디오 상에서 점진적 변화의 검출뿐만 아니라 분류를 해결하는 방법을 제시하였다. 논문에서는 한계치를 사용하지 않은 은닉 마르코프 모델과 MPEG의 근사 DC 값을 이용하여 보다 빠르고 정확한 결과를 얻도록 하였다. 그리고 히스토그램의 차이뿐만 아니라 매크로 블록 (macro block)의 차이라 불리는 새로운 척도를 도입하여 보다 정확한 값을 얻도록 하였다. 은닉 마르코프 모델은 샷, 페이드(fade), 디졸브(dissolve), 컷(cut) 등의 4개의 상태를 갖게 하고 학습은 Baum-Welch 알고리즘으로 필요한 변수들을 추정하였다. 그리고 특정 벡터에 Viterbi 알고리즘을 적용하여 원하는 상태를 얻을 수 있다. 대부분의 실험 결과를 보면 새로 제안한 척도를 사용한 방법이 히스토그램의 차만을 이용한 방법보다 더 좋은 결과를 나타내었으며 이산적 마르코프 모델보다 연속적 마르코프 모델이 좋은 결과를 보여준다.

서브블록 프로세싱을 이용한 정지영상에서의 얼굴 검출 기법 (Detecting Faces on Still Images using Sub-block Processing)

  • 유채곤
    • 정보처리학회논문지B
    • /
    • 제13B권4호
    • /
    • pp.417-420
    • /
    • 2006
  • 본 논문에서는 임의의 배경을 가진 컬러 정지 영상 내에 존재하는 얼굴을 검출하기 위한 방법을 제안한다. 제안 방법은 영상의 배경, 얼굴의 수, 크기, 각도, 피부색상, 그리고 조명에 대하여 불변적인 특정을 가지며, 컬러 클러스터링, 컬러 스캐닝, 서브 블록 프로세싱, 얼굴 영역 검출, 그리고 얼굴 검증과정으로 구성된다. 제안 방법은 사전 트레이닝 단계나 추가적인 데이터베이스를 필요로 하지 않는다. 본 논문의 제안방법은 보안 분야, 동영상과 정지영상의 색인, 그리고 기타 자동화된 컴퓨터비전 분야에 적용될 수 있을 것이다.