• 제목/요약/키워드: contents based image retrieval

검색결과 120건 처리시간 0.028초

자동 주석 갱신 및 다중 분할 칼라 히스토그램 기법을 이용한 멀티미디에 데이터베이스 시스템 (A Multimedia Database System using Method of Automatic Annotation Update and Multi-Partition Color Histogram)

  • 안재명;오해석
    • 정보처리학회논문지B
    • /
    • 제11B권6호
    • /
    • pp.701-708
    • /
    • 2004
  • 기존의 내용기반 비디오 검색 시스템들은 주석기반 검색 또는 특징기반 검색과 같은 단일 방식으로만 검색을 하므로 검색 효율이 낮을 뿐 아니라 완전한 자동 처리가 되지 않아 시스템 관리자나 주석자의 많은 노력을 요구한다. 본 논문에서는 주석기반 검색과 특징기반 검색을 이용하여 대용량의 비디오 데이터에 대한 사용자의 다양한 의미검색을 지원하는 에이전트 기반에서의 자동화되고 통합된 비디오 의미기반 검색 시스템을 제안한다. 사용자의 기본적인 질의를 분석하고 질의에 의해 추출된 키 프레임의 이미지를 사용자가 선택함으로써 인덱싱 에이전트는 추출된 키 프레임의 주석에 대한 의미를 더욱 구체화시킨다. 또한, 사용자에 의해 선택된 키 프레임은 특징기반 검색의 질의 이미지가 되고 인덱싱 에이전트는 제안하는 다중 분할 칼라 히스토그램 기법을 통해 질의 이미지와 데이터베이스의 키 프레임들을 비교한 후 가장 유사한 키 프레임 이미지를 검색하여 사용자에게 디스플레이 한다. 제안하여 구현된 시스템은 현저히 향상된 성능을 보였다.

회전에 견고한 DCT 기반 영상 검색 (DCT-Based Images Retrieval for Rotated Images)

  • 김남이;송주환;유강수
    • 한국콘텐츠학회논문지
    • /
    • 제11권4호
    • /
    • pp.67-73
    • /
    • 2011
  • 일반적인 영상 검색의 경우 질의 영상과 같은 영상 또는 최대한 유사한 영상을 결과로써 보여주게 되는데 회전 영상의 경우에는 일반적인 영상 검색 방법들의 성능이 현저하게 떨어지는 경향이 있다. 이에 따라 본 논문에서는 회전 영상에 대해서도 검색 성능이 우수하도록 하기 위해 질의 영상과 DB 영상에 대해 Harris Corner Detector 알고리즘을 통해 특징점을 구하고, 그 특징점을 토대로 Principal Components Analysis 알고리즘을 이용해 물체의 주축을 구하여 회전 불변 상태의 영상으로 전환한다. 제안한 기법은 Wang의 원본 1000장의 영상과 $30^{\circ}$, $45^{\circ}$, $90^{\circ}$, $135^{\circ}$, $180^{\circ}$로 회전된 총 6000 장의 지름이 256 크기인 자연 영상을 가지고 실험한 결과, 기존의 기법과 비교하였을 때 회전 영상에 대해서도 우수한 검색 성능을 보였다.

MPEG-7에 기반한 동영상 검색 시스템을 위한 계층형 인덱스 기법 (A Hierarchical Index Technique for Moving Image Retrieval System based on MPEG-7)

  • 김택곤;김우생
    • 한국통신학회논문지
    • /
    • 제29권10C호
    • /
    • pp.1444-1450
    • /
    • 2004
  • MPEG-7은 XML을 이용하여 멀티미디어 데이터의 내용에 대한 다양한 정보를 표현하고, 사용자의 요구에 맞추어 검색과 브라우징을 할 수 있도록 지원하는 표준이다. 그러나 MPEG-7 표준은 표현에 대한 표준은 제공하나 검색방법에 대한 표준을 정하지 않았고, 기존의 많은 XML Index로는 MPEG-7 문서를 검색하는데 있어 적합하지 않는 점이 있다. 본 논문에서는 MPEG-7의 구조화된 정보를 이용한 계층구조의 인덱스를 제안하고, 상위레벨의 특징정보를 기반으로 하여 원하는 부분을 찾는 방법을 보인다.

의미적 연관태그와 이미지 내용정보를 이용한 웹 이미지 분류 (Web Image Classification using Semantically Related Tags and Image Content)

  • 조수선
    • 인터넷정보학회논문지
    • /
    • 제11권3호
    • /
    • pp.15-24
    • /
    • 2010
  • 본 논문에서는 대용량 온라인 이미지 공유 사이트를 적용 도메인으로 하여 이미지 검색의 만족도를 높이고자 태그의 의미적 연관성과 이미지 자체의 내용 정보를 결합하는 이미지 분류 방법을 제안한다. 이미지 검색 및 분류 알고리즘이 플리커와 같은 대용량 이미지 공유 사이트에서 활용될 수 있으려면 실제 웹상의 태깅된 이미지를 대상으로 한 적용이 가능해야 한다. 제안된 알고리즘은 'bag of visual word'기반의 이미지 내용으로 웹 이미지를 분류하기 위한 것으로서, 의미적 연관태그를 이용해 일차 검색된 이미지들을 훈련 데이터로 사용하여 카테고리 모델을 훈련하고, PLSA를 적용하여 평가 이미지들을 분류하는 것이다. 제안된 방법으로 플리커의 웹 이미지들을 대상으로 실험한 결과, 태그 정보를 이용한 기존의 방법에 비해 우수한 검색 정확도 및 재현율을 확인할 수 있었다.

빠른 육안 검색을 위한 이중 해상도 영상 데이터베이스 시스템 (The Dual-Resolution Image Database System for the Fast Naked-eye Retrieval)

  • 송영준;서형석
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2003년도 춘계종합학술대회논문집
    • /
    • pp.416-420
    • /
    • 2003
  • 본 논문에서는 내삽법을 이용하여 빠른 육안 검색을 위한 이중 해상도 영상 데이터베이스 시스템을 구현하였다. 단일 고해상도 방식에서 발생하는 블록킹 현상과 두 개의 해상도를 가진 영상들을 각각 데이터베이스에 저장할 때 발생하는 큰 저장 공간의 두 가지 단점을 극복하였다. 제안한 방식은 원 영상을 부샘플링하여 부샘플링 영상을 만들고, 내삽법을 이용하여 부샘플링된 영상의 보간 영상을 만든다. 이 보간 영상과 원영상과의 차영상을 근간으로 복합 이중 해상도 영상 데이터베이스를 구성한다. 60명의 실험 영상으로 실험한 결과 제안한 방식의 검색 시간이 평균 0.003초로, 단순 고해상도 방식의 0.014초에 비해 빠르다, 또한 원영상 하나만을 저장하는 방식에 비해 19,821 byte에서 16,910 byte로 14.7% 개선 효과가 있다.

  • PDF

온라인 이미지 자동 검색 기술을 이용한 미니게임에 관한 연구 (The Research of Mini-Game by Using Online Image Automatic Detection Technology)

  • 황춘화;조광현;김계영;최형일
    • 한국게임학회 논문지
    • /
    • 제11권2호
    • /
    • pp.115-129
    • /
    • 2011
  • 본 논문에서는 쉽게 즐길 수 있는 미니 게임과 같은 콘텐츠에서 이미지 검색 기술을 이용하여 게임에 적합한 이미지를 찾을 수 있고 또한 게임 난이도를 조절할 수 있는 방법도 보여준다. 본 방법에서는 영상처리 기술에서 내용기반 영상검색 방법 중의 색상과 질감 특징 값들을 추출하는 기술을 이용한다. 본 논문에서는 이를 이용하여 미니게임인 카드 짝 맞추기 게임에서 게임 안에 사용되는 카드 이미지를 자동으로 선택하게 한다. 이때 검색 기준이 되는 이미지(시드 이미지)의 개수를 조절하여 게임의 난이도에 적용 할 수 있는 것을 보여준다. 실험을 통하여 기존의 영상검색을 이용할 경우 게임에서 부적합 할 수 있는 이미지가 검색되는 문제가 나오는데 반하여 본 논문에서는 게임에 활용하기 용이한 이미지를 검색 할 수 있다는 것을 보여준다.

Centroid 위치벡터를 이용한 영상 검색 기법 (A Centroid-based Image Retrieval Scheme Using Centroid Situation Vector)

  • 방상배;남재열;최재각
    • 방송공학회논문지
    • /
    • 제7권2호
    • /
    • pp.126-135
    • /
    • 2002
  • 영상은 색상, 형태, 위치, 질감 같은 다양한 특성을 갖고 있기 때문에 하나의 특성만을 이용하여 일괄적으로 영상을 검색할 경우, 만족할 만한 검색효율을 얻기가 어렵다. 특히, 대용량의 영상 데이터베이스일수록 그 같은 현상은 빈번하게 일어나기 때문에 기존의 내용 기반 영상 검색 시스템들은 대부분 하나 이상의 특성을 이용하여 검색효율 향상을 죄하고 있다. 본 논문에서는 Centroid 위치벡터를 이용하여 영상 내의 색상 정보뿐만 아니라, 특정 색상에 대한 위치정보를 고려하는 기법을 제안한다. 질의영상의 한 색상에 대해 Centroid 위치벡터를 추출하고 비교영상의 같은 색상의 Centroid 위치벡터와의 거리를 비교하여 그 거리가 짧을수록 각 색상의 위치 유사도를 높게 책정하는 방식을 제안한다. 제안된 검색 기법은 기존의 색상 분포만을 이용하는 검색 기법에 비해, 원근 처리된 영상에 강인하고, 회전되거나 뒤집힌 영상의 변별력이 향상되었다. 또한, 제안된 방식은 색상정보와 위치정보의 추출을 이원화시키지 않고 동시에 추출함으로써 계산량을 줄이고, 효율적인 색인 파일을 생성하여 검색속도를 향상시켰다.

다중 질의를 위한 적응적 영상 내용 기반 검색 기법 (Adaptive Image Content-Based Retrieval Techniques for Multiple Queries)

  • 홍종선;강대성
    • 대한전자공학회논문지SP
    • /
    • 제42권3호
    • /
    • pp.73-80
    • /
    • 2005
  • 본 최근 영상 및 멀티미디어의 시각적인 내용을 기반으로 하는 검색 방법에 관한 많은 연구들이 진행되고 있다. 내용 기반 영상 검색(content-based image retrieval)에 관한 대부분의 기존의 질의 방법은 입력 영상에 의한 질의 또는 컬러(color), 형태(shape), 특징(texture) 등과 같은 low-level 특징을 사용한다. 그러나 이러한 방법들은 비교적 사용하기 불편하고 방법이 편중되어 있어서 일반 사용자들의 다양한 질의 요구에 적합하지 못하다. 본 논문에서 제안하는 것은 내용 기반 영상 검색 시스템 하의 컬러 객체의 자동 추출과 다중 질의를 위한 레이블링 알고리즘이다. 이것은 먼저 single colorizing 알고리즘을 사용하여 영상의 영역을 단순화 시키고 제안하는 Color and Spatial based Binary tree map (CSB tree map)을 이용하여 컬러 객체를 추출한다. 그리고 제안하는 레이블링 알고리즘을 이용하여 데이터베이스의 객체들을 색인한다. 이것은 컬러와 공간 정보를 고속으로 레이블링 하고 객체의 컬러 속성과 크기 및 위치 정보를 이용하여 객체의 컬러 기반과 공간적 기반의 조합을 바탕으로 하는 사용자의 다양한 질의에 부합할 수 있는 적응성 있는 시스템을 구현한다. 본 논문에서는 "Washington" 데이터베이스를 이용한 비교 실험을 통해서 제안하는 시스템의 검색 결과의 우수함을 알 수 있었다.

위성영상 검색에서 사용자 관심영역을 이용한 적합성 피드백 (Relevance Feedback using Region-of-interest in Retrieval of Satellite Images)

  • 김성진;정진완;이석룡;김덕환
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권6호
    • /
    • pp.434-445
    • /
    • 2009
  • 내용 기반 영상 검색(content based image retrieval)은 영상 자체의 정보를 이용하여 유사 영상을 검색하는 기법이다. 하지만 멀티미디어 데이터는 텍스트 데이터와 달리 얻을 수 있는 데이터가 정확하지 않고 또한 시스템에서 표현되는 데이터의 저차원(low-level)의 표현법과 사용자가 인식하는 고차원(high-level)의 개념(concept)은 상당한 차이를 나타내게 된다. 즉 시스템 상에서 벡터들로 표현된 영상 데이터들이 벡터스페이스 상에서는 가깝지만 실제 사용자는 유사하지 않다고 인식하는 문제점이 발생한다. 이를 의미적 간극(semantic-gap) 문제라고 부른다. 이런 의미적 간극 문제로 인해 영상검색 결과는 좋지 않은 성능을 보이게 된다. 이를 해결하기 위해 사용자의 피드백 정보를 이용하여 질의를 수정하는 적합성 피드백 기법이 널리 사용되고 있다. 하지만 기존의 적합성 피드백은 사용자의 관심영역(region-of-interest, 이하 ROI)를 고려하지 않아 적합한(relevant) 영역의 모든 영역들이 새로운 질의 점을 계산하는 과정에서 사용된다. 시스템은 그 스스로 사용자 관심영역을 알지 못하기 때문에 적합성 피드백을 영상수준(image-level)으로 진행하기 때문이다. 이 논문에서는 복잡한 위성영상 영역 검색에서 관심영역을 사용자가 직접 선택하도록 유도하여 더욱 정확한 질의 점을 계산하여 정확도를 높이는 사용자 관심영역 적합성 피드백 방법을 제시한다. 또한 사용자가 선택하지 않은 부정확한 영상 정보를 이용하여 정확도를 향상시키는 프루닝 기법도 함께 제시한다. 실험을 통하여 사용자 관심영역 적합성 피드백의 우수성과 함께 제안한 프루닝 기법의 효율성도 함께 보여준다.

Machine Learning Based Automatic Categorization Model for Text Lines in Invoice Documents

  • Shin, Hyun-Kyung
    • 한국멀티미디어학회논문지
    • /
    • 제13권12호
    • /
    • pp.1786-1797
    • /
    • 2010
  • Automatic understanding of contents in document image is a very hard problem due to involvement with mathematically challenging problems originated mainly from the over-determined system induced by document segmentation process. In both academic and industrial areas, there have been incessant and various efforts to improve core parts of content retrieval technologies by the means of separating out segmentation related issues using semi-structured document, e.g., invoice,. In this paper we proposed classification models for text lines on invoice document in which text lines were clustered into the five categories in accordance with their contents: purchase order header, invoice header, summary header, surcharge header, purchase items. Our investigation was concentrated on the performance of machine learning based models in aspect of linear-discriminant-analysis (LDA) and non-LDA (logic based). In the group of LDA, na$\"{\i}$ve baysian, k-nearest neighbor, and SVM were used, in the group of non LDA, decision tree, random forest, and boost were used. We described the details of feature vector construction and the selection processes of the model and the parameter including training and validation. We also presented the experimental results of comparison on training/classification error levels for the models employed.