• Title/Summary/Keyword: 내용기반 이미지검색

Search Result 245, Processing Time 0.033 seconds

A Study of Medium Shot Detection (미디엄 숏 검출에 관한 연구)

  • Hyung Lee
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2023.01a
    • /
    • pp.93-95
    • /
    • 2023
  • 본 논문에서는 장편의 드라마나 영화에서 스토리 기반의 축약된 요약본을 자동으로 제작하기 위해 미디엄 숏(medium shot) 크기의 숏(shot)들을 추출하기 위한 방법을 고려한다. 미디엄 숏 정도의 크기는 보통 인물에 중심을 둔 숏들로 인물들 간의 관계에서 특히 대사나 표정으로 내용을 전달하기 위한 목적으로 적극 권장된다. 비디오 검색을 위한 인덱싱에서 신(scene) 전환 검출 및 숏 경계 검출, 그리고 이미지에서 심도와 초점기반의 화질 및 피사체 추출 등을 위해 전통적인 신호/영상처리 기법의 활용에서부터 최근의 기계학습 접목 등 다양한 연구들이 진행되고 있다. 영상문법에 근거하여 편집된 영상물에서 미디엄 숏 정도 크기의 숏들을 추출하여 배열한다면 어느 정도 원본 내용을 충실히 전달할 수 있는 축약된 요약본을 제작할 수 있다는 가정하에 해당 샷들을 블러(blur) 기반으로 검출하기 위해 이와 관련된 키워드들을 기반으로 기존 연구들을 살펴보고 적용 방법을 모색한다.

  • PDF

Combined Image Retrieval System using Clustering and Condensation Method (클러스터링과 차원축약 기법을 통합한 영상 검색 시스템)

  • Lee Se-Han;Cho Jungwon;Choi Byung-Uk
    • Journal of the Institute of Electronics Engineers of Korea CI
    • /
    • v.43 no.1 s.307
    • /
    • pp.53-66
    • /
    • 2006
  • This paper proposes the combined image retrieval system that gives the same relevance as exhaustive search method while its performance can be considerably improved. This system is combined with two different retrieval methods and each gives the same results that full exhaustive search method does. Both of them are two-stage method. One uses condensation of feature vectors, and the other uses binary-tree clustering. These two methods extract the candidate images that always include correct answers at the first stage, and then filter out the incorrect images at the second stage. Inasmuch as these methods use equal algorithm, they can get the same result as full exhaustive search. The first method condenses the dimension of feature vectors, and it uses these condensed feature vectors to compute similarity of query and images in database. It can be found that there is an optimal condensation ratio which minimizes the overall retrieval time. The optimal ratio is applied to first stage of this method. Binary-tree clustering method, searching with recursive 2-means clustering, classifies each cluster dynamically with the same radius. For preserving relevance, its range of query has to be compensated at first stage. After candidate clusters were selected, final results are retrieved by computing similarities again at second stage. The proposed method is combined with above two methods. Because they are not dependent on each other, combined retrieval system can make a remarkable progress in performance.

A Study on Metadata for Images and Videos (이미지 및 비디오 메타데이터에 관한 연구)

  • Im, Eun-Ju;Kim, Seong-Hee
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2005.08a
    • /
    • pp.117-124
    • /
    • 2005
  • 이미지와 비디오가 효율적으로 검색되고 이용되기 위해서는 메타데이터가 구조적으로 기술될 필요가 있다. 본 논문에서는 메타데이터 구축 체계의 기반으로 MPEG-7과 Plateau, ViMod에 대해 분석하였다. MPEG-7에서는 저작 및 생산, 이용, 컨텐츠의 구조적, 개념적 측면 등과 같은 다양한 관점에서 시청각 정보가 기술된다. Plateau는 다양한 응용 분야에 적합하도록 모델링 하였기 때문에 모델이 간단명료하고 응용분야에서는 전문성을 띠고 있으나 범용성이 부족하다는 단점이 있다. ViMod는 질의의 특성을 질의의 확실성, 질의의 차원성, 데이터 의존성 관점에서 정지영상과 비디오 영상으로 분류하고 그 하위 레벨을 내용 의존적인 영상과 내용 독립적인 영상으로 분류하였다.

  • PDF

Methods for Video Caption Extraction and Extracted Caption Image Enhancement (영화 비디오 자막 추출 및 추출된 자막 이미지 향상 방법)

  • Kim, So-Myung;Kwak, Sang-Shin;Choi, Yeong-Woo;Chung, Kyu-Sik
    • Journal of KIISE:Software and Applications
    • /
    • v.29 no.4
    • /
    • pp.235-247
    • /
    • 2002
  • For an efficient indexing and retrieval of digital video data, research on video caption extraction and recognition is required. This paper proposes methods for extracting artificial captions from video data and enhancing their image quality for an accurate Hangul and English character recognition. In the proposed methods, we first find locations of beginning and ending frames of the same caption contents and combine those multiple frames in each group by logical operation to remove background noises. During this process an evaluation is performed for detecting the integrated results with different caption images. After the multiple video frames are integrated, four different image enhancement techniques are applied to the image: resolution enhancement, contrast enhancement, stroke-based binarization, and morphological smoothing operations. By applying these operations to the video frames we can even improve the image quality of phonemes with complex strokes. Finding the beginning and ending locations of the frames with the same caption contents can be effectively used for the digital video indexing and browsing. We have tested the proposed methods with the video caption images containing both Hangul and English characters from cinema, and obtained the improved results of the character recognition.

The Extraction of Effective Index Database from Voice Database and Information Retrieval (음성 데이터베이스로부터의 효율적인 색인데이터베이스 구축과 정보검색)

  • Park Mi-Sung
    • Journal of Korean Library and Information Science Society
    • /
    • v.35 no.3
    • /
    • pp.271-291
    • /
    • 2004
  • Such information services source like digital library has been asked information services of atypical multimedia database like image, voice, VOD/AOD. Examined in this study are suggestions such as word-phrase generator, syllable recoverer, morphological analyzer, corrector for voice processing. Suggested voice processing technique transform voice database into tort database, then extract index database from text database. On top of this, the study suggest a information retrieval model to use in extracted index database, voice full-text information retrieval.

  • PDF

Image retrieval using multiresolution image partition (다해상도 이미지 분할을 이용한 영상 검색)

  • Ahn, Ill-Whan;Kim, Woo-Sung;Lee, In-Sue
    • Annual Conference of KIPS
    • /
    • 2000.04a
    • /
    • pp.874-878
    • /
    • 2000
  • 본 논문에서는 내용 기반 영상 검색 방법 중 "외각선 영역의 색상 분포에 의한 영상 검색"을 제안한다. 영상의 변화가 큰 곳은 해상도를 높게, 낮은 곳은 해상도를 낮게 데이터를 샘플링하여 비교할 데이터의 양을 줄이고, 외각선 영역의 색상을 검출하는데 사용한다. 이때 에지 트리(Edge Tree)를 이용하여 에지(Edge)의 위치 정보와 색상 정보를 유지하며, 검색을 가능하게 하였다. 이와 같은 방법을 사용해서 원하는 영상을 찾을 수 있음을 확인하였다.

  • PDF

Implementation of a Video Retrieval System Using Annotation and Comparison Area Learning of Key-Frames (키 프레임의 주석과 비교 영역 학습을 이용한 비디오 검색 시스템의 구현)

  • Lee Keun-Wang;Kim Hee-Sook;Lee Jong-Hee
    • Journal of Korea Multimedia Society
    • /
    • v.8 no.2
    • /
    • pp.269-278
    • /
    • 2005
  • In order to process video data effectively, it is required that the content information of video data is loaded in database and semantics-based retrieval method can be available for various queries of users. In this paper, we propose a video retrieval system which support semantics retrieval of various users for massive video data by user's keywords and comparison area learning based on automatic agent. By user's fundamental query and selection of image for key frame that extracted from query, the agent gives the detail shape for annotation of extracted key frame. Also, key frame selected by user becomes a query image and searches the most similar key frame through color histogram comparison and comparison area learning method that proposed. From experiment, the designed and implemented system showed high precision ratio in performance assessment more than 93 percents.

  • PDF

Design and Implementation of Scaling-Invariant Boundary Image Matching System (스케일링-불변 윤곽선 이미지 매칭 시스템의 설계 및 구현)

  • Kim, Bum-Soo;Kim, Sang-Pil;Moon, Yang-Sae;Choi, Mi-Jung
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06c
    • /
    • pp.28-30
    • /
    • 2012
  • 본 논문에서는 시계열 매칭 기술을 활용한 스케일링-불변 윤곽선 이미지 매칭 시스템을 설계 및 구현한다. 윤곽선 이미지를 시계열로 나타낼 경우, 스케일된 유사 이미지들을 찾는데 거리 계산이 용이해지고, 인덱스 사용이 가능하여 대용량 데이터베이스 대상의 빠른 검색이 가능해지게 된다. 이를 위해, 기존연구 내용을 기반으로 사용자의 편의를 위해 GUI 환경의 클라이언트-서버 시스템으로 설계 및 구현한다. 먼저, 클라이언트에서는 사용자의 질의 이미지를 시계열로 변환하여 가로 및 세로의 스케일링 팩터구간과 허용치 ${\varepsilon}$과 함께 서버에 전달한다. 서버에서는 클라이언트에서 전달한 값들을 이용하여 범위 질의를 구성하여 이미 구축해놓은 이미지 시계열 데이터베이스의 인덱스를 통해 유사 이미지들을 찾은 후 그 결과 이미지들을 클라이언트로 전달한다. 구현 결과, 스케일링-불변 윤곽선 이미지 매칭은 직관적이고 정확한 매칭을 수행하는 것으로 나타났다.

Implementation of System Retrieving Multi-Object Image Using Property of Moments (모멘트 특성을 이용한 다중 객체 이미지 검색 시스템 구현)

  • 안광일;안재형
    • Journal of Korea Multimedia Society
    • /
    • v.3 no.5
    • /
    • pp.454-460
    • /
    • 2000
  • To retrieve complex data such as images, the content-based retrieval method rather than keyword based method is required. In this paper, we implemented a content-based image retrieval system which retrieves object of user query effectively using invariant moments which have invariant properties about linear transformation like position transition, rotation and scaling. To extract the shape feature of objects in an image, we propose a labeling algorithm that extracts objects from an image and apply invariant moments to each object. Hashing method is also applied to reduce a retrieval time and index images effectively. The experimental results demonstrate the high retrieval efficiency i.e precision 85%, recall 23%. Consequently, our retrieval system shows better performance than the conventional system that cannot express the shale of objects exactly.

  • PDF

A Study on Implementation of XML-Based Information Retrieval System for Video Contents (XML 기반의 동영상콘텐츠 검색 시스템 설계 및 구현)

  • Kim, Yong;So, Min-Ho
    • Journal of the Korean Society for information Management
    • /
    • v.26 no.4
    • /
    • pp.113-128
    • /
    • 2009
  • Generally, a user uses briefly summarized video data and text information to search video contents. To provide fast and accurate search tool for video contents in the process of searching video contents, this study proposes a method to search video clips which was partitioned from video contents. To manage and control video contents and metadata, the proposed method creates structural information based on XML on a video and metadata, and saves the information into XML database. With the saved information, when a user try to search video contents, the results of user's query to retrieve video contents would be provided through creating Xpath which has class structure information. Based on the proposed method, an information retrieval system for video clips was designed and implemented.