• Title/Summary/Keyword: multimedia information retrieval

Search Result 378, Processing Time 0.029 seconds

형태 전역특징과 히스토그램을 이용한 내용 기반 영상 검색 시스템 (Content based Image Retrieval System by Shape Global Feature and Histogram)

  • 황병곤;정성호;이상열
    • 한국산업정보학회논문지
    • /
    • 제7권4호
    • /
    • pp.9-16
    • /
    • 2002
  • 멀티미디어 정보검색 중 내용기반 영상검색은 색상, 질감, 형태 등의 영상 내용 특징들을 이용하여 검색하는 방법으로, 색상과 질감 특징이 영상 검색 시스템에서 일반적으로 널리 사용되고 있다. 그러나 이 시스템은 영상의 형태가 서로 다른 경우 서로 다른 내용을 나타내므로 유사 영상검색에서 오류를 수반할 수 있다. 그러므로 영상의 특징을 나타내는 형태의 사용은 효과적인 내용기반 영상검색에서 중요하다. 그래서 본 논문에서는 영상의 윤곽선에 의한 전역 특징 필터링 처리 후에 형태정보의 히스토그램에 의한 성능이 더 우수한 형태 유사도 영상 검색 시스템을 개발한다.

  • PDF

A Proposal of Multimedia Intelligent Database for Medical Diagnosis

  • MODEGI, Toshio;IISAKU, Shun-ichi
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1997년도 Proceedings International Workshop on New Video Media Technology
    • /
    • pp.61-66
    • /
    • 1997
  • For constructing an intelligent multimedia database system for medical diagnosis, we are focusing on two technological points. One is a retrieval algorithm of databases, and the other is a coding algorithm of multimedia contents. For the first, previously we proposed a front-end database preprocessor called“keyword-network”, and in this paper we present its extended model providing an intelligent logical AND searching function especially for medical differential diagnosis. For the second, we present examples of multimedia intellectual coding methods for cardiovascular examination records.

  • PDF

색상과 모양 정보를 이용한 2단계 영상 검색 기법 (The 2-Phase Image Retrieval Technique using The Color and Shape Information)

  • 김봉기;오해석
    • 한국멀티미디어학회논문지
    • /
    • 제1권2호
    • /
    • pp.173-182
    • /
    • 1998
  • 최근 멀티미디어 기술의 발전으로 인해 영상을 효율적으로 검색할 수 있는 영상 데이터베이스 시스템이 정보화 사회의 중요한 핵심 기술로 대두되고 있다. 본 논문에서는 내용기반 영상 데이터 검색올 위한 영상 특정 추출 방법으로 색상 정보와 모양 정보를 고려하는 2 단계 영상 검색 시스템을 제안하였다 1 단계에서는 색상 정보를 위해서 Striker 등이 제시한 색상 분포 특성올 이용한 색인 방법의 문제점을 보완하고 확장하여 지역 색상 분포 특성을 고려한 색인 방법을 사용하여 1차로 영상을 개략 분류한다. 2 단계에서는 1 단계에서 분류된 집단 영상들에 대하여 2차로 모양 정보를 이용하여 사용자가 질의한 영상과 유사한 영상을 최종적으로 검색한다 모양 정보를 위해서는 기존 불변 모멘트의 문제점인 많은 연산량과, Jain 퉁이 제시한 방향 히스토그램 인터섹션 방법에서 제기된 회전에 민감하다는 문제점을 해결하기 위해 물체의 윤곽선에 해당하는 화소들만을 대상으로 연산을 수행하는 향상된 불변 모멘트(Improved Moment Invariants : IMI)를 이용한다. 실험 영상으 로 300개의 자동차 영상을 사용하여 기존 방법들과의 비교 실험을 통해 향상된 검색 결과를 얻을 수 있었다

  • PDF

고차원 공간에서 유클리드 거리의 효과적인 근사 방안 (An Effective Method for Approximating the Euclidean Distance in High-Dimensional Space)

  • 정승도;김상욱;김기동;최병욱
    • 전자공학회논문지CI
    • /
    • 제42권5호
    • /
    • pp.69-78
    • /
    • 2005
  • 고차원 공간상의 벡터들 간의 유클리드 거리를 빠르게 계산하는 것은 멀티미디어 정보 검색을 위하여 매우 중요하다. 본 논문에서는 고차원 공간상의 두 벡터들 간의 유클리드 거리를 효과적으로 근사하는 방법을 제안한다. 이러한 근사를 위하여 두 벡터들의 놈(norm)을 사용하는 방법이 기존에 제안된 바 있다. 그러나 기존의 방법은 두 벡터간의 각도 성분을 무시하므로 근사 오차가 매우 커지는 문제점을 가진다. 본 연구에서 제안하는 방법은 기준 벡터라 부르는 별도의 벡터를 이용하여 추정된 두 벡터간의 각도 성분을 그들을 위한 유클리드 거리 근사에 사용한다. 이 결과, 각도 성분을 무시하는 기존의 방법과 비교하여 근사 오차를 크게 줄일 수 있다. 또한, 제안된 방법에 의한 근사 값은 유클리드 거리 보다 항상 작다는 것을 이론적으로 증명하였다. 이는 제안된 방법을 이용하여 멀티미디어 정보 검색을 수행할 때 착오 기각이 발생하지 않음을 의미하는 것이다. 다양한 실험에 의한 성능 평가를 통하여 제안하는 방법의 우수성을 규명한다.

A Salient Based Bag of Visual Word Model (SBBoVW): Improvements toward Difficult Object Recognition and Object Location in Image Retrieval

  • Mansourian, Leila;Abdullah, Muhamad Taufik;Abdullah, Lilli Nurliyana;Azman, Azreen;Mustaffa, Mas Rina
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권2호
    • /
    • pp.769-786
    • /
    • 2016
  • Object recognition and object location have always drawn much interest. Also, recently various computational models have been designed. One of the big issues in this domain is the lack of an appropriate model for extracting important part of the picture and estimating the object place in the same environments that caused low accuracy. To solve this problem, a new Salient Based Bag of Visual Word (SBBoVW) model for object recognition and object location estimation is presented. Contributions lied in the present study are two-fold. One is to introduce a new approach, which is a Salient Based Bag of Visual Word model (SBBoVW) to recognize difficult objects that have had low accuracy in previous methods. This method integrates SIFT features of the original and salient parts of pictures and fuses them together to generate better codebooks using bag of visual word method. The second contribution is to introduce a new algorithm for finding object place based on the salient map automatically. The performance evaluation on several data sets proves that the new approach outperforms other state-of-the-arts.

영상 특징 선택을 위한 유전 알고리즘 (Genetic Algorithm for Image Feature Selection)

  • 신영근;박상성;장동식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.193-195
    • /
    • 2006
  • As multimedia information increases sharply, In image retrieval field the method that can analyze image data quickly and exactly is required. In the case of image data, because each data includes a lot of informations, between accuracy and speed of retrieval become trade-off. To solve these problem, feature vector extracting process that use Genetic Algorithm for implementing prompt and correct image clustering system in case of retrieval of mass image data is proposed. After extracting color and texture features, the representative feature vector among these features is extracted by using Genetic Algorithm.

  • PDF

모바일 단말기에서 사용자의 의미기반 검색을 위한 인터페이스 설계 (The Design Interface for Retrieval Meaning Base of User Mobile Unit)

  • 조현섭;오훈
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2007년도 제38회 하계학술대회
    • /
    • pp.1665-1667
    • /
    • 2007
  • Recently, retrieval of various video data has become an important issue as more and more multimedia content services are being provided. To effectively deal with video data, a semantic-based retrieval scheme that allows for processing diverse user queries and saving them on the database is required. In this regard, this paper proposes a semantic-based video retrieval system that allows the user to search diverse meanings of video data for electrical safetyrelated educational purposes by means of automatic annotation processing. If the user inputs a keyword to search video data for electrical safety-related educational purposes, the mobile agent of the proposed system extracts the features of the video data that are afterwards learned in a continuous manner, and detailed information on electrical safety education is saved on the database. The proposed system is designed to enhance video data retrieval efficiency for electrical safety-related educational purposes.

  • PDF

An Identification of the Image Retrieval Domain from the Perspective of Library and Information Science with Author Co-citation and Author Bibliographic Coupling Analyses

  • 윤정원;정은경;변지혜
    • 한국문헌정보학회지
    • /
    • 제49권4호
    • /
    • pp.99-124
    • /
    • 2015
  • As the improvement of digital technologies increases the use of images from various fields, the domain of image retrieval has evolved and become a growing topic of research in the Library and Information Science field. The purpose of this study is to identify the knowledge structure of the image retrieval domain by using the author co-citation analysis and author bibliographic coupling as analytical tools in order to understand the domain's past and present. The data set for this study is 245 articles with 8,031 cited articles in the field of image retrieval from 1998 to 2013, from the Web of Science citation database. According to the results of author co-citation analysis for the past of the image retrieval domain, our findings demonstrate that the intellectual structure of image retrieval in the LIS field consists of predominantly user-oriented approaches, but also includes some areas influenced by the CBIR area. More specifically, the user-oriented approach contains six specific areas which include image needs, information seeking, image needs and search behavior, image indexing and access, indexing of image collection, and web image search. On the other hand, for CBIR approaches, it contains feature-based image indexing, shape-based indexing, and IR & CBIR. The recent trends of image retrieval based on the results from author bibliographic coupling analysis show that the domain is expanding to emerging areas of medical images, multimedia, ontology- and tag-based indexing which thus reflects a new paradigm of information environment.

장면 전환 기법을 이용한 동영상 검색 시스템 설계 (Design of Moving Picture Retrieval System using Scene Change Technique)

  • 김장희;강대성
    • 대한전자공학회논문지SP
    • /
    • 제44권3호
    • /
    • pp.8-15
    • /
    • 2007
  • 최근 멀티미디어 데이터를 효율적으로 전송, 저장 관리 및 검색하는 기술이 중요한 핵심 기술로 대두되고 있다. 그 중에서 멀티미디어 정보 검색의 경우 사용자가 원하는 정보를 표현할 수 있는 사용자 인터페이스 기술과 원하는 정보를 사용자에게 신속하고 정확하게 보여주는 기술의 필요성이 증대하고 있다. 본 논문에서는 MPEG으로 압축된 영상 정보에서 장면의 전환점인 컷을 효과적으로 검출하여 동영상을 분할하는 기법을 제안한다. 컷 검출(Cut detection)은 MPEG 비디오 시퀀스에서 동영상을 분할하는 가장 기본적이면서 중요한 기초 작업이며, 비디오 색인 및 검색을 위한 첫 번째 단계이다. 기존의 방법들은 프레임간을 비교하기 때문에 물체의 빠른 움직임이나 카메라의 움직임, 후레쉬의 섬광 등 화면 변화에 따라 오검출이 생기는 단점이 있다. 제안하는 컷 검출 기법은 먼저 입력영상을 DCT의 DC를 이용하여 샷을 검출한다. 이렇게 검출된 샷으로 데이터베이스를 구성하고, MPEG-7의 시각 기술자 중 HMMD 컬러 모델과 에지 히스토그램을 사용하여 영상에서 특징을 추출하였다. 그리고 제안하는 매칭 기법에 따라 단계별 검색을 수행하였다. 이 실험을 통해서 기존 방법들보다 높은 검색률을 보이는 개선된 동영상 분할 시스템을 설계하였다.

The Kernel Trick for Content-Based Media Retrieval in Online Social Networks

  • Cha, Guang-Ho
    • Journal of Information Processing Systems
    • /
    • 제17권5호
    • /
    • pp.1020-1033
    • /
    • 2021
  • Nowadays, online or mobile social network services (SNS) are very popular and widely spread in our society and daily lives to instantly share, disseminate, and search information. In particular, SNS such as YouTube, Flickr, Facebook, and Amazon allow users to upload billions of images or videos and also provide a number of multimedia information to users. Information retrieval in multimedia-rich SNS is very useful but challenging task. Content-based media retrieval (CBMR) is the process of obtaining the relevant image or video objects for a given query from a collection of information sources. However, CBMR suffers from the dimensionality curse due to inherent high dimensionality features of media data. This paper investigates the effectiveness of the kernel trick in CBMR, specifically, the kernel principal component analysis (KPCA) for dimensionality reduction. KPCA is a nonlinear extension of linear principal component analysis (LPCA) to discovering nonlinear embeddings using the kernel trick. The fundamental idea of KPCA is mapping the input data into a highdimensional feature space through a nonlinear kernel function and then computing the principal components on that mapped space. This paper investigates the potential of KPCA in CBMR for feature extraction or dimensionality reduction. Using the Gaussian kernel in our experiments, we compute the principal components of an image dataset in the transformed space and then we use them as new feature dimensions for the image dataset. Moreover, KPCA can be applied to other many domains including CBMR, where LPCA has been used to extract features and where the nonlinear extension would be effective. Our results from extensive experiments demonstrate that the potential of KPCA is very encouraging compared with LPCA in CBMR.