• Title/Summary/Keyword: Visual Information Retrieval

검색결과 190건 처리시간 0.031초

새로운 비디오 자막 영역 검출 기법 (A new approach for overlay text detection from complex video scene)

  • 김원준;김창익
    • 방송공학회논문지
    • /
    • 제13권4호
    • /
    • pp.544-553
    • /
    • 2008
  • 최근 영상 편집 기술의 발달과 더불어 시청자의 이해를 돕기 위해 인위적으로 자막을 삽입하는 경우가 늘고 있다. 인위적으로 삽입된 자막은 해당 장면의 내용이나 편집자의 의도를 잘 표현하고 있기 때문에 비디오 정보 검색(video information retrieval)이나 비디오 색인(video indexing)과 같은 응용에 유용하다. 기존의 자막 영역 추출 방법은 에지(edge), 색상(color), 텍스처(texture) 정보와 같은 하위 계층(low-level) 특징을 기반으로 하기 때문에 다양한 필체나 밝기 대비를 가진 자막이 동시에 나타나거나 복잡한 배경에 포함된 자막 영역의 경우 잘 검출하지 못한다. 이에 본 논문은 기존의 방법과는 전혀 다른 천이 영역 기반의 새로운 영상 내 자막 영역 검출 기법을 제안하고자 한다. 먼저, 영상 내 삽입된 글자 주변은 시청자에게 영상으로부터의 높이 감을 주기 위해 해당 글자와 다른 색으로 표현된다는 관찰 결과를 바탕으로 천이 지도를 생성한다. 생성된 천이 지도를 이용하여 후보 영역을 추출하고 상태 밀도 개념을 바탕으로 후보 영역 중에서 삽입된 자막 영역을 추출한다. 제안하는 알고리즘은 글자 색, 크기, 위치, 필체, 밝기 대비에 관계없이 적용이 가능하며, 다양한 언어에 관계없이 뛰어난 성능을 보인다. 또한, 프레임 간 자막 영역 업데이트를 통해 자막 영역 추출의 효율을 높였다. 다양한 영상에 대한 실험을 통해 제안하는 알고리즘이 효율적인 비디오 자막 영역 추출 방법임을 보이고자 한다.

불법 동영상 검출을 위한 효율적인 동영상 정합 방법 (Efficient video matching method for illegal video detection)

  • 최민석
    • 디지털융복합연구
    • /
    • 제20권1호
    • /
    • pp.179-184
    • /
    • 2022
  • 정보통신 기술의 발전으로 디지털 콘텐츠의 생산과 유통이 급격히 증가하고 있으며 이와 함께 불법적인 복제 컨텐츠의 유통도 증가하여 여러 문제를 야기하고 있다. 컨텐츠의 불법적인 유통을 막기 위하여 DRM(Digital Rights Management) 기반의 접근 방법을 이용할 수 있지만, 이미 복제되어 유통되는 상황에서는 복제된 컨텐츠를 검색하여 검출하는 방법이 요구된다. 본 논문에서는 동영상 콘텐츠의 내용에 기반한 복제 검출 방법을 제안한다. 제안된 방법은 동영상에서 추출된 비주얼 리듬을 이용하여 동영상을 장면 단위로 분할하고, 분할된 각 장면의 재생 시간과 색상 특징값을 계층적으로 적용하여 대용량 데이터베이스에서 빠르고 효율적으로 복제 동영상 검출이 가능하다. 실험을 통하여 제안된 방법이 다양한 복제 변형에 대하여 안정적 검출이 가능함을 보였다.

이용자 관점에서 본 이미지 색인의 객관성에 대한 연구 (An Investigation of the Objectiveness of Image Indexing from Users' Perspectives)

  • 이지연
    • 정보관리학회지
    • /
    • 제19권3호
    • /
    • pp.123-143
    • /
    • 2002
  • 이미지 색인은 이미지 정보로의 접근에 핵심적인 역할을 수행하는 부분으로 다양한 이미지 색인 방법 및 시스템이 이미지 정보의 종류에 따라 소개되어 왔다. 이미지 색인은 Panofsky의 정보의 단계별 색인에서 출발하여 시소러스, 분류체계, 이미지 기술요소, 범주화 방식 등을 이용하는 방식으로 발전하여 왔다. 이 연구는 Panofsky의 이미지 정보 중 이차 이미지 정보의 색인(iconographical analysis of image information)에 있어 이용자들을 대상으로 하여 그 객관성을 측정하고, 색인의 객관성과 관련된 이미지 기술요소들을 밝혀내고자 하였다. 이미지 속의 인물이나 물체 등 사실적이고 정형화된 일차 이미지 정보와는 대조적으로, 보다 주관적이고 해석적인 이차 이미지 정보의 예로 감정정보를 택하여 48명의 이용자들을 대상으로 2차에 걸친 실험을 하였다. 1차 실험에서는 같은 이미지 안에서 각각의 이용자들이 읽어내는 감정정보의 일치도를 측정하였고 2차 실험에서는 이용자들이 이미지 탐색 과정 중 검색된 이미지에 부여된 색인어에 대한 동의 정도를 통하여 색인의 객관성을 측정하였다. 1차와 2차 실험 결과는 이용자들이 같은 이미지에 대하여 다양한 해석을 내리고 있으며 주관적인 해석이나 개인차가 이차 이미지 정보의 색인에 영향을 미치는 요소로 작용하고 있음을 보여 주었다. 이 연구의 결과는 이차 이미지 정보에 대한 이용자들의 주관적인 반응을 수렴할 수 있는 색인 시스템이나 탐색기법에 대한 계속적인 연구 및 개발의 필요성을 강조하고 있다.

Comparison of Fine-Tuned Convolutional Neural Networks for Clipart Style Classification

  • Lee, Seungbin;Kim, Hyungon;Seok, Hyekyoung;Nang, Jongho
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제9권4호
    • /
    • pp.1-7
    • /
    • 2017
  • Clipart is artificial visual contents that are created using various tools such as Illustrator to highlight some information. Here, the style of the clipart plays a critical role in determining how it looks. However, previous studies on clipart are focused only on the object recognition [16], segmentation, and retrieval of clipart images using hand-craft image features. Recently, some clipart classification researches based on the style similarity using CNN have been proposed, however, they have used different CNN-models and experimented with different benchmark dataset so that it is very hard to compare their performances. This paper presents an experimental analysis of the clipart classification based on the style similarity with two well-known CNN-models (Inception Resnet V2 [13] and VGG-16 [14] and transfers learning with the same benchmark dataset (Microsoft Style Dataset 3.6K). From this experiment, we find out that the accuracy of Inception Resnet V2 is better than VGG for clipart style classification because of its deep nature and convolution map with various sizes in parallel. We also find out that the end-to-end training can improve the accuracy more than 20% in both CNN models.

비디오 검색과 시각적 요약을 위한 장면 기반 계층적 브라우징 기법 (A Scene-based Tree Browsing Technique for Video Retrieval and Visual Summary)

  • 임동혁;이석룡;정진완
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권2호
    • /
    • pp.181-187
    • /
    • 2001
  • 디지털 비디오의 사용이 일반화되어감에 따라 비디오 브라우징에 대한 연구가 더욱 요구되 어 지고 있다. 과거에 연구된 바 있는 VCR식 순차탐색기법은 아날로그 비디오 브라우징에 서 사용되던 고전적 방식을 다지털 비디오에 적용한 것이며, 키프레임 정적표현법은 비디오 를 구성하는 프레임을 보이는 방식이다. 이 두 방식이 디지털 비디오의 특성을 충분히 사용 하지 못하기 때문에, 최근에는 비디오 샷산의 계층적 관계를 기반으로 하는 계층적 브라우 징과 장면 간의 관계를 기반으로 하는 장면 기반 브라우징이 주목을 받고 있다. 본 논문에 서는 기존의 비디오 브라우징에 대한 연구들을 자세히 알아보고, 계층적 브라우징과 장면 기반 브라우징에서처럼 비디오 내의 각 장면에 바로 접근할 수 있을 뿐만 아니라, 계층적 브라우징처럼 비디오의 전체구조를 알기 쉽게 보여준다. 또한 브라우징의 결과는 시각적 요 약으로 사용될 수 있다.

  • PDF

다중점 적합성 피드백방법을 이용한 영역기반 이미지 유사성 검색 (Region Based Image Similarity Search using Multi-point Relevance Feedback)

  • 김덕환;이주홍;송재원
    • 정보처리학회논문지D
    • /
    • 제13D권7호
    • /
    • pp.857-866
    • /
    • 2006
  • 질의 이미지의 시각적 특징이 사용자의 상위 수준 개념을 잘 표현하지 못하기 때문에 이미지 검색 시스템의 성능은 보통 매우 낮다. 의미적으로 유사한 이미지들이 매우 다른 시각적 특징을 보일 수도 있으며 따라서 여러 개의 군집에 분산될 수 있다. 본 논문에서는 영역기반 이미지 검색과 군집-합병을 이용한 새로운 적합성 피드백 방법을 결합한 내용기반 이미지 검색 방법을 제안한다. 주요 목표는 의미적 차이를 줄이기 위해 의미적으로 관련된 군집들을 찾는 것이다. 제안된 방법은 영역기반 군집 과정과 군집-합병 과정으로 이루어진다. 적합한 이미지들의 모든 분할된 영역들을 의미적으로 관련된 계층적인 군집으로 구성한다. 잠재된 군집의 개수를 결정하고 근접한 군집들을 합병한 후 최종 군집의 대표점들로 다중 질의를 표현한다. 군집-합병 과정에서 군집의 개수를 찾고 고차원에서 특이점 문제를 해결하기 위하여 호텔링의 $T^2$ 대신에 v개의 주성분을 이용하는 $T_v^2$를 적용하였으며 $T^2$의 성능과 $T_v^2$의 성능의 차이가 없음을 보인다. 실험 결과는 제안된 방법이 내용기반 이미지 검색 시스템의 성능을 개선하는 데 효율적임을 보여준다.

광대역 ISDN용 MPEG 오디오-비쥬열 대화형 통신단말의 설계 및 구현 (A MPEG Audio-Visual Conversational Communication Terminal on the B-ISDN Environment)

  • 황대환;조규섭
    • 한국정보처리학회논문지
    • /
    • 제5권8호
    • /
    • pp.1960-1971
    • /
    • 1998
  • 광대역 ISDN에서 사용될 수 있는 멀티미디어 통신서비스로서 Video on Demand(V0D)와 같은 검색형 분배서비스와 영상전화, 다지점 영상회의와 같은 실시간 대화형 서비스를 대상으로 활발한 연구, 개발이 이루어지고 있다. V0D 서비스에 대한 연구는 Digital Audio-Visual Council(DAVIC)에서 V0D 서버, 전달 망, 그리고 Set-Top Box(STB) 등을 포함한 전체 시스템에 대한 규격을 확정하였고 대화형 멀티미디어 통신단말은 ITU-T SG16에서 H.300 계열 단말의 표준을 대부분 완료한 상태이다. 그러나 이들 기구에서 권고하고 있는 멀티미디어 통신단말의 구조는 주 연구대상의 차이로 인해, 검색형 분배서비스와 대화형 통신서비스를 모두 제공할 수 있는 효율적인 구성 형태를 갖고 있지 못하다. 본 논문은 ITU-T, DAVIC, ATM Forum 등의 권고 및 규격을 면밀히 분석한 후, 동일한 멀티미디어 통신단말에서 V0D 및 대화형 통신서비스를 제공할 수 있는 효율적인 단말의 구조를 제안하고 설계, 구현하였다. 광대역 ISDN을 대상으로 한 통신단말은 범용 PC에 탑재되는 두 개의 add-on 카드로 구현하였으며, ATM 접속을 통한 V0D 및 일-대-일 대화형 멀티미디어 통신 세션 설정와 실험을 통해 기능의 검증을 완료하였다.

  • PDF

The BIOWAY System: A Data Warehouse for Generalized Representation & Visualization of Bio-Pathways

  • Kim, Min Kyung;Seo, Young Joo;Lee, Sang Ho;Song, Eun Ha;Lee, Ho Il;Ahn, Chang Shin;Choi, Eun Chung;Park, Hyun Seok
    • Genomics & Informatics
    • /
    • 제2권4호
    • /
    • pp.191-194
    • /
    • 2004
  • Exponentially increasing biopathway data in recent years provide us with means to elucidate the large-scale modular organization of the cell. Given the existing information on metabolic and regulatory networks, inferring biopathway information through scientific reasoning or data mining of large scale array data or proteomics data get great attention. Naturally, there is a need for a user-friendly system allowing the user to combine large and diverse pathway data sets from different resources. We built a data warehouse - BIOWAY - for analyzing and visualizing biological pathways, by integrating and customizing resources. We have collected many different types of data in regards to pathway information, including metabolic pathway data from KEGG/LIGAND, signaling pathway data from BIND, and protein information data from SWISS-PROT. In addition to providing general data retrieval mechanism, a successful user interface should provide convenient visualization mechanism since biological pathway data is difficult to conceptualize without graphical representations. Still, the visual interface in the previous systems, at best, uses static images only for the specific categorized pathways. Thus, it is difficult to cope with more complex pathways. In the BIOWAY system, all the pathway data can be displayed in computer generated graphical networks, rather than manually drawn image data. Furthermore, it is designed in such a way that all the pathway maps can be expanded or shrinked, by introducing the concept of super node. A subtle graphic layout algorithm has been applied to best display the pathway data.

크라우드소싱 기반 이미지 태깅 시스템 구축 연구 (Development of an Image Tagging System Based on Crowdsourcing)

  • 이혜영;장윤금
    • 한국비블리아학회지
    • /
    • 제29권3호
    • /
    • pp.297-320
    • /
    • 2018
  • 본 연구는 이미지에 대한 접근 및 검색을 향상시키고, 이미지에 대한 설명 제공 도구로서의 태그를 효과적으로 생성하기 위한 방안을 모색하는데 목적이 있다. 이를 위해 이미지 태그를 생성하는 두 가지 방법인 휴먼 태깅과 머신 태깅의 특징을 조사하고 휴먼 태그와 머신 태그의 속성을 비교 분석하였다. 머신 태그는 일반적 속성이 가장 높았으며, 특정적 속성과 시각적 요소는 일부 나타났고, 추상적 속성은 거의 나타나지 않았다. 휴먼 태그도 일반적 속성이 가장 높았으나 휴먼 태그 생성자가 명칭을 알 수 있는 객체 및 장면에 대해서는 특정적 속성의 비중이 높았으며, 감정과 정서, 추상적 개념의 주제뿐 아니라 사건, 장소, 시간, 관계 등이 다양한 태그로 표현되었다. 본 연구를 통해 생성된 태그 집합은 머신러닝 알고리즘을 개선하기 위한 트레이닝 데이터세트를 구성하는데 기초 자료로 활용될 수 있을 것이다.

색인어 가중치 부여 방법에 따른 K-Means 문서 클러스터링의 LSI 분석 (Latent Semantic Indexing Analysis of K-Means Document Clustering for Changing Index Terms Weighting)

  • 오형진;고지현;안동언;박순철
    • 정보처리학회논문지B
    • /
    • 제10B권7호
    • /
    • pp.735-742
    • /
    • 2003
  • 정보검색 시스템에서 문서 클러스터링 기술은 사용자 질의에 대해 검색된 문서들을 문서간의 유사도를 기반으로 특정 주제에 따라 재배치하여 놓는 기술로써 사용자에게 검색의 편의성을 제공하고, 그 결과들을 시각적으로 보여줄 수 있다. 본 논문에서는 K-Means 알고리즘을 사용하여 문서를 클러스터링하며 문서를 대표하는 색인어에 가중치를 부여하는 기법에 대하여 논한다. 클러스터링 결과를 시각적으로 보여주기 위하여 문서와 클러스터 중심들을 2차원 공간으로 사상하기 위한 Latent Semantic Indexing 접근 방법을 적용하였다. 실험 결과 문서의 색인어에 대한 가중치 부여 방법을 동일하게 하거나 또는 유사한 수식을 적용한 사례보다는 로컬가중치, 글로벌가중치, 정규화 요소를 모두 부여한 사례에서 문서들이 2차원 벡터 공간에서 군집하여 분포하는 클러스터링 효과가 우수하였다. 특히 로컬 가중치와 글로벌 가중치에 logarithm을 적용하였을 때 문서 분포의 군집도는 현저하게 나타남을 알 수 있었다.