• 제목/요약/키워드: Multimedia database

검색결과 603건 처리시간 0.025초

이미지 단어집과 관심영역 자동추출을 사용한 이미지 분류 (Image Classification Using Bag of Visual Words and Visual Saliency Model)

  • 장현웅;조수선
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권12호
    • /
    • pp.547-552
    • /
    • 2014
  • 플리커, 페이스북과 같은 대용량 소셜 미디어 공유 사이트의 발전으로 이미지 정보가 매우 빠르게 증가하고 있다. 이에 따라 소셜 이미지를 정확하게 검색하기 위한 다양한 연구가 활발히 진행되고 있다. 이미지 태그들의 의미적 연관성을 이용하여 태그기반의 이미지 검색의 정확도를 높이고자 하는 연구를 비롯하여 이미지 단어집(Bag of Visual Words)을 기반으로 웹 이미지를 분류하는 연구도 다양하게 진행되고 있다. 본 논문에서는 이미지에서 배경과 같은 중요도가 떨어지는 정보를 제거하여 중요부분을 찾는 GBVS(Graph Based Visual Saliency)모델을 기존 연구에 사용할 것을 제안한다. 제안하는 방법은 첫 번째, 이미지 태그들의 의미적 연관성을 이용해 1차 분류된 데이터베이스에 SIFT알고리즘을 사용하여 이미지 단어집(BoVW)을 만든다. 두 번째, 테스트할 이미지에 GBVS를 통해서 이미지의 관심영역을 선택하여 테스트한다. 의미연관성 태그와 SIFT기반의 이미지 단어집을 사용한 기존의 방법에 GBVS를 적용한 결과 더 높은 정확도를 보임을 확인하였다.

GC-트리 : 이미지 데이타베이스를 위한 계층 색인 구조 (GC-Tree: A Hierarchical Index Structure for Image Databases)

  • 차광호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권1호
    • /
    • pp.13-22
    • /
    • 2004
  • 멀티미디어 데이타의 사용이 증가함에 따라 고차원 이미지 데이타에 대한 효율적인 색인과 검색 기법이 크게 요구되고 있다. 그러나 많은 노력에도 불구하고 현재의 다차원 색인 기법들은 고차원 데이타 공간에서 만족할 만한 성능을 보여주지 못하고 있다. 이러한 소위 차원의 저주를 해결하기 위해 최근에 차원을 줄이거나 근사 해를 구하는 둥의 접근법이 시도되고 있지만 이러한 방법들은 근본적으로 정확도의 상실이라는 문제를 갖고 있다. 정확도의 보존을 위해 VA-file, LPC-file둥과 같이 벡터 근사에 기반 한 기법들이 최근에 개발되었다. 그러나 이 기법은 검색 성능이 색인 파일의 크기에 큰 영향을 받으며, 한번에 큰 검색 공간을 줄이는 계층 색인 구조의 장점을 상실한다. 본 논문에서는 이미지 데이터베이스에서 유사성 질의를 위한 새로운 계층 색인 구조인 GC-트리를 제안한다. GC-트리는 밀도 함수에 기초하여 데이타 공간을 적응적으로 분할하고, 색인 구조를 동적으로 생성한다. 이러한 특성을 갖는 GC-트리는 군집화 된 고차원 이미지 데이타 검색에 훌륭한 성능을 나타낸다.

Libraries for Life: A Case Study of National Library Board, Singapore

  • Foo, Schubert;Tang, Chris;Ng, Judy
    • 한국문헌정보학회지
    • /
    • 제44권4호
    • /
    • pp.33-59
    • /
    • 2010
  • Library 2.0 advocates a socially rich, multimedia enabled, user originated and communally innovative environment that poses significant opportunities for the libraries to evolve and make themselves even more relevant and significant for her users. This paper presents a case study of the National Library Board of Singapore, in playing a vital role to facilitate the realisation of a long-term key national program, The Singapore Memory (SM) Project. SM embraces the attributes of the Library 2.0 environment to enable the nation's memory to be collected, organised, preserved, discovered, researched, augmented and created. The output of is an evolving collection of knowledge assets on Singapore along a Singapore Memory Content Continuum of existing content that is steadily augmented with new content. The content will be collected across all formats, in any language, from Singaporeans and non-Singaporeans, from any institution and agency, from Singapore and abroad, and from official and unofficial sources. The utopian scenario of SM Project is that any person, community, group or institution who has ever experienced Singapore in any way or has any material on Singapore will engage actively in the contribution, discovery and creation of content for the project, and thus become advocates to further encourage and catalyse more contribution, discovery and creation. The paper outlines the key approaches, concepts and ideas for the project. An important element is the proliferation, exposure and accessibility of the rich contents envisaged in the project. The SM proliferation plan along with examples of how two existing resources, namely, the Singapore Infopedia, a database of articles on Singapore's history, culture, people and events 4 and NewspaperSG, an online resource of current and historic Singapore and Malayan newspapers, have been designed are presented to demonstrate how content can be exposed, searched and discovered.

인터넷 서비스를 지원하는 클립 기반 비디오 검색 시스템의 설계 및 구현 (Design and Implementation of a Clip-Based Video Retrieval System Supporting Internet Services)

  • 양명섭;이윤채
    • 인터넷정보학회논문지
    • /
    • 제2권1호
    • /
    • pp.49-61
    • /
    • 2001
  • 인터넷 사용의 대중화와 네트워크 기술의 발달로 인하여 일반 사용자에 대한 비디오 컨텐츠의 원활한 제공과 편리한 검색 방법이 절실히 요구되고 있는 실정이다. 따라서 본 논문에서는 인터넷 서비스를 지원하는 클립(clip)기반 비디오 검색 시스템을 설계 및 구현한다. 구현된 시스템은 비디오 컨텐츠 제공자의 원활한 서비스를 지원하는 내용기반 인덱싱 시스템과 사용자의 다양한 검색을 지원하는 웹 기반 검색 시스템으로 구성되어 있다. 인덱싱 시스템은 비디오 분할에 의한 대표 프레임 추출과 연관된 정보의 클러스터링에 의한 클립 파일 생성 및 클립단위의 비디오 데이터베이스 구축 방법으로 이루어진다. 검색 시스템은 키워드 질의에 의한 검색 방법과 대표 프레임의 2차원 브라우징 방법 및 클립의 내용을 실시간으로 볼 수 있는 방법으로 이루어진다. 결론적으로 제시된 방법들은 비디오 컨텐츠를 제공하는데 있어서 유용성을 보이며 또한 의도한 비디오 내용을 쉽게 찾을 수 있도록 해준다.

  • PDF

멀티미디어 데이터베이스 전송 알고리즘에 관한 연구 (A Study on Multimedia Database Transmission Algorithm)

  • 최진탁
    • 한국컴퓨터산업학회논문지
    • /
    • 제3권7호
    • /
    • pp.921-926
    • /
    • 2002
  • B+-Tree는 데이터베이스 관리 시스템에서 대용량의 데이터를 효율적으로 관리하기 위해서 가장 널리 사용되는 인덱스이다. 하지만 기존의 B+-Tree는 데이터베이스를 처음 구성할 때나, 인덱스를 새로 구성할 시, 많은 DISK/IO가 발생하고, 삭제 연산이 빈번할 시에는 색인 구조 변경연산이 많이 발생하여 동시성이 떨어진다는 단점이 있다. 이러한 문제점을 해결하기 위해서 대부분의 데이터베이스 시스템에서는 일괄구성과 지연삭제를 이용한다. 하지만 일괄구성 및 지연(Lazy) 삭제 방법을 적용한 B+-Tree를 데이터 베이스 관리 시스템에 적용 하려면 동시성 제어 및 회복 기법이 필수적으로 요구되지만, 이에 대한 연구가 미흡하여 실제 시스템에 적용하기에는 문제가 있다. 본 연구에서는 일괄구성과 지연삭제 방법을 적용한 B+-Tree를 실제 데이터베이스 시스템에 적용할 수 있도록 동시성 및 회복기법을 제안했다. 제안기법은 트랜잭션 Pending 리스트를 사용하여 연속적인 철회(Cascade Rollback)가 발생하지 않고, 재구성시 베이스 테이블에 대한 삽입, 삭제를 가능하게 하여 동시성을 높였으며, 시스템 Queue를 사용하여 일괄구성 연산을 사용자의 트랜잭션에서 수행하지 않고 따로 시스템 트랜잭션으로 처리하여 사용자의 트랜잭션의 응답시간을 줄였다.

  • PDF

Rank Order Filter와 상호상관을 이용한 강인한 눈동자 검출 (Robust Pupil Detection using Rank Order Filter and Cross-Correlation)

  • 장경식;박성대
    • 한국정보통신학회논문지
    • /
    • 제17권7호
    • /
    • pp.1564-1570
    • /
    • 2013
  • 이 논문에서는 rank order 필터와 상호상관을 이용하여 강인하게 눈동자를 찾는 방법을 제안한다. rank order 필터를 사용하여 얼굴 영상에서 눈동자 후보점을 찾는다. 임계치를 변화하며 눈 영역을 이진화하여 눈썹 위치를 구한 후 눈썹 영역의 눈동자 후보점을 제거한다. 눈동자 위치를 보정한 후 두 눈동자 후보점을 기하학적인 제약조건을 기반으로 쌍으로 묶는다. 각 쌍의 두 눈에 대한 유사도를 상호상관을 이용하여 측정하여 가장 큰 값을 갖는 쌍을 최종 눈동자로 결정한다. BioID 얼굴 데이터베이스의 얼굴 영상 500개에 대한 실험 결과 96.8%의 높은 눈동자 검출율을 보였으며 기존 방법보다 약 11.6% 개선된 결과를 얻었다.

의미기반 비디오 검색을 위한 인덱싱 에이전트의 설계 (Design of Indexing Agent for Semantic-based Video Retrieval)

  • 이종희;오해석
    • 정보처리학회논문지B
    • /
    • 제10B권6호
    • /
    • pp.687-694
    • /
    • 2003
  • 최근 멀티미디어 정보의 양이 매우 빠른 속도로 증가함에 따라 비디오 데이터에 대한 다양한 검색은 더욱 중요한 의미를 가지게 되었다. 비디오 데이터를 효율적으로 처리하기 위해서는 비디오 데이터가 가지고 있는 내용에 대한 정보를 데이터베이스에 저장하고 사용자들의 다양한 질의를 처리할 수 있는 의미기반 검색 기법이 요구된다. 기존의 내용기반 비디오 검색 시스템들은 주석기반 검색 또는 특징기반 검색과 같은 단일 방식으로만 검색을 하므로 검색 효율이 낮을 뿐 아니라 완전한 자동 처리가 되지 않아 시스템 관리자나 주석자의 많은 노력을 요구한다. 본 논문에서는 주석기반 검색과 특징기반 검색을 이용하여 대용량의 비디오 데이터에 대한 사용자의 다양한 의미검색을 지원하는 에이전트 기반에서의 자동화되고 통합된 비디오 의미기반 검색 시스템을 제안한다. 사용자의 기본적인 질의와 질의에 의해 추출된 키 프레임의 이미지를 선택함으로써 에이전트는 추출된 키 프레임의 주석에 대한 의미를 더욱 구체화시킨다. 또한, 사용자에 의해 선택된 키 프레임은 질의 이미지가 되어 제안하는 특징기반 검색기법을 통해 가장 유사한 키 프레임을 검색한다. 따라서 의미기반 검색을 통해 비디오 데이터의 검색의 효율을 높일 수 있도록 시스템을 설계한다.

심전도 신호에서 부정맥 환자의 R파 검출 알고리즘 연구 (Study on R-peak Detection Algorithm of Arrhythmia Patients in ECG)

  • 안세종;임창주;김용권;정성택
    • 한국산학기술학회논문지
    • /
    • 제12권10호
    • /
    • pp.4443-4449
    • /
    • 2011
  • 심전도는 다양한 형태의 전기적 신호로 이루어져 있으며, 이러한 신호들의 특징점을 분석함으로써 부정맥을 검출할 수 있다. 지금까지 부정맥 검출을 위한 특징점 추출 방법에 대하여 많은 연구가 이루어졌으나, 복잡한 연산과정으로 실시간 연산 결과를 활용하는 휴대형 기기에는 부적합하다. 이와 같은 문제점을 해결하기 위하여 본 연구에서는 환자의 R-R 간격과 QRS 너비의 정보를 이용하여 R파를 추출하였다. 우선 버터워스 필터를 이용하여 저주파 대역의 잡음을 제거하였으며, R-R간격의 이동평균과 QRS 너비의 이동평균을 이용하여 R파를 추출하였다. 이에 대한 결과 검증은 MIT-BIH 부정맥 데이터베이스의 데이터를 활용하여 실험하였으며, 제공된 데이터의 R파 위치와 제안한 알고리즘의 R파 위치를 비교하였다. 이에 대한 결과로는 제안한 알고리즘 방법이 우수한 검출 성능을 보였으며, 연산과정에서도 효율적인 방법임을 확인 할 수 있었다.

FAES : 감성 표현 기법을 이용한 얼굴 애니메이션 구현 (On the Implementation of a Facial Animation Using the Emotional Expression Techniques)

  • 김상길;민용식
    • 한국콘텐츠학회논문지
    • /
    • 제5권2호
    • /
    • pp.147-155
    • /
    • 2005
  • 본 논문은 여러 가지 감정들 중에서 4가지 감정의 범주 즉, 중성, 두려움, 싫증 및 놀람을 포함한 음성과 감성이 결합되어진 얼굴의 표정을 좀 더 정확하고 자연스러운 3차원 모델로 만들 수 있는 FAES(a Facial Animation with Emotion and Speech) 시스템을 구축하는데 그 주된 목적이 있다. 이를 위해서 먼저 사용할 훈련자료를 추출하고 난후에 감성을 처리한 얼굴 애니메이션에서는 SVM(Support vector machine)[11]을 사용하여 4개의 감정을 수반한 얼굴 표정을 데이터베이스로 구축한다. 마지막으로 얼굴 표정에 감정과 음성이 표현되는 시스템을 개발하는 것이다. 얼굴 표정을 위해서 본 논문에서는 한국인 청년을 대상으로 이루어졌다. 이런 시스템을 통한 결과가 기존에 제시된 방법에 비해서 감정의 영역을 확대시킴은 물론이고 감정인지의 정확도가 약 7%, 어휘의 연속 음성인지가 약 5%의 향상을 시켰다.

  • PDF

IEEE 802.11e 기반 멀티미디어 네트워크를 위한 MAC 매개 변수 최적화 방법 (A MAC Parameter Optimization Scheme for IEEE 802.11e-based Multimedia Networks)

  • 성민영
    • 한국산학기술학회논문지
    • /
    • 제9권2호
    • /
    • pp.455-461
    • /
    • 2008
  • EDCA (Enhanced Distributed Channel Access)는 무선 로컬 네트워크에서 QoS를 지원하기 위해 IEEE 802.11e 표준에서 채택한 채널 접근 방법이다. EDCA는 트래픽을 몇 개의 범주로 분류하고 각 범주마다 채널 접근 매개변수 값을 달리 갖도록 하여 서비스 차등화를 제공한다. 본 논문에서는 비실시간 트래픽에 대해서는 처리량(throughput)을 최대화하면서 실시간 트래픽에 대해서는 지연 및 처리량 제약조건을 만족시키도록 EDCA 매개변수를 트래픽 환경에 동적으로 적응시키는 기법을 제안한다. 이를 위해, 먼저 EDCA 매개 변수 값의 조합이 갖는 공간을 효율적으로 탐색하는 설계 단계 알고리즘을 개발한다. 그리고 이 알고리즘을 이용하여 각 예상되는 트래픽 환경에 대해 지연-처리량 이득/손실에 대한 파레토 커브 (Pareto curve)를 유도한다. 이 파레토 데이터베이스는 트래픽 환경 및 관리 정책에 따라, 최적으로 매개변수를 조절하는데 사용될 수 있다. 시뮬레이션에 따르면, 표준에서 제시된 매개변수 값을 이용하는 경우에 비해서, 제안된 방법이 실시간 트래픽의 지연 및 처리량 보장에 탁월한 성능을 보이며 비실시간 트래픽의 처리량을 평균적으로 12% 증가시키는 것으로 나타났다.