• 제목/요약/키워드: MPEG-7 Description

검색결과 60건 처리시간 0.026초

BiM을 이용한 메타데이터의 효율적인 부호화 방법 (An efficient compression method of metadata using BiM)

  • 양승준;남제호;김영태;강경옥
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2001년도 정기총회 및 학술대회
    • /
    • pp.199-202
    • /
    • 2001
  • ISO/IEC 15938-1(MPEG-7 Systems)에서는 멀티미디어 컨텐츠에 대한 메타데이터의 효율적인 전송과 저장을 위한 이진 표현 방법인 BiM(binary format for MPEC-7)을 제공한다. 멀티미디어 컨텐츠를 기술(description)하는 메타데이터의 텍스트 표현은 대체로 많은 저장 용량과 전송 리소스를 요구하기 때문에 효율적인 압축을 위해서는 이진 형식으로의 변환이 요구된다. 또한 텍스트 형식은 방송 환경과 같은 스트리밍 전송에는 적절하지 못한 단점이 있다. BiM은 컨텐츠에 대한 기술을 전체 또는 2개 이상의 AU(access units) 단위로 분할하며 부호화하는 방법을 지원함으로써 스트리밍 전송을 가능하게 한다. 이러한 구조는 이진 포맷 형태로 표현되는 헤더를 가지는 패킷 기반 형태이며, 융통성이 있는 전송 순서를 제공한다. 또한, 비트 스트림의 전체를 해석(parsing)하지 않고 랜덤 엑세스 기능을 제공하는 장점이 있다. BiM이 지닌 이러한 장점들로 인하여 현재 방송산업계를 중심으로 메타데이터를 방송에 활용하기 위한 기술을 표준화하는 국제 민간 표준화 기구인 TV-Anytime 포럼에서는 방송 컨텐츠에 대한 메타데이터의 압축에 관한 요구사항을 만족하는 하나의 방법으로 BiM을 고려하고 있다 본 논문에서는 이러한 MPEG-7 시스템의 BiM을 소개하고, 이를 이용하여 TV-Anytime 포럼의 메타데이터를 이진 포맷으로 부호화한 실험과 그 결과를 기술한다.

  • PDF

다중 비주얼 특징을 이용한 어학 교육 비디오의 자동 요약 방법 (Automatic Summary Method of Linguistic Educational Video Using Multiple Visual Features)

  • 한희준;김천석;추진호;노용만
    • 한국멀티미디어학회논문지
    • /
    • 제7권10호
    • /
    • pp.1452-1463
    • /
    • 2004
  • 양방향 방송 서비스로의 전환을 맞아 다양한 사용자 요구 및 기호에 적합한 컨텐츠를 제공하고, 증가하는 방송 컨텐츠를 효율적으로 관리, 이용하기 위해 비디오의 자동 에 대한 요구가 증가하고 있다. 본 논문에서는 내용 구성이 잘 갖추어진 어학 교육 비디오의 자동 에 대한 방법을 제안한다. 내용 기반을 자동으로 생성하기 위해 먼저 디지털 비디오로부터 샷 경계를 검출한 후, 각 샷을 대표하는 키프레임으로부터 비주얼 특징들을 추출한다. 그리고 추출된 다중 비주얼 특징을 이용해 어학 교육 비디오의 세분화된 내용 정보를 결정한다. 마지막으로, 결정된 내용 정보를 기술하는 요약문을 MPEG-7 MDS(Multimedia Description cheme)에 정의된 계층적 (Hierarchical Summary) 구조에 맞추어 XML 문서로 생성한다. 외국어 회화 비디오에 대해 실험하여 제안한 자동 방법의 효율성을 검증하였으며, 제안한 방법이 교육 방송용 컨텐츠의 다양한 서비스 제공 및 관리를 위한 비디오 요약 시스템에 효율적으로 적용 가능함을 확인하였다.

  • PDF

멀티미디어 온톨로지 기반의 의미론적 콘텐츠 검색 시스템 설계 (A Design of Semantic Contents Search System for Multimedia Ontology)

  • 황치곤;문석재;이대성;윤창표
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2013년도 춘계학술대회
    • /
    • pp.245-248
    • /
    • 2013
  • 최근 멀티미디어 기술과 네트워크의 발전으로 멀티미디어 콘텐츠의 생성은 빠르게 늘어가고 있다. 그러나 이를 찾고 활용하는 기술은 부족하다. 이러한 문제를 보완하고 해결하기 위해 멀티미디어 콘텐츠를 위한 표준안들이 많이 있으나 멀티미디어 데이터 형식과 상호운용성을 표현하기에는 부족하다. 본 논문에서는 멀티미디어 콘텐츠를 상호 운용할 수 있도록 하는 온톨로지 기반의 콘텐츠 검색 시스템을 제시한다. 온톨로지는 MPEG-7의 MDS(Multimedia Description Scheme)와 같은 스키마 구조에 온톨로지 구축을 위한 규칙을 제시하여 구성한다. 이러한 온톨로지를 바탕으로 멀티미디어 데이터가 가지고 있는 연관성을 확장하여 의미론적 검색이 가능한 접근 시스템을 설계한다.

  • PDF

2차원 형상 변화에 강건한 지배적 특징 기반 형상 시그너쳐의 정규화 및 관계 특징 기술 (A Dominant Feature based Nomalization and Relational Description of Shape Signature for Scale/Rotational Robustness)

  • 송호근;구하성
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권11호
    • /
    • pp.103-111
    • /
    • 2011
  • 본 논문에서는 윤곽선의 순열을 기반으로 하여 형상 시그너쳐를 추출하고, 주도적 특징을 기반으로 형상 정열 및 정규화한 뒤, 기존 절대각도기반 관계성질 대신 기하 관계성질을 이용하는 새로운 형상 기술자, 기하학적 중심거리값(Geometrical Centroid Contour Distance : GCCD)을 제안하였다. 비교 실험을 통하여 제안 방식은 기존 기술자들에 비해 시간 복잡도와 공간 복잡도가 작아 실시간 처리에 유리하면서, 2차원 객체의 크기와 회전 변화에 강건함을 보였다. 또한 MPEG-7 표준 영상을 대상으로 한 정확도 실험을 통하여 다양한 영상군에 대한 비교를 수행하여 제안 방식이 기존 방식들보다 높은 정확도를 보임을 확인하였다. 하지만 제안 방식은 볼록형 객체에 대한 높은 정확도를 보이는 반면 오목형이면서 복잡한 형상을 가지는 객체에 대하여는 형상 변별력이 제한된다는 것도 알게 되었다.

ART의 위상 정보를 이용한 형태기반 영상 검색 방법 (A Shape Based Image Retrieval Method using Phase of ART)

  • 이종민;김회율
    • 방송공학회논문지
    • /
    • 제17권1호
    • /
    • pp.26-36
    • /
    • 2012
  • 영상에 포함된 객체의 형태는 내용 기반 영상검색에 있어서 중요한 정보를 가지고 있기 때문에, 이를 이용하여 영상을 검색하는 방법들이 활발히 연구되어 왔다. 그중에서도 최근에 제안된 저니키 모멘트의 위상과 크기를 이용하는 회전불변 서술자(IZMD: Invariant Zernike moment descriptor)을 이용한 영상 검색 방법은 기존의 크기 정보만을 이용한 저니키 모멘트 서술자보다 높은 영상 검색 성능을 보인다. 본 논문에서는 IZMD를 이용한 방법 보다 향상된 영상 검색 성능을 얻기 위해서 ART(Angular Radial Transform)의 크기와 위상을 이용한 회전 불변 특징 서술자(IARTD: Invariant Angular Radial Transform Descriptor)와 이를 이용해서 영상을 정합하는 방법을 제안한다. IARTD는 ART 기저함수의 특성을 이용해서 정렬된 ART 계수의 위상과 크기로 구성된 특징벡터이다. 영상의 검색은 두 IARTD의 크기차이와 위상차이의 곱을 이용하여 정의된 거리 계산 방법을 이용해서 수행한다. MPEG-7 데이터셋을 이용한 실험 결과, 제안하는 방법의 평균 BEP(Bull's Eye performance)는 0.5806으로서, ARTD나 IZMD를 이용한 영상 검색 결과의 평균 BEP 0.3574, 0.4234보다 우수한 검색 성능을 제공하는 것을 확인하였다.

푸리에 표현자의 크기와 회전 불변 특징을 에지에 대한 3차원 정보에 응용한 고효율의 물체 인식 (High Performance Object Recognition with Application of the Size and Rotational Invariant Feature of the Fourier Descriptor to the 3D Information of Edges)

  • 왕실;진홍신;이준호;임해평;김형석;김종만
    • 전자공학회논문지CI
    • /
    • 제45권6호
    • /
    • pp.170-178
    • /
    • 2008
  • 3 차원 정보로부터 정확한 에지를 추출하고 푸리 변환하여 물체를 인식할 수 있는 고 효율의 물체 인식방법을 제안하였다. 물체의 윤곽은 인식에 유용한 많은 정보를 포함하고 있지만, 정확한 윤곽정보를 얻기가 어려우며, 정확한 윤곽정보를 얻었다고 하더라도 물체의 크기나 방향 마다 윤곽이 달라지기 때문에 물체 인식에 획기적 대안으로 활용되지 못하고 있다. 제안한 물체 인식 알고리즘은 1) 레이저 스캔 디바이스를 사용하여 얻는 3 차원 물체정보로부터 정밀한 물체 윤곽을 획득하고 2) 크기 및 회전 불변한 푸리에 표시 자를 이용하여 윤곽을 표현함으로써, 필요 데이터 베이스의 크기를 대폭 줄인다. 이렇게 얻어진 물체에 대한 푸리에 표식자 정보는 미리 준비된 푸리에 표식자 데이터 베이스로부터 최적 정합되는 물체를 찾아 인식한다. 이 알고리즘은 MPEG7 Part B의 방대한 영상 데이터 베이스를 대상으로 실험하였으며, 그에 대한 결과를 논문에 포함시켰다.

사용자 선호도 자동 학습 방법을 이용한 개인용 전자 프로그램 가이드 어플리케이션 개발 (Personalized EPG Application using Automatic User Preference Learning Method)

  • 임정연;정현;강상길;김문철;강경옥
    • 방송공학회논문지
    • /
    • 제9권4호
    • /
    • pp.305-321
    • /
    • 2004
  • 디지털 방송의 시작과 함께, 지상파, 위성, 케이블과 같은 다양한 매체를 통한 다채널 방송 시청 환경의 도래는 사용자에게 많은 방송 프로그램 시청 정보를 전달하게 되었다. 이와 더불어, 방송 단말에 전송된 다양한 방송 프로그램 정보를 탐색하고 선호 방송 프로그램을 선별하기 위해서는 사용자에게 많은 노력이 요구된다. 따라서, 사용자로 하여금 자신의 취향 및 자신이 원하는 방송 프로그램 정보에 자동적으로 근접할 수 있도록 하는 개인화된 방송 서비스가 요구되고 있다. 이러한 요구에 따라, 본 논문에서는 다채널 방송 시청 환경 하에서 사용자의 방송 프로그램 시청 히스토리를 분석하고, 특정 시간에 따른 사용자의 방송 프로그램 시청 패턴윽 추출하여 방송 프로그램 장르에 대한 사용자 선호도를 자동으로 계산하는 알고리즘을 제안하고. MPEG-7 MDS 구조에 따른 사응자 선호토 서술과 이를 이용하여 사용자의 선호도에 따라 방송 프로그램을 자동적으로 추천하는 TV 프로그램 추천 어플리케이션을 소개한다. 본 논룬의 실헐을 위해 AC Nielsen Korea에서 제공된 실제 연령대별, 성별, 시간대별로 사용자의 TV 시청 자료를 사용하였으며, 실험결과를 통해 본 논문에 제안된 베이시안 네트워크 기반 사용자 자동 학습 알고리즘이 효과적으로 사용자 선호도를 학습한 수 있음을 확인하였다.

Multimodal Approach for Summarizing and Indexing News Video

  • Kim, Jae-Gon;Chang, Hyun-Sung;Kim, Young-Tae;Kang, Kyeong-Ok;Kim, Mun-Churl;Kim, Jin-Woong;Kim, Hyung-Myung
    • ETRI Journal
    • /
    • 제24권1호
    • /
    • pp.1-11
    • /
    • 2002
  • A video summary abstracts the gist from an entire video and also enables efficient access to the desired content. In this paper, we propose a novel method for summarizing news video based on multimodal analysis of the content. The proposed method exploits the closed caption data to locate semantically meaningful highlights in a news video and speech signals in an audio stream to align the closed caption data with the video in a time-line. Then, the detected highlights are described using MPEG-7 Summarization Description Scheme, which allows efficient browsing of the content through such functionalities as multi-level abstracts and navigation guidance. Multimodal search and retrieval are also within the proposed framework. By indexing synchronized closed caption data, the video clips are searchable by inputting a text query. Intensive experiments with prototypical systems are presented to demonstrate the validity and reliability of the proposed method in real applications.

  • PDF

의미적 메타데이터를 이용한 멀티미디어 주석 및 검색 (Multimedia Annotation and Retrieval using Semantic Metadata)

  • 안형근;고재진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (C)
    • /
    • pp.199-204
    • /
    • 2006
  • 최근 멀티미디어의 이용과 멀티미디어 접근을 위한 기술이 많이 증가하고 있다. 그렇지만 멀티미디어 검색엔진과 같은 실용시스템에서 멀티미디어에 대한 유용한 정보 추출과 정보의 응용은 여전히 문제로 있다. 특히, 멀티미디어 이용자는 검색의 효율성을 위하여 저장소를 직관적인 구조로 생성을 하고 있다. 그 예로 "KISS 추계학술 대회 이미지"와 같은 데이터 폴더를 만들거나, 각 멀티미디어 데이터에 Free Text 기반의 주석을 하여 관리를 하였다. 하지만 이러한 검색들에도 한계점을 가지고 있으며 또 다른 지능적인 의미 검색에 있어서도 인간이 바라는 검색의 정확도에 미치지 못하고 있다. 본 논문에서는 이러한 문제점을 해결하기 위한 새로운 접근법을 소개한다. 목적을 위하여 멀티미디어의 의미적인 작업을 위하여 컨텐츠 획득과 분류를 위한 새로운 사용자 도구를 소개하고자 한다. 도구를 이용하는 멀티미디어 사용자는 주어진 컨텐츠를 인간이 생각하고 컨텐츠가 내포하는 의미의 일정한 구조적 단위로 분해하고, 각 단위들에 MPEG-7 표준기반의 추가적인 기술 정보(Description information)를 부여하여 새로운 의미적 메타데이터를 생성할 수 있다. 이러한 의미적 메타데이터는 멀티미디어 검색을 위해 사용자들에게 효율성을 줄 것이라 본다.

  • PDF

단면 형상 영상을 이용한 3차원 모델 검색 (3D Model Retrieval Using Sliced Shape Image)

  • 박유신;서융호;윤용인;권준식;최종수
    • 대한전자공학회논문지SP
    • /
    • 제45권6호
    • /
    • pp.27-37
    • /
    • 2008
  • 멀티미디어 기술과 콘텐츠의 발달로 3차원 데이터의 사용 범위가 넓어지고, 이를 보다 효율적으로 관리하고 검색하기 위한 시스템이 필요하다. 본 논문은 효율적인 3차원 모델의 형상 기반 검색을 하기위해 모델의 특징을 추출하는 단면 형상 영상 방법을 제안한다. 3차원 모델의 특징 기술자는 모델에 대한 위치, 회전, 크기에 불변해야 하므로 모델을 정규화 시키는 작업이 필요하다. 본 논문에서는 주성분 분석 방법을 이용하여 정규화하였다. 제안한 알고리즘은 주성분 분석을 통해 각 축의 방향 성분을 찾고, 각 축에 직교하는 n 개의 평면을 생성한다. 이 평면은 각 축의 방향과 직교 성분을 갖으며 단면 형상 영상을 구하는데 사용된다. 단면 형상 영상은 3차원 모델과 각 평면이 교차해서 생기는 2차원 평면 영상이다. 제안한 3차원 모델의 특징 기술자는 단면 형상 영상의 중심점과 2차원 형상(shape)을 이루는 직선까지의 유클리디안 거리(distance)값들의 분포도이다. 검색 성능 평가는 MPEG-7에서 제시한 표준 평가 방법인 표준화된 수정 검색 순위의 평균(ANMRR)을 이용하였고 제안한 방법의 우수성을 실험 결과를 통해 입증하였다.