• 제목/요약/키워드: MPEG-7 Descriptor

검색결과 78건 처리시간 0.02초

MPEG-4 컨텐츠 저작 시스템 설계 및 개발 (The Design and Development of MPEG-4 Contents Authoring System)

  • 차경애;김희선;김상욱
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제7권4호
    • /
    • pp.309-316
    • /
    • 2001
  • MPEG-4 컨텐츠는 다양한 시청각 객체들로 구성되고, 사용자 상호작용에 대한 정의를 포함하여 동적인 씬 구성과 변화를 가능하게 한다. 또한 시청각 씬을 컨텐츠 단위로 표현하기 위해서 씬을 기술하는 디스크립션을 가진다. 이것은 씬을 구성하는 각 멀티미디어 객체들의 시공간적인 위치와 그들 사이의 관계를 표현하는 기술 언어이다. 본 논문에서는 멀티미디어 씬의 시공간적 관계를 시각적으로 저작할 수 있는 환경을 제공하고 이를 MPEG-4 씬 디스크립션, 객체 디스크립터 등의 스트리밍 MPEG-4 컨텐츠로 자동 생성하는 MPEG-4 컨텐츠 저작 시스템을 제안하고 그 개발 결과를 보인다.

  • PDF

PVR 시스템에서 메타데이터 기반의 효과적인 브라우징 방법 (A Metadata-based Effective Browsing Method for PVR System)

  • 김재목
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.589-591
    • /
    • 2005
  • 디지털 기술이 나날이 발전함에 따라 정지영상 압축 기술의 대표적이라 찰 수 있는 JPEG이 탄생하면서 디지털 임상은 급격한 발전을 거듭해 왔다. 이에 동영상 압축 기술 MPEG이 탄생하였고, MPEG은 1, 2, 4 를 비롯하여 7, 21로 발전을 거듭하고 있다. PVR은 방송을 디지털로 저장하는 기기로써 시청자가 원하는 시간에 원하는 방송을 시청할 수 있게 해 준다. PVR이 많은 컨텐츠를 저장할 수 있게 되자, 사용자는 컨텐츠에 대한 효과적인 검색 및 브라우징을 필요로 하고 있다. 본 논문에서는 컨텐츠를 기술하는 메타데이터를 이용한 의미기반 브라우징 방법을 제안한다. 제안하는 방법에서는 메타데이터에 있는 키워드와 인물정보, 장르, MPEG-7의 color descriptor를 이용한다.

  • PDF

퍼지 유사관계를 이용한 다차원 특징들의 가중치 결정과 감성기반 음악검색 (The Weight Decision of Multi-dimensional Features using Fuzzy Similarity Relations and Emotion-Based Music Retrieval)

  • 임지혜;이준환
    • 한국지능시스템학회논문지
    • /
    • 제21권5호
    • /
    • pp.637-644
    • /
    • 2011
  • 음원이 디지털화 되면서 쉽게 음악을 구매하고 들을 수 있게 되었다. 하지만 많은 음악 중에서 음악가, 장르, 제목, 앨범 타이틀 등 전통적인 음악 정보를 이용하여 사용자들이 자신의 취향에 맞는 음악을 찾는 데는 여전히 어려움이 있다. 이러한 어려움을 해소하기 위해 내용기반 음악검색과 감성기반 음악검색 방법 등이 제안되고 개발되고 있다. 본 논문에서는 이러한 어려움을 해소하기 위한 감성기반 음악 검색방법에서 다차원 벡터형태의 MPEG-7 저수준 오디오 서술자들의 감성기반 검색에서의 중요도를 결정하기 위한 새로운 방법을 제안하였다. 제안된 방법에서는 상호간에 대립되는 감성을 대표되는 음악들의 유사성을 다차원 서술자 관점에서 측정하고 이 유사관계를 러프 근사화와 군집 내/군집 간의 유사성 비율을 이용하여 서술자의 중요성을 결정한다. 중요성을 바탕으로 결정된 가중치는 여러 개의 오디오 서술자들의 유사성을 총체화하는데 이용되며 이를 활용하여 감성기반 음악검색을 수행한다. 제안된 방법은 내용기반 음악 검색을 기반으로 한 감성기반 음악검색 구조에서 실험한 결과 평균 검색 개수측면에서 기존의 휴리스틱 방법보다 좋은 검색 결과를 나타내었다.

최인접 거리 비율 정합을 이용한 영상 특징점 선택 방법 (Image Feature Point Selection Method Using Nearest Neighbor Distance Ratio Matching)

  • 이준우;정재협;강종욱;나상일;정동석
    • 전자공학회논문지
    • /
    • 제49권12호
    • /
    • pp.124-130
    • /
    • 2012
  • 본 논문에서는 현재 진행 중인 MPEG(Motion Picture Experts Group, ISO/IEC JTC1 SC29 WG11)의 표준화 작업 중 CDVS(Compact Descriptor for Visual Search)의 CE-7(Core Experiment)인 특징점 선택에 대한 방법을 제안한다. 서술자의 경량화를 위해서는 영상으로부터 추출된 많은 수의 특징점들 중에서 영상 정합에 사용될 중요한 특징점들을 선택해야 한다. 본 논문에서는 최 인접 거리 비율 정합(Nearest Neighbor distance ratio matching) 방법에 의해 영상 정합 단계에서 사용되지 않고 버려지는 특징점들을 미리 추출 단에서 제거하는 방법 제안하였다. 제안된 방법을 통하여 적은 비트 전송률을 요하는 시스템에서 특징점의 낭비를 피할 수 있고 결과적으로 추가적인 특징점을 사용할 수 있으므로 전체적인 성능 향상을 얻을 수 있었다. 제안된 알고리즘을 통하여 Pair-wise 정합 실험에서 기존의 Test Model 대비 최고 2.3%의 성공율(True positive rate)의 향상을 보였다.

영상 색온도 변환에 대한 사용자 선호 경향 분석 (The Analysis of User Preference Tendency for Color Temperature Conversion of the Image)

  • 주용수;김상균
    • 방송공학회논문지
    • /
    • 제15권2호
    • /
    • pp.290-303
    • /
    • 2010
  • 최근 LCD, PDP, OLED와 같은 평판 디스플레이들의 대중적인 인기로 인해 디스플레이 화질 및 색 개선에 대한 연구가 활발히 이루어지고 있다. 최적의 디스플레이 색을 제공하기 위한 연구들 중 하나로, 사용자 선호도에 기반한 영상 색온도 자동 변환 연구가 있다. 본 논문에서는 기존의 사용자 선호도 기반 색온도 변환 방법에 대한 문제점을 정의하고, MPEG-7 색온도 서술자에서 제시된 색온도 구간에 따른 사용자 선호도 경향을 검증한다. 분석된 사용자 선호도에 근거하여 최적 색온도 변환 커브를 제시한다. 일원분산분석(ANOVA)을 통해 분석한 결과, 색온도 구간에 대한 사용자 선호도 경향은 기존의 연구 결과와 유사한 결과를 보였고, 반복 색온도 변환 실험의 결과는 통계적으로 유의하지 않았다.

압축공간에서 활동도 기술자를 이용한 비디오 요약 (Video Summarization Using Activity Descriptor In Compressed Domain)

  • 윤진성;김계영;최형일
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (상)
    • /
    • pp.7-10
    • /
    • 2002
  • 본 논문에서는 MPEG-7의 활동도 기술자를 이용한 비디오 기술을 제안한다. 제안한 방법은 압축상태의 비디오 자료에서 직접 움직임 벡터들을 추출, 각 프레임들의 활동도의 강도를 계산하고 프레임의 흐름에 따라 계산된 활동도의 변화량에 대해 퓨리에 변환을 적용하여 얻어진 주파수 성분을 분석하여 활동도의 시간적 분포도를 계산한다. 계산된 강도 및 분포도는 MPEG-7의 표준에 따르기 위해 양자화하여 비디오 요약에 이용한다.

  • PDF

Pitch 히스토그램을 이용한 내용기반 음악 정보 검색 (Content-based Music Information Retrieval using Pitch Histogram)

  • 박만수;박철의;김회린;강경옥
    • 방송공학회논문지
    • /
    • 제9권1호
    • /
    • pp.2-7
    • /
    • 2004
  • 본 논문에서는 내용 기반 음악 정보 검색에 MPEG-7에 정의된 오디오 서술자를 적용하는 방법을 제안한다. 특히 Pitch 정보와 timbral 특징들은 음색 구분을 용이하게 할 수 있어 음악 검색뿐만 아니라 음악 장르 분류 또는 QBH(Query By Humming)에 이용 될 수 있다. 이러한 방법을 통하여 오디오 신호의 대표적인 특성을 표현 할 수 있는 특징벡터를 구성 할 수 있다면 추후에 멀티모달 시스템을 이용한 검색 알고리즘에도 오디오 특징으로 이용 될 수 있을 것이다. 본 논문에서는 방송 시스템에 적용하기 위해 영화나 드라마의 배경음악에 해당하는 O.S.T 앨범으로 검색 범위를 제한하였다. 즉, 사용자가 임의로 검색을 요청한 시점에서 비디오 컨텐츠로부터 추출한 임의의 오디오 클립만을 이용하여 그 컨텐츠 전체의 O.S.T 앨범 내에서 음악을 검색할 수 있도록 하였다. 오디오 특징 백터를 구성하기 위해 필요한 MPEG-7 오디오 서술자의 조합 방법을 제안하고 distance 또는 ratio 계산 방식을 통해 성능 향상을 추구하였다. 또한 reference 음악의 템플릿 구성 방식의 변화를 통해 성능 향상을 추구하였다. Classifier로 k-NN 방식을 사용하여 성능평가를 수행한 결과 timbral spectral feature 보다는 pitch 정보를 이용한 특징이 우수한 성능을 보였고 vector distance 방식으로는 특징들의 비율을 이용한 IFCR(Intra-Feature Component Ratio) 방식이 ED(Euclidean Distance) 방식보다 우수한 성능을 보였다.

비쥬얼 리듬을 이용한 효율적 비데오 인덱싱 기법 (An Efficient Video Indexing Scheme Exploiting Visual Rhythm)

  • 정지문;김정길
    • 정보통신설비학회논문지
    • /
    • 제10권3호
    • /
    • pp.103-109
    • /
    • 2011
  • With the growing popularity of digital video applications, those areas of the efficient transmit, storage management, and search technology for video data are emerging as an important core technology. To be an effective video indexing system, users need to be able to find the video segments that they want. Unfortunately, video data is difficult to manage because of its unstructured data type and large volume with linear forms. This paper proposes a shot verification using visual rhythm and video retrieval system. The shot verification is designed to detect a segment from video easily and quickly, known as shot boundaries, just by changing the visual rhythm without playing the image. Therefore, this can decrease the false detected shots and generate the unidentified shots and key frames. The retrieval system is constructed in terms of visual descriptor from the list of MPEG-7. The effectiveness of the proposed shot verification process and video retrieval system is demonstrated.

  • PDF

MPEG-7 기반 DCT영역에서의 에지히스토그램 고속 추출 기법 (Fast Extraction of Edge Histogram in DCT Domain based on MPEG-7)

  • 엄민영;최윤식;원치선;남재열
    • 대한전자공학회논문지SP
    • /
    • 제43권4호
    • /
    • pp.19-26
    • /
    • 2006
  • 오늘날 대부분의 멀티미디어 데이터는 압축된 형태로 저장되고 전송된다. MPEG-7 에지 히스토그램 기술자는 공간영역에서 특정정보를 추출하기 때문에 특정정보추출을 위해 필요로 되는 복호화과정과 공간영역에서의 필터링 과정은 특정추출시간 과 연산량을 증가시키는 원인이 된다. 영상 검색 효율을 높이기 위하여 본 논문에서는 DCT 영역에서 직접적으로 에지 히스토그램을 추출하는 기법을 제안한다. OCT 계수들 중 AC 계수로부터 얻을 수 있는 에지에 대한 정보를 이용하여 DCT 영역에서 직접적으로 에지의 방향과 강도를 구한다. 실험결과는 제안하는 기법을 통해 검색 효율과 연산량에서 모두 만족할만한 결과를 얻을 수 있음을 보여준다.

푸리에 표현자의 크기와 회전 불변 특징을 에지에 대한 3차원 정보에 응용한 고효율의 물체 인식 (High Performance Object Recognition with Application of the Size and Rotational Invariant Feature of the Fourier Descriptor to the 3D Information of Edges)

  • 왕실;진홍신;이준호;임해평;김형석;김종만
    • 전자공학회논문지CI
    • /
    • 제45권6호
    • /
    • pp.170-178
    • /
    • 2008
  • 3 차원 정보로부터 정확한 에지를 추출하고 푸리 변환하여 물체를 인식할 수 있는 고 효율의 물체 인식방법을 제안하였다. 물체의 윤곽은 인식에 유용한 많은 정보를 포함하고 있지만, 정확한 윤곽정보를 얻기가 어려우며, 정확한 윤곽정보를 얻었다고 하더라도 물체의 크기나 방향 마다 윤곽이 달라지기 때문에 물체 인식에 획기적 대안으로 활용되지 못하고 있다. 제안한 물체 인식 알고리즘은 1) 레이저 스캔 디바이스를 사용하여 얻는 3 차원 물체정보로부터 정밀한 물체 윤곽을 획득하고 2) 크기 및 회전 불변한 푸리에 표시 자를 이용하여 윤곽을 표현함으로써, 필요 데이터 베이스의 크기를 대폭 줄인다. 이렇게 얻어진 물체에 대한 푸리에 표식자 정보는 미리 준비된 푸리에 표식자 데이터 베이스로부터 최적 정합되는 물체를 찾아 인식한다. 이 알고리즘은 MPEG7 Part B의 방대한 영상 데이터 베이스를 대상으로 실험하였으며, 그에 대한 결과를 논문에 포함시켰다.