• 제목/요약/키워드: 오디오 데이터베이스

검색결과 50건 처리시간 0.033초

인터액티브 스마트 TV 적용을 위한 사운드트랙 검색 시스템 (Soundtrack Search System for Interactive-Smart-Television)

  • 류상현;조재만;김형국
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 하계학술대회
    • /
    • pp.202-203
    • /
    • 2011
  • 본 논문에서는 인터액티브 스마트 TV 적용을 위한 사운드트랙 검색 시스템을 제안한다. 제안하는 시스템은 동영상을 오디오와 비디오특징을 구분한 후, 각 오디오와 비디오 신호를 분석한다. 비디오 신호의 분석은 MPEG-2 비디오 인코더로부터 영상의 장면전환과 시작과 끝 위치를 검출하고, 오디오 신호의 분석은 AC-3 오디오 인코더로부터 오디오 특징을 추출한 후, 오디오 정보의 비트 벡터를 추출하여 데이터베이스를 생성한다. 생성된 데이터베이스와 사용자가 북마크를 하여 요청한 쿼리와 비교를 통하여 오디오 특징정보가 유사한 부분의 장면을 검색하고, 검색된 장면을 사용자에게 제공한다. 제안된 시스템의 성능 측정을 위해서 뉴스, 패널토론, 음악방송, 광고, 드라마 등 50개 TV 방송 프로그램의 데이터베이스를 이용해서 정확성을 측정하였다.

  • PDF

멜로디 접근 빈도를 이용한 오디오 검색 시스템의 설계 및 구현 (Fast Audio Retrieval For Frequently Accessed Melodies)

  • 박동문;황인준
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 춘계학술발표논문집(상)
    • /
    • pp.112-117
    • /
    • 2002
  • 웹의 급속한 발전과 함께 오디오 컨텐츠의 양이 증가하게 되었고 수많은 오디오 데이터베이스로부터 특정한 오디오 컨텐츠를 찾아내는 오디오 검색 시스템의 필요성이 증가했다. 본 논문에서는 효율적인 오디오 검색 시스템을 위해 사용자들이 질의하는 멜로디 패턴을 이용해서 FAI(Frequently Accessed Index)라는 새로운 인덱싱 메카니즘을 제안하고 이 FAI를 기반으로 구현한 프로토타입 시스템의 구조와 원리에 대해서 설명한다. 실험을 통해서 FAI 기반 오디오 검색 시스템의 성능을 일반적인 오디오 검색 방법과 비교해 보았다.

  • PDF

딸림자료의 멀티미디어 데이터베이스 구축을 통한 이용 효율 제고에 관한 연구 (Elevating Utilization Efficiency through the Multimedia Database Construction of Accompanying Materials)

  • 이주현;이응봉
    • 정보관리연구
    • /
    • 제35권2호
    • /
    • pp.41-55
    • /
    • 2004
  • 본 연구에서는 딸림자료 중 특히, 오디오 테이프 형태의 자료를 디지털화하여 멀티미디어 데이터베이스를 구축함으로써 이용자의 이용편의와 자료관리의 효율성을 제고하는 것에 대한 방안에 대해 논의하고자 한다. 이를 위해 본고에서는 딸림자료의 관리현황, 오디오 데이터 포맷의 종류, 데이터 포맷변환, 관리 및 이용방안 등을 살펴보았다. 또한, 딸림자료의 멀티미디어 데이터베이스 구축을 통한 기대효과 및 문제점을 제시하였다.

소파변환을 사용한 오디오 데이터 베이스 검색 기반에서의 오디오 색인에 관한 연구 (A Study on Audio Indexing Using Wavelet Transform for Content-based Retrieval in Audio Database)

  • 최귀열;곽칠성
    • 한국정보통신학회논문지
    • /
    • 제4권2호
    • /
    • pp.461-468
    • /
    • 2000
  • 디지털 기술 발전에 따른 오디오 데이터의 증가는 여러 컴퓨터 응용에 사용되면서 데이터를 관리하고 사용하기 위해, 내용기반 질의와 유사성 검색과 같은 새로운 기능을 갖는 데이터베이스 시스템의 개발이 불가피하게 됐다. 내용 기반 질의를 위한 빠르고 정확한 검색은 이러한 응용 시스템들에 필요하다. 효율적인 내용기반 색인과 유사성 검색의 설계는 관련성 있는 데이터의 빠른 검색을 제공하기 위한 주된 요소이다. 본 논문에서는 소파(Wavelet) 변환을 이용한 한국 전통 음악 데이터베이스의 오디오 색인을 위한 방법을 제안한다. 또한 소파 변환을 이용해 오디오 데이터에 대한 색인의 가능성을 보인다.

  • PDF

데이터베이스를 이용한 실시간 오디오 서비스 시스템의 설계 및 구현 (Design and Implementation of a Real-time Audio Service System Using Database)

  • 배진욱;이태원;홍석진;용환승;이석호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (1)
    • /
    • pp.24-26
    • /
    • 1998
  • 웹을 통해 실시간으로 오디오 데이타를 서비스하는 기존의 시스템의 경우 웹 서버를 사용하여 서비스를 제공한다. 그러나 범용적인 웹 서비스를 위해 설계된 웹 서버는 실시간 데이터 전송을 위해 필수적인 전송 제어를 하지 못한다는 단점이 있다. 이러한 단점을 해결하기 위해 전송 제어가 가능한 오디오 서버(AEAP 서버)를 둔 실시간 오디오 서비스 시스템을 제안한다. 이 시스템에서는 오디오 데이터를 일정 크기의 작은 조각으로 쪼개어 데이터베이스에 저장하여 두었다가 사용자 요청이 오면 일정 시간 간격으로 조각 데이터를 전송하므로써 전송 제어를 구현하다. 이 결과 사용자들의 지연 시간 감소와 동시 사용자수 증대라는 성과를 거두었다.

음정 곡선을 이용한 효율적인 오디오 데이터베이스 탐색에 관한 연구 (A Study on the Efficient Search of an Audio Database using Musical Interval Contour)

  • 지정규;오해석
    • 정보기술과데이타베이스저널
    • /
    • 제4권2호
    • /
    • pp.97-104
    • /
    • 1998
  • 본 논문은 디지털 오디오 도서관에 대규모 선율 데이터베이스로부터 임의의 곡을 효율적으로 탐색하기 위하여 음정곡선을 색인키로 사용하는 방법에 대해 기술했다. 사용자가 검색하고자 하는 음악의 일부 선율을 노래하면 입력된 음신호를 인식하여 음높이 정보를 추출한다. 그리고, 음표간의 음정을 계산하여 음표순으로 배열함으로써 음정 곡선을 만든다. 제안한 은표열 탐색 알고리즘에 생성된 음정 곡선을 탐색 패턴으로 입력하여 선율 데이터베이스의 음표열을 비교 조사한다. 그러면 근사 음정 곡선을 가진 후보곡을 탐색할 수 있다. 제안한 음표열 탐색 알고리즘은 실험을 통해 동적 프로그래밍 및 상태 대조 알고리즘과 비교한 결과 탐색 시간이 2배이상 향상되었다.

오디오 핑거프린트의 비트에러율을 이용한 자동 음악 요약 기법 및 시스템 (Automatic Music Summarization Method by using the Bit Error Rate of the Audio Fingerprint and a System thereof)

  • 김민성;박만수;김회린
    • 한국멀티미디어학회논문지
    • /
    • 제16권4호
    • /
    • pp.453-463
    • /
    • 2013
  • 본 논문은 음악의 코러스(chorus) 구간을 자동으로 추출하는 기법 및 시스템에 대하여 다루었다. 코러스 구간을 자동으로 추출하는 음악 요약 기술은 방대한 음악 데이터베이스에서 특정 음악 검색을 용이하게 할 수 있으며, 온라인 스트리밍 서비스에서 샘플 음악을 생성할 때 사용될 수 있다. 이를 구현하기 위해, 기존의 알고리즘들은 2차원 유사도 행렬, 확률모델, 신경망모델, 템포 특징 벡터, 클러스터링 기법 등을 적절히 활용하여 개발되었다. 본 논문에서는 음악의 오디오 핑거프린트를 추출한 후 곡 내의 오디오 핑거프린트 구간 쌍의 비트에러율을 통해 음악 요약을 추출한다. 다만, 음악 검색 솔루션에서 사용된 오디오 핑거프린트가 데이터베이스에 이미 존재할 경우에는 이를 바로 로딩한 후 비트에러율을 계산하여 음악 요약을 추출할 수 있다. 이런 방법은 이미 만들어진 데이터베이스를 변형 없이 그대로 사용할 수 있음으로써 음악 데이터베이스를 활용한 다양한 알고리즘과 솔루션의 가능성을 보여주었다. 또한, 음악의 코러스를 추출하는데 있어서 기존 방식보다 매우 뛰어난 성능을 보임을 알 수 있었다.

은닉 마르코프 모델을 이용한 스테레오에서 서라운드 오디오 신호로의 변환 (Conversion of Stereo to Surround Audio Signal Using Hidden Markov Model)

  • 정석희;전찬준;김홍국
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2014년도 하계학술대회
    • /
    • pp.1-2
    • /
    • 2014
  • 본 논문에서는 hidden Markov model (HMM) 기반의 스테레오 신호로부터 서라운드 오디오 신호를 생성하는 기법을 제안한다. 먼저 5.1 채널 오디오 훈련 데이터베이스로부터 MDCT 영역에서 전방/서라운드 채널의 서브밴드 에너지를 프레임 단위로 계산하고, 이를 특징 벡터로 하여 좌측과 우측 채널 두 개의 HMM 이 구성된다. 다음으로, 입력된 스테레오 신호에 대해 HMM decoding 을 통해 서라운드 채널의 MDCT 영역의 서브밴드 에너지가 예측된다. 이 예측된 서브밴드 에너지로부터 역 MDCT 를 통해 서라운드 오디오 신호가 생성된다. 제안된 방법의 성능평가를 위해 MUSHRA 청취 실험을 수행한 결과, 제안된 HMM 기반의 방식으로 생성된 서라운드 오디오 신호가 기존의 패시브 서라운드 디코딩 기반으로 생성된 서라운드 신호에 비해 높은 선호도를 보였다.

  • PDF

내용기반 질의법을 이용한 디지털 오디오 콘텐츠 검색 시스템 (Digital Audio Contents Retrieval System Using a Content-based Query Method)

  • 허성필;임우영;한평희
    • 한국정보통신설비학회:학술대회논문집
    • /
    • 한국정보통신설비학회 2004년도 하계학술대회
    • /
    • pp.81-85
    • /
    • 2004
  • 내용기반 질의법 (Content-based Query Method)은 멀티미디어 데이터가 가지고 있는 고유의 특성을 검색의 단서로 하여 질의하는 방법이다. 따라서 이러한 내용 기반의 디지털 오디오 콘텐츠 시스템은 유저가 데이터베이스 내에서 찾고자 하는 오디오 관련 정보의 질의 방법으로써 그 노래의 멜로디 정보를 입력함으로써 이루어지게 된다. 본 논문에서는 가수명이나 노래 제목, 혹은 가사의 일부 등 기존의 음악 검색에 필수적인 텍스트 정보인 키워드를 전혀 모르는 상태에서, 휴대폰이나 컴퓨터의 마이크를 통해 자신이 기억하고 있는 노래의 일부분을 흥얼거리는 것만으로, 각종 오디오 정보를 손쉽게 찾아주는 내용기반 질의법을 이용한 디지털오디오 검색시스템 (MuseFinder)을 소개한다. 또한 실제 유저의 편이성을 고려한 GUI에 기초한 고성능의 검색시스템을 구현하는데 있어 주요 이슈와 고려사항에 대해서 살펴보고 그 해결 방법을 제안한다.

  • PDF

오디오와 영상 정보를 이용한 비디오 세그먼테이션 (Video Segmentation Using Audio and Image Information)

  • 정해준;정성환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.470-472
    • /
    • 2000
  • 본 논문에서는 영상 정보뿐만 아니라 오디오 정보를 함께 사용한 비디오 세그멘테이션에 대해 연구하였다. 대용량의 정보를 가지고 있는 비디오에 대하여 장면 경계 검출(Scene Break Detection)을 할 경우, 카메라 팬이나 장면 내에 여려 가지 다른 샷(Shot)으로 인하여 영상 정보만으로는 효과적인 검출이 어렵다. 이러한 문제를 해결하기 위해 비디오 내의 오디오 정보도 함께 사용함으로써 문제를 개선했다. 뉴스, 광고, 스포츠 등 다양한 3개 분야의 TV 프로그램으로 구성된 약 4,000개 영상 프레임과 약 30,000개의 오디오 프레임으로 구성된 비디오 데이터베이스에 대하여 실험한 결과, 영상 정보만 사용한 경우보다 우수한 성능을 확인하였다. 영상 정보 특징값으로는 칼라 히스토그램과 DC계수를 사용했고, 오디오 특징값으로는 SR(Silence ratio), VSTD(Volume standard deviation), NPR(Non pitch ratio)을 사용했다.

  • PDF