• 제목/요약/키워드: MPEG 오디오

검색결과 276건 처리시간 0.03초

MPEG-7 오디오 특징을 이용한 감성기반 음악검색 (Emotion-Based Music Retrieval using MPEG-7 Audio Descriptors)

  • 임지혜;이준환
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.334-337
    • /
    • 2011
  • 음원의 디지털화와 다양한 디지털 기기의 보급으로 인해 사용자는 더욱 쉽게 많은 양의 음악을 접할 수 있게 되었다. 많은 양의 음원중에서 사용자 개개인의 성향에 맞는 음악을 검색하기 위해 내용기반 음악검색과 감성기반 음악검색 방법 등이 제안되고 개발되고 있다. 본 논문에서는 감성기반 음악검색방법에서 다차원 벡터 형태의 MPEG-7 저수준 오디오 서술자들의 중요도를 결정하기 위한 새로운 방법을 제안하였다. 제안된 방법은 한 쌍의 대립되는 감성을 대표하는 음악들의 유사성을 다차원 서술자의 관점에서 측정한다. 그리고 이 유사관계를 러프 근사화와 군집 내/군집 간의 유사성 비율을 이용하여 서술자의 중요성을 결정하는데 사용한다. 이 중요성을 바탕으로 결정된 가중치는 여러 개의 오디오 서술자들의 유사성을 총체화하여 감성기반 음악검색에 이용된다.

GOP구조를 이용한 MPEG2 비디오 비트율 제어에 관한 연구 (The Study on the MPEG-2 Video Bitrate Control using GOP Structure)

  • 김상동
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.889-891
    • /
    • 2005
  • 디지털 기술과 통신 기술의 발전으로 멀티미디어 컨텐츠가 급격히 증가하고 있다. 이러한 멀티미디어 컨텐츠는 다양한 유무선 서비스 환경에서 실시간 서비스가 가능해야 한다. 그러기 위해서는 멀티미디어 컨텐츠 중 가장 큰 비중을 차지하는 영상 및 오디오 컨텐츠에 대한 압축 및 전송 기술이 요구된다. 현재 여러 분야에서 영상 및 오디오에 대한 압축 표준으로는 MPEG 이 자리잡았다. 그리고 MPEG에 대한 많은 개선 노력이 있었으며 특히 테스트 모델인 TM5를 비롯한 많은 연구에서 벡터 추출이나 양자화를 이용한 방법을 중심으로 비트율을 제어하기 위한 부호화기 모델이 제시되었다. 본 논문에서는 기존의 연구 접근 방식과는 다르게 프레임 유형간의 거리를 이용하여 영상의 특성에 따라 보다 적합한 프레임 구조를 찾아 제안하였다. 즉 영상의 복잡도와 변화도에 따라 영상의 종류를 구분하고 각 종류별 영상에 대한 표준 MPEG 인코딩 화질을 기준으로 삼은 후, GOP구조 내에서 프레임 유형간의 거리를 조정하여 화질을 손상하지 않고 가장 적은 비트율을 보상하는 프레임구조를 실험 및 분석을 통해 찾아 제안하였다.

  • PDF

MPEG-H 3D 오디오 표준 복호화기 구조 및 연산량 분석 (MPEG-H 3D Audio Decoder Structure and Complexity Analysis)

  • 문현기;박영철;이용주;황영수
    • 한국통신학회논문지
    • /
    • 제42권2호
    • /
    • pp.432-443
    • /
    • 2017
  • MPEG-H 3D 오디오 표준은 UHDTV 등의 초고해상도 방송서비스에 대응하는 실감음향 서비스의 제공을 목표로 한다. 이를 위해 본 표준은 다채널 신호, 객체 신호, 장면 기반 신호의 부호화/복호화 기술과 다양한 재생 환경에서 3차원 오디오 제공을 위한 렌더링 기술, 후처리 기술 등 방대한 기술을 통합하였다. 본 표준의 참조 소프트웨어 복호화기는 여러 모듈들이 결합된 구조로 다양한 모드에서 동작이 가능하며, 각 모듈들이 독립된 실행파일로 순차적으로 실행되어 실시간 처리가 불가능하다. 본 논문에서는 MPEG-H 3D 오디오의 코어 복호화기, 포맷 변환기, 객체 렌더러, 바이노럴 렌더러의 각 함수를 동적 라이브러리화 및 통합하여 프레임 기반 복호화가 가능하도록 하였다. 또한 MPEG-H 3D 오디오의 각 모드별 연산량을 측정하여 다양한 하드웨어 플랫폼에서 적합한 모드를 선택하기 위한 참고 자료를 제공한다. 연산량 분석 결과, 한국 방송 표준에 포함된 저연산량 프로파일은 채널 신호로 렌더링을 할 경우 QMF 합성 연산의 2.8배에서 12.4배의 연산량을 가지며, 바이노럴 렌더링을 할 경우 QMF 합성 연산의 4.1배에서 15.3배의 연산량을 가진다.

MPEG-2 AAC 복호기를 위한 부동소수점유닛 설계에 관한 연구 (A Study On the Design of a Floating Point Unit for MPEG-2 AAC Decoder)

  • 구대성;김필중;김종빈
    • 대한전자공학회논문지TE
    • /
    • 제39권4호
    • /
    • pp.355-355
    • /
    • 2002
  • 본 논문에서는 디지털 오디오의 하드웨어 설계 시 가장 중요하고 고집적도를 요구하는 부동소수점 유닛을 설계하였다. 대부분의 모든 오디오 시스템이 다채널을 지원하고 고음질을 요구한다. 하드웨어로 구현한 부동소수점 연산기는 MPEG-2 AAC 복호기를 DSP로 구현 시 실시간 디코딩이 가능하도록 설계하였다. 그 이유는 오디오 분야에서 MPEG-2 AAC는 MPEG-4 이후 오디오와 상호 호환성을 갖기 때문이다. MPEG-2 AAC 디코더에서 가장 많은 연산부분을 차지하는 부동소수점유닛의 속도향상을 위하여 하드웨어로 설계하였다. FPU는 승산기와 가산기로 구성되어있다. 승산기는 Radix-4 Booth알고리즘을 사용하였고 가산기는 속도향상을 위하여 1의 보수 방식을 채택하였다. 부동소수점 형식은 지수부에 8bit 가수부에 24bit를 사용한다. IEEE 단정도 포맷과 호환되도록 설계하였으며, 연산기의 속도를 향상시키기 위하여 파이프라인 구조를 채택하였다. 모든 세부블록들은 ISO/IEC 13818-7 표준에 의거하여 구현하였다. 알고리즘 테스트는 C언어를 사용하였고, 설계는 VHDL(VHSIC Hardware Description Language)을 사용하였다. 최대동작속도는 23.2MHz이고, 안정상태의 동작속도는 약 19MHz이다.

MPEG-2 AAC 포맷 기반의 오디오 스트리밍 시스템 설계 및 구현 (Design and Implementation of an MPEG-2 AAC Format-based Audio Streaming System)

  • 이승재;이승룡
    • 한국통신학회논문지
    • /
    • 제27권12C호
    • /
    • pp.1251-1264
    • /
    • 2002
  • 현재 주문형 오디오 서비스나 생방송 서비스를 하는 오디오 스트리밍 제품은 제한된 숫자의 클라이언트만을 지원한다는 제약점과, 네트워크 자원의 비효율적인 사용으로 서비스 안정성의 미비와 질적 저하라는 단점을 가지고 있다. 또한, 사용자의 편의성을 위한 동적 서비스 제공에 대한 고려가 미비하여 사용에 불편을 겪는다. 본 논문에서는 이러한 제약점을 해결하기 위한 하나의 방안으로 네트워크 자원을 효율적으로 사용할 수 있는 MPEG-2 AAC 오디오 파일 포맷을 사용하고, 스트리밍 서비스의 안정성과 질적 향상을 위하여 QoS를 지원하는 오디오 스트리밍 전송과 제어에 대한 설계와 구현에 대해 소개한다. 제안된 시스템은 서버와 사용자간의 인터페이스가 고정적인 웹 페이지 하나 만에 의존하고 있어서 정보의 제공에 있어 정적일 수밖에 없는 현재의 정적인 스트리밍 서비스들과는 달리 동적인 서비스를 제공함으로서 사용자와 서버관리에 편의성을 지원하는 새로운 정보관리 기법을 채택하고 있다. 구현 결과 제안된 시스템은 기존의 MP3 파일 포맷을 사용한 스트리밍 시스템 보다 성능이 개선되었고, 서비스의 안정성뿐만 아니라 서버 관리가 용이하다는 장점도 보여주고 있다.

MPEG-4 표준을 이용한 멀티미디어 스트리밍 시스템 구현 (Implementation of A Multimedia Streaming System using MPEG-4)

  • 임동근;이정우;김선태;마평수;호요성
    • 방송공학회논문지
    • /
    • 제6권3호
    • /
    • pp.215-224
    • /
    • 2001
  • 최근 멀티미디어 분야의 연구개발 동향은 주로 비디오와 오디오 신호의 개별적인 부호화에 치중하던 이전의 기술적 동향에서 벗어나, 비디오, 오디오, 텍스트 등과 같은 여러 종류의 신호에 대하여 시간상 동기일치를 고려하여 다중화하는 시스템 기술의 중요성이 더욱 증가하고 있다. MPEG-4 영상압축 표준은 영상의 내용에 대한 이해를 바탕으로 내용기반 부호화에 중점을 두고 있다. 이 내용기반 부호화에서는 각 미디어 데이터 자체를 개체 단위로 나누어 처리할 수 있기 때문에 사용자의 의도에 따라 다양한 형태의 조작과 디스플레이가 가능하며 그 응용 분야가 매우 넓다. 본 논문에서는 MPEG-4 표준의 시스템 규격과 파일 포맷에 따라 구현된 멀티미디어 서비스 시스템을 기술하였다. 구현된 기술은 멀티미디어 데이터의 스트리밍, DVD, 영상전자메일, 디지털 방송과 같은 다양한 멀티미디어 서비스에 응용될 수 있는 기반 기술로서 그 중요성을 가진다.

  • PDF

MPEG 스트림에서의 비디오 및 오디오 정보를 이용한 신 경계 검출 방법 (A Scene Boundary detection Scheme Using Video and Audio Information of MPEG Stream)

  • 김재홍;강찬미;남종호;김경수;하명환;정경희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.397-399
    • /
    • 2001
  • 본 논문에서는 MPEG 형식으로 압축된 동영상을 데이터에 대하여 비디오 및 오디오 정보를모두 이용하는 새로운 신 경계 검출방법을 제안하고 여러 실험을 통해서 그 유용성을 증명한다. 즉, 본 논문에서는 DC이미지 형태의 대표 프레임을 바탕으로 한 비디오 기반 신 경계 검출방법[8]과 dB값을 이용한 오디오 기반 신 경계 검출방법[9]을 결합하는 방법을 제안한다. 제안한 방법에서는 두 방법에서 모두 신으로 검출한 경계에 대하여서는 신으로 인정하고, 검출한 결과가 다른 경우에 대하여서는 각각의 경계 데이터를 좀 더 자세히 분석하여 신 경계를 검출하도록 한다. 비디오 기반 신 경계 검출방법에서만 검출된 신 경계에 대해서는 그 경계 데이터에 대해서 dB값의 차이를 해당 시간범위 내에서 다시 비교하여 신 경계 여부를 판단하고, 오디오 기반 신 경계 검출방법에서만 검출되 신 경계에 대해서는 그 경계 데이터에 대해서 샷의 유사도를 샷의 개수에 관계없이 시간의 임계치만 고려해서 비교한 다음 신 경계 여부를 판단하게 된다. 이러한 방법으로 신 경계를 검출한 결과를 살펴보면 Precision측면에서는 최고24%까지, Recall측면에서는 최고25%까지 효율을 높이고 있음을 알 수 있다. 이러한 알고리즘은 기존의 신 경계 검출 방법 보다 높은 효율을 제공하여 비디오 데이터를 사용하는 여러 응용분야에서의 프로그램 개발에 이용될 수 있을 것이다.

  • PDF

HD급 멀티미디어 Streaming을 위한 DSP Platform (A DSP Platform for the HD Multimedia Streaming)

  • 홍근표;박종순;문재필;김동환;장태규
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2005년도 학술대회 논문집 정보 및 제어부문
    • /
    • pp.409-411
    • /
    • 2005
  • 본 논문에서는 HD급 멀티미디어 streaming을 처리할 수 있는 DSP 플랫폼을 개발하였다. DSP 플랫폼은 Tl사의 C6400계열 DSP를 사용하였고 다채널의 오디오와 HD급 화질의 비디오_ 데이터를 처리할 수 있다. DSP가 decoder의 기능을 부담함으로써 하드웨어의 재구성이 용이하며 코덱을 다운로드하기 때문에 유연한 멀티미디어 컨텐츠의 재생이 가능하다. 개발한 DSP 플랫폼을 호스트 PC에 설치하여 PC로부터 DSP Configuration 파일과 멀티미디어 스트리밍 데이터를 전송받는 구조를 가진다. 소프트웨어는 실시간으로 demux를 실행하여 오디와 비디오_ 데이터를 분리하석 DSP 플랫폼의 외부메모리에 저장하고 동시에 비디오와 오디오의 디코딩을 실행한다. 오디오와 비디오 데이터의 버퍼 언더런/오버런을 극할 수 있는 buffer control 기법을 적용하였다. 호스트 PC에서 DSP 플랫폼으로의 스트리밍을 하기 위하여 Open Architecture 기반의 Windows OS에서 스트리밍 서비스 프로그램을 구현 하였다. 마지막으로 MPEG-2 video MP@ML인 비디오 코덱과 5.1ch 48kHz AC3인 오디오 코덱으 구성된 streaming 데이터를 사용하여 DSP 플랫폼을 검증하였다.

  • PDF

ARM926EJ-S 프로세서를 이용한 MPEG-4 BSAC 오디오 복호화기의 구현 (Implementation of MPEG-4 BSAC Audio Decoder using ARM926EJ-S Processors)

  • 전영택;박영철
    • 한국정보전자통신기술학회논문지
    • /
    • 제1권2호
    • /
    • pp.91-98
    • /
    • 2008
  • 국내 지상파 DMB방송 표준에서는 2003년 말 국제 표준으로 제정한 MPEG-4 BSAC(Bit Sliced Arithmetic Coding) 오디오 복호화 방식를 표준으로 채택하였다. 본 논문에서는 MPEG-4 BSAC 오디오 복호화기의 주요 도구 및 모듈에 대해 32비트 고정소수점 연산으로 구현하고 ARM926EJ-S 프로세서에 인라인 어셈블리(Inline Assembly)를 적용하여 최적화 한다. 최적화에 대해 본 논문에서는 RISC프로세서인 ARM926EJ-S의 Core Cycle을 가장 높게 발생시키는 곱셈 및 MAC(Multiply And Accumulation)연산에 집중한다. 그리고 각 모듈 및 도구에서 빈번히 발생하는 곱셈 연산과 MAC연산의 처리를 효율적으로 하기 위하여 대상 프로세서인 ARM926EJ-S에서 사용 가능한 ARMv5용 어셈블리 명령어를 분석하여 사용한다. 최적화된 결과는 MIPS(Million Instruction Per Second)를 기준으로 평가한다. 구현 결과는 96kbps BSAC bitstream을 65MHz CPU clock에서 실시간으로 디코딩할 수 있음을 보여준다.

  • PDF