• 제목/요약/키워드: MPEG 오디오

검색결과 276건 처리시간 0.024초

Java3D 기반 MPEG-4 시스템의 DMIF 및 BIFS 파서 구현 (Implementation of DMIF & BIFS Parser in Java3D-based MPEG4 System)

  • 최정단;장병태;오광만;이민석;곽진석
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2001년도 추계학술발표논문집
    • /
    • pp.253-259
    • /
    • 2001
  • 인터넷을 통해 멀티미디어 데이터의 접근이 보편화됨에 따라 다양한 형태의 데이터와 사용자 인터렉션이 요구되었고, 또한 유선 및 무선등과 같은 다양한 통신 선로에서 Desktop-PC, PDA, Hand-Held PC등과 같은 다양한 단말기를 통해 멀티미디어 데이터 서비스를 받으려는 사용자의 요구가 증가되고 있다. 따라서 이런 요구를 효율적으로 지원할 수 있는 멀티미디어 시스템에 대한 개발이 요구되었고, 이를 위해 MPEG4 표준이 등장하게 되었다. MPEG-4(ISO/IEC 국제표준 14496)는 오디오, 비디오, 합성 오디오, 그리고 그래픽스 요소(material)를 포함하는 멀티미디어 데이터로 구성된 복잡한 씬(scene)을 구성하고, 이를 통신라인을 통해 사용자와 상호작용이 가능한 멀티미디어 시스템을 정의하는 표준규약을 말한다. 본 논문에서는 Java와 Java3D기반의 MPEG-4 표준 규약에 충실한 MPEG-4 시스템 구현에 대하여 기술한다.

  • PDF

검색의 일관성원리와 피드백을 이용한 감성기반 음악 검색 시스템 (Emotion-Based Music Retrieval Using Consistency Principle and Multi-Query Feedback)

  • 신송이;박은종;엄경배;이준
    • 정보처리학회논문지B
    • /
    • 제17B권2호
    • /
    • pp.99-106
    • /
    • 2010
  • 본 논문에서는 검색의 일관성원리와 다중질의 방법을 이용하여 감성을 기반으로 음악을 검색하는 알고리즘을 제안한다. 사용되어지는 특징들은 MPEG-7에서 제공하는 오디오 서술자들이며 이 정보들을 사용하는 것은 국제표준화가 용이 하다는 장점을 가지고 있기 때문이다. 또한 감성에 따라 MPEG-7 오디오 서술자들의 가중치를 부여하는 방법을 제안하여 계산량을 줄이는 방법을 고안하였으며 일관성원리와 다중질의 방법을 사용하는 적합성 피드백을 사용하여 검색의 적합률을 향상시켰다.

MPEG 심리음향모델의 고속 구현을 위한 효율적 FFT 연산 (An Efficient Computation of FFT for MPEG/Audio Psycho-Acoustic Model)

  • 송건호;이근섭;박영철;윤대희
    • 대한전자공학회논문지SP
    • /
    • 제41권6호
    • /
    • pp.261-269
    • /
    • 2004
  • 본 논문은 MPEG 오디오 부호화 과정 중 심리음향모델(PAM: Psychoacoustic Model)에 사용되는 FFT를 효율적으로 계산할 수 있는 방법을 제안한다. MPEG 오디오 부호화 과정 중 심리음향 모델 연산은 많은 연산량을 차지하며, 부호화의 실시간 및 저 전력 구현을 위해서는 이의 최적화가 요구된다. 최적화를 위하여 제안하는 알고리듬은 심리음향모델에서 사용하는 입력신호에 대한 1024-샘플 FFT 대신에 서브밴드과정에서 나온 각각의 32개의 밴드에 대하여 32-샘플 FFT를 함으로써 1024-샘플 FFT의 효과를 얻는데 있다. 이때 서브밴드과정을 거친 신호에 대한 FFT에는 에일리어징이 발생하며 이를 줄이기 위하여 버터플라이 구조의 에일리어징 제거블록을 제안한다. 제안한 알고리듬으로 심리음향모델을 구현할 경우 SMR이 약 1dB이내의 오차를 가지며, 기존 알고리듬에 비해 절반의 연산량으로 심리음향 모델을 위한 FFT 스펙트럼을 얻을 수 있다.

다시점 방송 서비스를 위한 사용자 위치추적 기반 다채널 오디오 패닝 시스템 구현 (Implementation of a Person Tracking Based Multi-channel Audio Panning System for Multi-view Broadcasting Services)

  • 김용국;양종열;이영한;김홍국
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.150-157
    • /
    • 2009
  • 본 논문에서는 다시점 방송 서비스(multi-view broadcasting service)를 위한 사용자 위치추적 기반 다채널 오디오 패닝 시스템을 제안한다. 다시점 방송이란 각기 다른 시점에 해당하는 카메라들을 이용하여 촬영한 영상을 렌더링 해주는 방송 서비스이며 다채널 오디오 패닝 기법은 이러한 다시점 방송의 실감효과를 증대시키기 위한 오디오 렌더링에 필요한 기술이다. 이런 실감 오디오 기술을 다시점 방송 서비스에 적용하기 위해서 사용자의 시점정보를 얻을 수 있는 사용자 추적 기술 역시 필요하다. 이를 위해서 본 논문에서 제안한 기술은 크게 두 가지로 나눌 수 있다. 첫째로, 초음파 위성 및 수신기를 이용하는 사용자 추적 기술을 제안한다. 제안한 사용자 추적 기술을 이용해 약 10 mm 근방의 높은 해상도와 약 0.15초의 빠른 간격으로 사용자의 위치정보를 얻을 수 있었다. 둘째로, 공간 파라메터 기반 다채널 오디오 패닝 기술을 제안한다. 제안한 오디오 패닝 기법은 MPEG Surround로 압축된 오디오에 대해 MPEG Surround의 공간 파라메터를 이용하여 복호화 시 패닝된 오디오를 얻는 방법이다. 제안된 방법의 성능을 평가하기위해 음질 측면과 음상 정위 측면에서 성능을 평가하였다. 음질 측정은 MUSHRA 방법으로 이루어졌으며, 제안된 방식은 약 90점에 해당하는 MUSHRA점수로 평가되었다. 또한, 음상 정위 성능은 더미헤드를 이용하여 각 패닝 오디오에 대한 각도별 주파수응답을 측정하여 방사패턴을 분석하였다. 그 결과 본 논문에서 제안된 방식은 기존 파라메터 기반 오디오 패닝 방식에 비해 향상된 음질을 보임과 동시에 음상이 올바른 위치에 정위됨을 보일 수 있었다. 마지막으로 제안된 사용자 추적 기법 및 오디오 패닝 기법을 다시점 영상 재생 시스템과 결합시킴으로써, 사용자 추적 기반 다시점 방송 시스템의 프로토타입을 구현하였다.

  • PDF

DSP 가속기가 내장된 RISC 프로세서 기반 MPEG/Audio 복호화기의 구현 (Implementation of MPEG/Audio Decoder based on RISC Processor With Minimized DSP Accelerator)

  • 방경호;이근섭;박영철;윤대희
    • 한국통신학회논문지
    • /
    • 제29권12C호
    • /
    • pp.1617-1622
    • /
    • 2004
  • 무선단말기용 오디오 복호화기는 무선이동환경의 특성상 낮은 전력소모가 요구된다. 단일 RISC 프로세서를 이용하며 비디오/오디오 신호를 처리하는 기존의 구현은, RISC 프로세서의 연산부담이 과도하여 실시간 밀터미디어 서비스를 지원하기에는 효율적이지 못하고 캐쉬 메모리가 충분하지 않은 경우 잦은 캐쉬-미스로 인하여 전력소비량이 증가하게 된다. 본 논문에서는 무선단말기를 위한 MPEG/Audio 복호화기를 설계하자 MAC 연산에 최적화된 DSP 블록이 내장된 RISC 프로세서를 이용하여 복호화 시스템을 구현하였다. 오디오 복호화 과정을 연산중심부분과 제어중심부분으로 분할하고, 각각 DSP 블록과 RISC 프로세서에 할당하여. 병렬적으로 처리할 수 있도록 알고리듬을 설계하였다. 제안된 시스템은 MP3와 AAC 복호화 과정을 각각 17MHz, 24MHz로 처리한다. 이것은 단일 RISC 프로세서의 구현에 비하여 각각 48%와 40% 감소한 것이다. 오디오 신호처리에 최척화된 DSP 블록이 내장된 RISC 프로세서를 이용하는 것은 자원의 효율적인 이용이 가능하고, 캐쉬 메모리가 크지 않은 휴대용 멀티미디어 시스템에 적합하다.

MPEE-2 AAC 오디오 인코더 및 디코도 구현 (Implementation of Audio Encoder and Decoder Using MPEG-2 AAC)

  • 홍진우;장대영;김진웅
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 2호
    • /
    • pp.217-222
    • /
    • 1999
  • 본 논문에서는 멀티채널 오디오 부호화 방식인 MPEG-2 AAC(Advanced Audio Coding) 국제 표준을 수용한 AAC 인코더 및 디코더의 실시간 구현에 대해 기술한다. 범용 DSP 인 TMS320C6701 DSP를 이용한 하드웨어 플랫폼과 이 플랫폼에서 실시간으로 동작되는 인코더와 디코더 소프트웨어를 설계, 개발(MASIC 시스템)하였다. 구현한 MASIC 시스템은 오디오 입력 장치, 출력 장치, 인코더 보드, 그리고 디코더 보드로 구성되어 있으며, 개인용 컴퓨터의 PCI 슬롯을 이용하여 인코더의 경우 최대 6채널의 오디오를, 디코더의 경우 8채널의 오디오를 실시간 동작으로 처리할 수 있다. 인코더 및 디코더의 실시간 처리를 위한 소프트웨어 최적화 기술 및 인코더와 디코더의 연동시험에 대해서도 기술하며, 개인용 컴퓨터에서 실시간으로 수행되는 스테레오 AAC 디코더 소프트웨어의 개발 결과를 기술한다.

  • PDF

16 비트 고정소수점 연산기를 이용한 고음질 MPEG-2 Layer-III 오디오 복호화 알고리듬 (High Quality MPEG-2 Layer-III Audio Decoding Algorithm Using 16-bit Fixed-point Arithmetic)

  • 이근섭;이규하;오현오;황태훈;박영철;윤대희
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.775-778
    • /
    • 2000
  • 2채널의 MPEG-2 Layer-Ⅲ 오디오 복호화 알고리듬이 16비트의 고정소수점 연산기로도 고음질의 오디오출력을 얻을 수 있도록 최적화를 수행하였다. 고음질을 얻기 위하여 고정소수점 연산기에서 발생하는 양자화 오차를 최소화 하였으며 각 복호화 과정 별로 최소의 오차를 발생시키는 알고리듬을 제안하고 사용하였다. 고정소수점 모의실험은 C-언어를 사용하여 수행되었으며, ISO-IEC 13818-4 Compliance Test를 수행하여 최적화된 복호화기가 ISO/IEC 13818-4 audio decoder의 기준을 만족함을 보였다.

  • PDF

MPEG-2 AAC 스트리밍을 이용한 인터넷 오디오 방송기술 (Internet Audio Broadcasting Technology using MPEG-2 AAC Streaming)

  • 이태진;홍진우
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2001년도 추계학술발표대회 논문집 제20권 2호
    • /
    • pp.255-258
    • /
    • 2001
  • 본 논문에서는 MPEG-2 AAC(Advanced Audio Coding)와 RTP/RTCP, RTSP, TCP/IP 등의 인터넷 프로토콜을 이용한 고품질 인터넷 오디오 방송 기술에 대해 기술한다. AAC 데이터를 인터넷을 통해 실시간으로 전송하기 위해 RTP/RTCP 프로토콜을 사용하고, 사용자에게 편리한 인터페이스를 제공하기 위해 RTSP 프로토콜을 사용한다. TCP/IP 프로토콜은 서버/클라이언트간에 중요한 정보의 교환에 이용되어 진다. 본 논문에서는 위의 다양한 프로토콜을 이용하여 AAC 데이터를 스트리밍 하는 방법과 이를 이용한 인터넷 오디오 방송용 서버/클라이언트를 구성하는 방법에 대해 기술한다.

  • PDF

MPEG-D USAC : LPD 복호화기의 고정 소수점 알고리즘 구현 (Fixed-point Implementation of LPD Decoder in MPEG-D USAC)

  • 송은우;송정욱;강홍구
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2012년도 하계학술대회
    • /
    • pp.254-256
    • /
    • 2012
  • 본 논문에서는 MPEG-D 오디오 서브그룹에서 진행 중인 Unified Speech and Audio Coding (USAC) 표준의 Linear Prediction Domain (LPD) 복호화기 모듈을 고정소수점 알고리즘으로 제안한다. USAC 부호화기는 두 개의 최신 음성-오디오 부호화기가 융합된 형태로, 음성 및 오디오 신호에 대하여 우수한 성능을 갖는 부호화기이다. USAC의 표준 완료와 본격적인 서비스화에 앞서서 USAC LPD 복호화기의 구조적인 특성을 분석하고, Digital Signal Processor (DSP)구현을 위한 LPD 복호화기의 고정소수점 알고리즘을 구축하는 동시에 모듈의 복잡도를 측정하고자 한다. 또한 고정소수점 알고리즘으로 구현된 LPD 복호화기와 기존의 부동소수점 복호화기의 성능을 비교하고, LPD 복호화기의 두 가지 부호화 모드에 따른 복잡도 이슈를 다루도록 한다.

  • PDF

LTE-R 네트워크에서 스트리밍 오디오 전송성능 (Transmission Performance of Streaming Audio over LTE-R Network)

  • 김영동
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2019년도 춘계학술대회
    • /
    • pp.456-458
    • /
    • 2019
  • 본 연구에서는 LTE-R을 기반으로 하는 철도통신에서 응용서비스로서 스트리밍 오디오의 전송성능을 분석하고자 한다. 본 연구에서 성능분석은 NS(Network Simulator)-3에 기반한 컴퓨터 시뮬레이션을 사용하여 수행하며, 분석대상 응용서비스로는 MPEG(Moving Picture Experts Group)-4의 오디오 프레임을 사용한다. 본 연구의 결과는 LTE-R 네트워크 구축뿐 아니라 LTE-R 네트워크를 대상으로 하는 응용서비스 개발의 기초자료로 활용이 가능하다.

  • PDF