• Title/Summary/Keyword: Multi-Channel Audio Coding

검색결과 16건 처리시간 0.041초

Multi-channel Audio Service in a Terrestrial-DMB System Using VSLI-Based Spatial Audio Coding

  • Seo, Jeong-Il;Moon, Han-Gil;Beack, Seung-Kwon;Kang, Kyeong-Ok;Hong, Jae-Keun
    • ETRI Journal
    • /
    • 제27권5호
    • /
    • pp.635-638
    • /
    • 2005
  • Spatial audio coding (SAC) is an extremely high compact representation of encoded multi-channel audio material. This paper suggests a multi-channel audio service in the terrestrial digital multimedia broadcasting (T-DMB) system using a novel SAC tool, which is called a virtual source location information (VSLI)-based SAC tool. Intensive experiments are presented to evaluate the validity of the proposed VSLI-based SAC tool, and prototypical systems are also presented to demonstrate the reliability of the proposed multi-channel T-DMB system in real applications.

  • PDF

다채널 오디오 코딩을 위한 MPEG Surround-1부: 기본 구조 (MPEG Surround for Multi-Channel Audio Coding-Part 1: Basic Structure)

  • 방희석
    • 한국음향학회지
    • /
    • 제28권7호
    • /
    • pp.599-609
    • /
    • 2009
  • 최근 국제 표준으로 등록된 MPEG의 다채널 오디오 코딩 기술인 MPEG Surround에 대해 소개한다. 이 오디오 표준은 멀티채널 신호를 다운믹스하여 모노나 스테레오 신호를 생성하고 동시에 공간 파라미터를 추출하는 방법을 이용하여 부호화 과정을 수행한다. 복호화 과정에서는 다운믹스 신호와 공간 파라미터들을 사용하여 다채널 신호를 생성하는데, 다운믹스 신호는 AAC나 MP3등 일반 오디오 코딩 방법에 의해 부호화하며 공간 파라미터들도 매우 낮은 정보량을 사용하기 때문에 전체적으로 매우 적은 비트율을 사용하여 고음질의 신호를 생성할 수 있다는 장점이 있다. 또한, 공간 파라미터들을 무시할 경우 휴대용 오디오 재생 기기에서 다운믹스 신호를 재생할 수 있으므로 기존 코딩 방법에 대해 역방향 호환성을 가진다. 본 논문의 1부에서는 MPEG Surround의 기본 구조에 대해 소개하고, 이어지는 2부에서는 헤드폰이나 이어폰을 이용하여 가상의 5.1 채널을 지원하는 바이노럴 모드를 포함해 다양한 모드와 툴들에 대해 소개한다. 여러 회사와 기관들에 의해 수행된 청취 평가의 결과도 함께 보이고 있다.

Angle-Based Virtual Source Location Representation for Spatial Audio Coding

  • Beack, Seung-Kwon;Seo, Jeong-Il;Moon, Han-Gil;Kang, Kyeong-Ok;Hahn, Min-Soo
    • ETRI Journal
    • /
    • 제28권2호
    • /
    • pp.219-222
    • /
    • 2006
  • Virtual source location information (VSLI) has been newly utilized as a spatial cue for compact representation of multichannel audio. This information is represented as the azimuth of the virtual source vector. The superiority of VSLI is confirmed by comparison of the spectral distances, average bit rates, and subjective assessment with a conventional cue.

  • PDF

지상파 DMB를 통한 멀티채널 오디오 서비스 검증에 관한 연구 (Verification of the Multi-channel Audio Service over T-DMB)

  • 장대영;이용주
    • 방송공학회논문지
    • /
    • 제12권3호
    • /
    • pp.222-229
    • /
    • 2007
  • 멀티미디어 부호화 기술의 발전에 따라 HDTV, DVD 등 고품질 멀티미디어 서비스가 가능하여 졌으며, 오디오의 경우 5.1채널 오디오의 사용범위가 점점 확대되어, 가정용 극장 시스템(Home Theater), 자동차용 극장 시스템(Car Theater)에 의해 일반 소비자들도 쉽게 접할 수 있는 서비스가 되었다. 지상파 DMB는 휴대용 방송 서비스로서 2005년 12월부터 본격적으로 서비스되고 있으나, 그 대역폭이 충분하지 않고 휴대용이라는 특성에 의해 멀티채널 오디오에 대한 고려를 하지 않고 있다. 최근 휴대용 방송 서비스를 위한 고효율 멀티채널 오디오 부호화 기술 표준화가 MPEG에서 추진되고 있음에 따라 DMB에서도 멀티채널 오디오 서비스에 대한 가능성이 열렸으며, 유럽에서는 이를 이용한 다양한 서비스를 시도하려고 계획하고 있다. 본 논문에서는 한국에서 서비스되고 있는 지상파 DMB를 통한 멀티채널 오디오 서비스의 가능성을 검증하기 위해 멀티채널 오디오 부호화 기술 및 검증 시스템의 구현에 대하여 기술하며, 향후 서비스 실현을 위한 가능성을 고찰하고자 한다.

An Efficient Representation Method for ICLD with Robustness to Spectral Distortion

  • Beack, Seung-Kwon;Seo, Jeong-Il;Kang, Kyung-Ok;Hanh, Min-Soo
    • ETRI Journal
    • /
    • 제27권3호
    • /
    • pp.330-333
    • /
    • 2005
  • The Inter-Channel Level Difference (ICLD) is a cue parameter to estimate spectral information in a binaural cue coding that has been recently in the spotlight as a multichannel audio signal compression technique. Even though the ICLD is an essential parameter, it is generally distorted by quantization. In this paper, a new modified ICLE representation method to minimize the quantization distortion is proposed by adopting a flexible determination of the reference channel and the unidirectional quantization. Our experimental result confirms that the proposed method improves the multichannel audio output quality even with the reduced bit-rate.

  • PDF

멀티채널 오디오 부호화를 위한 TMS320C6701 DSP 보드 구현 (Implementation of the TMS320C6701 DSP Board for Multichannel Audio Coding)

  • 장대영;홍진우;곽진석
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 1999년도 추계종합학술대회
    • /
    • pp.199-203
    • /
    • 1999
  • 본 논문은 MPEG-2 AAC 멀티채널 오디오 및 MPEG-4 오디오의 다중객체 부호화를 위한 DSP 시스템의 설계 및 구현에 관하여 기술한다. DSP로서는 TI 사의 최근 제품인 고성능의 TMS320C6701 (이하 6701로 함) 2개를 사용하였고, DSP 보드는 PC에 장착하여 프로그램을 다운로드하고 시스템을 제어할 수 있게 하기 위하여 PCI 인터페이스를 함께 구현하였으며, 부호화기 및 복화기로서 함께 사용할 수 있는 구조로서 설계하였다. 또한 멀티채널 오디오를 디지털 신호로 변환하고 다중화하여 직렬신호로서 입력하고, 다시 역으로 출력하기 위한 시스템을 별도로 외부에 구현하였으며, 접속 인터페이스로서 ADI (Alesys Digital audio Interface)론 사용하여, ADI 인터페이스를 지원하는 멀티채널오디오 장비론 입출력 시스템으로 사용할 수 있도록 하였다. 현재의 결과로서는 MPEG-2 AAC 4채널 오디오를 2개의 DSP를 사용하여 실시간으로 안정되게 부호화 할 수 있으며, 1개의 DSP로도 8채널까지의 복호화가 가능함을 확인하였다.

  • PDF

ILD DISTORTION을 이용한 MPEG SURROUND의 음질 개선 (Sound Quality Enhancement in MPEG Surround by Using ILD Distortion)

  • 전상배;최인용;성굉모
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2006년도 하계종합학술대회
    • /
    • pp.241-242
    • /
    • 2006
  • MPEG Surround is an audio coding technology that represents multi-channel audio signal with downmixed audio signal(s) and very low bitrate side information based on Binaural Cue Coding. The side information consists of Inter-Channel Level Difference, Inter-Channel Correlation, and payloads. These two parameters are correspondent to the well-known spatial parameters in psycho-acoustics, Inter-aural Level Difference (ILD) and Inter-Aural Cross Correlation (IACC). Though ICLD is to provide perceptually equivalent ILD to the listener, however, the ILD of the original multi-channel audio signal and that of the MPEG Surround encoded signal was different. The difference between two ILD values is defined as ILD Distortion (ILDD). This paper provides how ILDD can be applied to enhance sound quality in MPEG Surround and how much ILDD is decreased.

  • PDF

압축율 변화에 따른 멀티채널 오디오의 품질 및 Predistortion 의 영향 평가 (Quality Assessment and Predistortion Evaluation of the Multi-channel Audio Codec according to the bitrate changing)

  • 차경환;장대영;김성한;김천덕
    • 한국음향학회지
    • /
    • 제15권2호
    • /
    • pp.55-60
    • /
    • 1996
  • 본 논문에서는 멀티채널 오디오의 전송 및 재생에 있어서 압축율 변화에 따른 음질의 주관 평가와 matrixing과 dematrixing 과정에서 발생하는 가청잡음을 보상해 주는 predistortion 의 영향을 평가하였다. 시뮬레이션은 지각 부호화를 이용하는 MPEG-2 오디오 계층2의 알고리즘을 사용하였으며, 압출율은 384, 320, 256, 128kbps로 변화시키면서 predistortion 의 유/무에 따른 음질의 영향을 평가하였다. double blind 법에 의한 주관 평가 결과 3/2채널에서 5점 열화척도가 320kbps까지는 -1이하로 원음과 차이가 없거나 거슬리지 않는 것으로 평가되었으며, predistortion의 영향은 128kbps에서 척도1정도 품질이 향상되었으며, 특히 음성시료가 음악시료보다 더욱 향상된 결과를 얻었다.

  • PDF

실시간 처리를 위한 멀티채널 오디오 코덱의 구현 (The Implementation of Multi-Channel Audio Codec for Real-Time operation)

  • 홍진우
    • The Journal of the Acoustical Society of Korea
    • /
    • 제14권2E호
    • /
    • pp.91-97
    • /
    • 1995
  • 본 논문은 저비트율을 갖는 고품질의 HDTV용 멀티채녈 오디오 코덱을 구현에 대해 기술한다. 이 코덱은 저주파수 효과 채널을 포함한 최대 3/2 스테레오 채널 구성, 최대 채널 구성보다 낮은 채널 구성과의 호환성, 기존 2채널 스테레오 시스템과의 호환성(MPEG-1 오디오), 그리고 다중 대화 채널 등을 제공하는 특징을 갖는다. 구현한 멀티채널 오디오 코덱의 인코더는 3개의 DSP(TI의 TMS320C40)로 구성되었고, 최대 48KHz 샘플링율과 16비트의 부호화를 갖는 5.1 채널의 아날로그 및 AES/EBU, IEC 958등의 포맷을 갖는 스테레오 2채널의 디지털 오디오를 이력으로 받아 지각 심리음향 모델을 사용하여 압축한후 384Kbps의 빛 스트림으로 전송하는 특징을 가지며, 디코더는 2개의 DSP로 구성되어 있고, 384Kbps로 입력되는 비트 스트림을 받아 최대 5.1 채널의 아날로그 및 2개의 2채널 스테레오의 디지털 오디오 신호로 출력시키는 특징을 갖는다. DSP를 이용한 다중처리는 DMA를 통한 통신포트를 이용한 DSP들간의 고속 데이터 전송에 의해 이루어진다. 끝으로, 멀티 채널 오디오 코덱의 구현을 통하여 나타난 실시간 처리는 위해 고려해야할 기술적 사항을 제안한다.

  • PDF

Dual-Domain Connection Scheme for HE-AAC and MPEG Surround

  • Pang, Hee-Suk
    • The Journal of the Acoustical Society of Korea
    • /
    • 제28권1E호
    • /
    • pp.29-34
    • /
    • 2009
  • MPEG4 High Efficiency Advanced Audio Coding (HE-AAC) and MPEG Surround are one of the most efficient combinations for low bit rate multi-channel audio coding. Based on the fact that these two codecs have identical quadrature mirror filter (QMF) analysis and synthesis structures, we propose a dual-domain connection scheme for the codecs. Specifically two time-domain connection methods are analyzed and compared to the QMF subband-domain connection method. Experimental results show that both the time-domain connection methods cause no subjective sound quality degradation compared to the QMF subband-domain connection method, which verifies that one can select either of them depending on application scenarios.