• Title/Summary/Keyword: MPEG 오디오

Search Result 276, Processing Time 0.023 seconds

Research on audio bandwidth extension using residual signal replication (잔차 신호 복제 기반 오디오 대역 확장 방법)

  • Lim, Wootaek;Beack, Seungkwon;Lee, Taejin
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2021.06a
    • /
    • pp.57-60
    • /
    • 2021
  • 오디오 대역 확장 기술은 저 해상도의 오디오 신호를 고 해상도의 오디오 신호로 복원 또는 생성해 내는 기술이다. 이와 관련하여 오디오 코덱에서는 고 대역 오디오 신호의 저 비트 부호화를 위해 사람이 청각이 둔감하게 인지하는 고 대역의 오디오 신호에 대해 실제 신호에 대한 양자화를 수행하지 않고, 코딩 되어 전송된 저 대역 신호와 고 대역의 파라미터를 이용하여 신호를 합성하는 스펙트럼 대역 복제 기술이 널리 사용된다. 본 연구에서는 선형 예측 기반의 주파수 대역 복제 방법을 통해 추가 정보를 활용한 오디오 대역 확장을 수행하고 신경망 기반의 오디오 신호 개선을 통해 복제된 신호의 개선 가능성을 검토하였다. 실험 평가는 MPEG 에서 코덱 평가용으로 사용되는 테스트 시퀀스를 사용하였으며, 실험 결과 제안하는 방법을 적용하여 기존 오디오 대역 확장 기술 대비 성능이 향상됨을 확인하였다.

  • PDF

MPEG Surround for Multi-Channel Audio Coding-Part 2: Various Modes and Tools (다채널 오디오 코딩을 위한 MPEG Surround-2부: 다양한 모드 및 툴들)

  • Pang, Hee-Suk
    • The Journal of the Acoustical Society of Korea
    • /
    • v.28 no.7
    • /
    • pp.610-617
    • /
    • 2009
  • An overview of various modes and tools of MPEG Surround is provided Because the binaural mode of MPEG Surround supports the virtual 5.1-channel playback based on HRTFs, it can be played via headphones and earphones for portable audio devices. MPEG Surround also supports the enhanced matrix mode which converts stereo signals to 5.1-channel signals without side information, the 3D stereo mode which deals with 3D-coded signals, the low power version which greatly reduces the computational load in the decoding process. Besides, MPEG Surround provides the arbitrary downmix gains (ADGs) tool which is applied to artistic downmix signals, the matrix compatibility tool which is applied to downmix signals by conventional matrix-based methods, the residual coding tool -which can be used at high bit rates, and the GES tool which is applied to specific sound such as applause. The listening test results by various companies and organizations are also presented for important modes and tools.

An Audio Coding Technique Employing the Inter-channel Phase Difference Skip (채널 간 위상차 파라미터 생략 기법을 이용한 오디오 부호화)

  • Kim, Hyun-Hwi;Kim, Rin-Chul
    • Journal of Broadcast Engineering
    • /
    • v.21 no.3
    • /
    • pp.369-379
    • /
    • 2016
  • This paper deals with an efficient method for skipping inter-channel phase differences (IPD) in the MPEG surround of the unified speech and audio coding (USAC). Based on the psycho-acoustic sensitivity on the IPD, we estimate a threshold on IPD, below which we can not notice degradation in spatial cue. We propose an IPD skip method, in which any IPDs within the threshold are set to zero and are not transmitted. The proposed IPD skip method gives about 38% savings in terms of bit amount for IPD. Nevertheless, in the MUSHRA test, the proposed method does not show any noticeable degradation in the decoded audio quality.

Design and Implementation of MPEG-4 binary Converter for Interactive T-DMB Service (지상파 DMB 대화형 서비스를 위한 MPEG-4 바이너리 컨버터 설계 몇 구현)

  • Lee Injae;Kim Kiwan;Yu Wonhyuk;Kim Joongkyu;Kim Kyuheon
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2004.11a
    • /
    • pp.89-92
    • /
    • 2004
  • 방송과 통신의 융합, 방송서비스의 다양화와 더불어 방송의 디지털화는 기존의 아날로그 방식에 비해 고화질 및 고음질의 방송 서비스 제공 및 타 매체와의 호환성 그리고 다양한 부가 서비스의 제공 등에 있어서 많은 이전을 제공할 수 있다. 또한, 디지털방송 방식은 기존 아날로그 방식의 이동수신 문제점을 해결하고자 디지털 오디오 방송(DAB: Digital Audio Broadcasting)에 멀티미디어 서비스를 .제공하는 디지털 멀티미디어 방송(DMB: Digital Multimedia Broadcasting)을 제안하였다. 지상파 DMB 방송은 유럽의 Eureka-147 방식의 DAB를 기반으로 하며 디지털 라디오방송과 함께 오디오 외에도 다양한 멀티미디어를 전송하고, 콘텐츠에 대화형 기능을 포함하는 서비스 형태를 목표로 하고 있다. 현재 지상파 DMB 서비스에서는 기본적인 AV 서비스를 위해 비디오는 AVC, 오디오는 BSAC에 대해 규정하고 있다. 또한 AV 규격 외에 대화형 서비스를 제공하기 위한 보조 데이터로서 장면기술 데이터와 그래픽 데이터를 지원하고 있다. 따라서 본 논문에서는 지상파 DMB를 이용한 대화형 서비스를 제공하기 위해 요구되는 초기 객체 정보, 객체 정보, 장면 구성 정보를 바이너리 형태로 생성해 주는 MPEG-4 바이너리 컨버터를 설계하고 구현하였다.

  • PDF

Design and Implementation of Multimedia Retrieval a System (멀티미디어 검색 시스템의 설계 및 구현)

  • 노승민;황인준
    • Journal of KIISE:Databases
    • /
    • v.30 no.5
    • /
    • pp.494-506
    • /
    • 2003
  • Recently, explosive popularity of multimedia information has triggered the need for retrieving multimedia contents efficiently from the database including audio, video and images. In this paper, we propose an XML-based retrieval scheme and a data model that complement the weak aspects of annotation and conent based retrieval methods. The Property and hierarchy structure of image and video data are represented and manipulated based on the Multimedia Description Schema (MDS) that conforms to the MPEG-7 standard. For audio contents, pitch contours extracted from their acoustic features are converted into UDR string. Especially, to improve the retrieval performance, user's access pattern and frequency are utilized in the construction of an index. We have implemented a prototype system and evaluated its performance through various experiments.

Optimized MPEG Audio Software Decoder for 32-bit MCU (32비트 MCU에 적합한 MPEG 오디오 소프트웨어 복호화기)

  • 이근섭;박영철;윤대희
    • Proceedings of the IEEK Conference
    • /
    • 2001.09a
    • /
    • pp.473-476
    • /
    • 2001
  • 본 논문에서는 32비트 MCU RISC 프로세서를 사용하여 MPEC 오디오 복호화기를 소프트웨어의 구현하였다. 구현된 MPEC 오디오 복호화기는 MPEC-2 Layer-III (MP3)와 MPEC-2 AAC 로 구성된다. 프로그래밍 가능한 소프트웨어로 구현하여 향후 성능 개선이나 새로운 기능을 추가할 수 있는 유연성을 극대화하였다. 복호화기 구현은 구현 시간과 비용을 고려하여 직접 어셈블리를 코딩하는 대신 최적화된 C 코드를 사용하여 컴파일하는 방법을 선택하였다. 이때 발생할 수 있는 성능 저하 요소들을 줄이기 위해 추가의 최적화 과정을 수행하여 성능을 개선하는 방법을 제시하였다. 구현된 복호화기의 출력 음질은 ISO 13818-4 compliance test 결과 Full compliance 를 만족하였다. 또한 연산량 최적화 결과 MP3 와 AAC 테스트 비트열에 대해 모두 35 MHz 이하의 동작 주파수로 동작이 가능함을 확인하였다.

  • PDF

Implementation of Digital Audio Player using AAC/MP3 Decoder (AAC/MP3 복합 복호화기를 이용한 오디오 플레이어의 구현)

  • SEO JEONG-IL;JANG DAE-YOUNG;HONG JIN-WOO
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.251-254
    • /
    • 2001
  • 본 논문에서는 ETRI와 연세대가 공동 개발한 AAC/MP3 복합 복호화기 ASIC 칩을 이용한 AAC/MP3 오디오 플레이어의 설계 및 구현에 대해 기술한다. 본 논문에서 사용한 AAC/MP3 복합 복호화 ASIC Chip은 20비트 고정소수점 DSP 코어를 이용하여 MP3와 MPEG-2 AAC LC 프로파일을 복호화하며, MPEG-2 AAC 메인 프로파일을 실시간으로 복호화하기 위하여 허프만 복호화 과정과 예측 과정은 전용 하드웨어 모듈을 이용하였다 이를 이용한 오디오 플레이어는 AAC/MP3 파일 재생 기능, USB를 이용한 호스트 PC와의 인터페이스 기능, Flash 메모리와의 인터페이스 기능 등의 특성을 갖는다.

  • PDF

Video Data Compression using the MPEG-2 Video Algorithm (MPEG-2 비디오 알고리즘을 이용한 비디오 데이터 압축)

  • 남재열;이영선;이현주;김재곤;이상미;안치득
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.18 no.8
    • /
    • pp.1069-1082
    • /
    • 1993
  • The International Organization for Standardization(ISO) has undertaken an effort to develop a standard for video and associated audio on digital storage media. This effort is known by the name of the expert group that started if : MPEG-Moving Picture Experts Group Is currently part of the ISO-I EC/J TC1/SC2/WG11. The promise of MPEG-2 is that a video signal and its associated audio can be compressed to a bit rate of about 10 Mbits/s with an acceptable quality. In this paper, the implementation of a video compression simulator based on MPEG-2 Video Test Model 2(TM2) is described and analyzed according to the simulation results. The implemented simulator is also applied to code HDTV sequences at the several bit rates. Some computer simulation results using the MPEG and the HDTV test sequences are given. In addition, some techniques which can improve the coding efficiency of the implemented video compression simulator are also suggested.

  • PDF

Enhanced Pre echo Control Algorithm for MPEG Audio Coders (MPEG 오디오 부호화기를 위한 향상된 프리 에코 컨트롤 알고리듬)

  • Lee Chang-Joon;Lee Jae-Seong;Park Young-Cheol
    • Journal of Broadcast Engineering
    • /
    • v.11 no.2 s.31
    • /
    • pp.191-199
    • /
    • 2006
  • This paper presents an efficient pre echo control scheme for MPEG Audio coders based on the psychoacoustic model II (PAM-II). Pre echo control is the final step for the calculation of masking threshold in the PAM II. It is to minimize the spread of quantization error over the processing frame. In the conventional encoders, pre echo is reduced by restricting the estimated masking threshold not to exceed the one obtained in the previous frame. The conventional method performs pre echo control not only for short blocks but also for long blocks, which lowers the masking threshold in long blocks and, in turn, increases the quantization noise level of corresponding blocks. This paper proposes an efficient pre echo control process. The test result shows a mean enhancement of more than 0.4 especially for complex signals on the ITU R 5 point audio impairment scale.

A Two-Stage Bit Allocation Algorithm for MPEG-1 Audio Coding (MPEG-1 오디오 부호화를 위한 2단계 비트 할당 알고리듬)

  • 임창헌;천병훈
    • Journal of Korea Multimedia Society
    • /
    • v.5 no.4
    • /
    • pp.393-398
    • /
    • 2002
  • The conventional bit allocation scheme for MPEG-1 audio encoding searches the subband with minimum MNR(mask-to-noise ratio) repetitively until its operation is completed, which occupies most of its total computational complexity. In this paper, as a computationally efficient approximation of it, we propose a new bit allocation scheme with a simple subband search and compare it with the existing schemes[1][2] in terms of the computational complexity and sound quality. For the performance comparison, we used the pop music signal contained in SQAM(sound quality assess material) CD from EBU. Simulation results show that the computational complexity of the proposed method is about 42% of that of the existing one in [1] and the sound quality difference in terms of MNR between the two schemes is within the 0.2 ㏈, for the case of using the layer II at the bit rate of 128 kbps.

  • PDF