An Implementation of an ARM Platform based MP3 Sound Enhancement System

ARM 플랫폼 기반의 MP3 오디오 음질 향상 시스템 구현

  • Oh, Sang-Hun (Division of Information and Computer Science, Dankook University) ;
  • Park, Kyu-Sik (Dept. of Information and Computer Science, Dankook University)
  • 오상헌 (단국대학교 정보컴퓨터학부) ;
  • 박규식 (단국대학교 정보컴퓨터과학과)
  • Published : 2007.01.25

Abstract

In order to mitigate the problems in storage space and network bandwidth for the full CD quality audio with 44.1 kHz sampling rate, current existing digital audio is always restricted by sampling rate and bandwidth. This kind of restriction normally can be resolved by using low bit rate audio codec such as MP3, OGG, and AAC. However it suffers a major problem such as a loss of high frequency fidelity. This high frequency loss will reproduce only the band-limited low-frequency part of audio in the standard CD-quality audio. In general, the high frequency contents of audio have lots of information such as localization and ambient information, and bright nature of audio. The purpose of this paper is to implement on ARM platform system that can effectively estimate and compensate the missing high frequency contents of MP3 audio. From the experimental results with spectrum analysis and listening test, we confirm the superiority of the proposed algorithms for MP3 audio quality enhancement.

44.1kHz 샘플링 레이트의 표준 CD 음질의 오디오 신호를 인터넷 상에서 전송 및 분배하기 위해서는 네트워크 대역폭과 저장 공간의 제한 점을 고려해야 한다. 이러한 제한은 MP3, AAC, OGG 등과 같은 오디오 신호 압축 코덱을 이용하여 해결할 수 있지만, 이러한 코덱들은 공통적으로 고 주파수(High frequency) 대역의 정보가 손실 된다는 문제가 발생한다. 이러한 고주파수 손실은 결국 표준 CD음질을 가지는 오디오 신호보다 제한된 저 주파수 대역만을 재생 할 수 있게 된다. 일반적으로 오디오 신호의 고 주파수 성분은 위치정보 와 명료도, 재생 환경 등에 대한 음의 풍부한 정보를 제공한다. 본 연구에서는 MP3 오디오 코덱으로 디코드(decode) 된 오디오 신호에서 손실된 고 주파수 대역의 정보를 효과적으로 추정 및 복원하는 ARM 플랫폼 기반의 MP3 오디오 음질향상 시스템을 구축하였다. 제안된 시스템과 기존의 대표적인 알고리즘인 Liu의 HFR 과의 비교실험을 통해 제안된 알고리즘이 신호 스펙트럼상에서 고주파 신호 추정 및 복원 능력이 우수함을 볼 수 있고, 알고리즘 연산량도 약 2배 정도 절약할 수 있었다.

Keywords

References

  1. Martin Dietz, Lars Liljeryd, Kristofer Kjoorling, Oliver Kunz, 'Spectral Band Replication, a novel approach in audio coding,' at the 112th AES Convention, Munich, Germany, May 10 - May 13, 2002
  2. 'PLUS-V Specification: Public Document,' VLSI Solution, Finland, Dec 17, 2001
  3. Thomas Ziegler, Andreas Ehret, Per Ekstrand, Manfred Lutzky, 'Enhancing mp3 with SBR: Features and Capabilities of the new mp3PRO,' at the 112th AES Convention, Munich, May 10-May 13, 2002
  4. Chi-Min Liu, et. al., 'High frequency reconstruction for band-limited audio signals', Proc. of 6th Conf. on Digital Audio Effects, London, UK, Sep. 8-11, 2003
  5. R.J. McAulay and T.F. Quatieri, 'Speech analysis-synthesis based on a sinusoidal representation', IEEE Trans. ASSP-23 (4), 744-754, Aug., 1986 https://doi.org/10.1109/TASSP.1986.1164910
  6. A Papoulis, Probability, Random Variables, and Stochastic Processes, McGrawHill, 1984
  7. Andrew N. Sloss, et. AL, ARM System Developer's Guide, ELSEVIER, 2004