• 제목/요약/키워드: audio codec

검색결과 96건 처리시간 0.023초

A Performance Assessment of Real-time Multichannel Audio Codec

  • Kim, Sunghan;Jang, Daeyoung;Hong, Jinwoo
    • The Journal of the Acoustical Society of Korea
    • /
    • 제16권3E호
    • /
    • pp.56-61
    • /
    • 1997
  • In this paper, we describe a real-time implementation of a multi-channel auido codec system that is based on the MPEG-1 audio algorithm. The major feature of this system is that it has a flexible multi-DSP system that can be adapted for various applications with using up to four TMS320C40 DSPs. The purpose of this paper is to present the problems of the system and is to describe the optimized methods to solve the problems in the view of hardware and software. Our audio codec is composed of an encoder an a decoder system and the bit rate of bitstream is up to 384 kbps. Fast input/output interfaces, DSP overloads, and inter-DSP communications methods with high speed are considered in multi-DSP H/W. Also, to run real-time in S/W, optimizing methods of algorithm are considered. After implementation of system, the subjective assessment method, and 'triple stimulus/hidden reference/double blind' that recommended by ITU-R TG10/3 is adopted for the quality of our system. All test items except one are awarded difference grades(diffgrade) better than 1-. Form the results, multi-channel audio system can be used for HDTV service.

  • PDF

Low Peak Feature와 영상 Color를 이용한 유사 동영상 검색 (Similar Movie Retrieval using Low Peak Feature and Image Color)

  • 정명범;고일주
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권8호
    • /
    • pp.51-58
    • /
    • 2009
  • 본 논문에서는 오디오의 Low Peak Feature와 영상의 Color 값을 이용하여 유사한 동영상을 찾는 알고리즘을 제안한다. 동영상 검색 시 영상 데이터 전체를 이용하면 많은 시간과 저장 공간이 필요하다. 게다가 같은 영상임에도 해상도 또는 코덱이 다른 경우 전혀 다른 영상으로 인식된다. 따라서 해상도와 코덱이 달라져도 변화가 크지 않은 오디오의 파형으로부터 강인한 Peak 특징을 추출하고, 그 위치의 영상 Color 값을 비교하여 유사한 동영상을 검색하는 방법을 제안한다. 제안 방법의 성능을 확인하기 위해 2,000개의 동영상 데이터를 수집하여 실험하였으며, 그 결과 97.7%의 검색 성공률을 나타내었다.

Pyramid VQ를 이용한 AMR-WB+ 코덱 내 TCX 모듈의 성능 개선 (Improvement of the TCX Module in AMR-WB+ Codec Using Pyramid VQ)

  • 박상국;박정은;백승권;서정일;강상원
    • 한국음향학회지
    • /
    • 제26권3호
    • /
    • pp.109-114
    • /
    • 2007
  • 본 논문은 AMR-WB+ 코덱의 오디오 품질을 개선하기 위하여 TCX모듈 변환계수 양자화기에 8차 및 16차 Pyramid VQ방식을 제안하였다. 제안된 Pyramid VQ 방식은 AMR-WB+ 코덱에 적용된 $RE_8$ Lattice VQ 방식과 비교 평가되었으며, 8차 및 16차 Pyramid VQ 방식의 사용시 Mean Squared Error (MSE)는 각각 4% 및 5.7% 개선되었고, Perceptual Evaluation of Audio Quality(PEAQ) 값은 각각 3.3% 및 4.7% 개선되었다.

향상된 버퍼 제어 방법을 사용한 3D 오디오 핵심 부호화기 (A 3D Audio Core-Codec Employing an Improved Buffer Control Method)

  • 김인철
    • 방송공학회논문지
    • /
    • 제25권2호
    • /
    • pp.233-241
    • /
    • 2020
  • 본 논문에서는 3DA 핵심 부호화기의 FD 처리부의 성능 향상을 위해 새로운 버퍼 제어 기법을 제안하였다. 제안한 버퍼 제어 기법은 3GPP의 심리음향 모델과 스펙트럼 공백 회피 기법을 포함한 율-왜곡 제어부를 채택하였다. 그런 다음, 활동성이 높은 프레임에 충실한 비트 할당이 이루어질 수 있도록 3GPP 버퍼 제어 방법을 수정하였다. 본 논문에서 제안한 버퍼 제어 방법의 성능은 MUSHRA 테스트를 통해 평가되었고, 그 결과 3DA RM9 및 3GPP AAC의 버퍼 제어 방법보다 우수한 성능을 보임을 입증한다.

수정된 잡음 채움 기법을 적용한 3D 오디오 부호기 (A 3D Audio Codec Employing a Revised Noise Filling Method)

  • 김인철
    • 방송공학회논문지
    • /
    • 제26권3호
    • /
    • pp.327-330
    • /
    • 2021
  • 본 논문에서는 3D 오디오 부호기의 성능 향상을 위해 새로운 잡음 채움 기법을 제안한다. 제안한 잡음 채움 기법에서는 핵심 대역을 IGF 시작 주파수까지가 아니라 MAX_SFB로 설정되는 영역까지로 제한한다. 그리고, IGF 입력 패치의 모든 주파수 영역에 잡음 채움이 수행되도록 한다. 본 논문에서 수정된 잡음 채움 기법의 성능은 MUSHRA 테스트를 통해 평가되었고, 그 결과 기존의 방법보다 우수한 성능을 보임을 입증한다.

디지털 오디오 방송을 위한 AAC 오디오 코덱 구현 (Implementation of the AAC Audio CODEC for Digital Audio Broadcasting)

  • 장대영;홍진우
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2000년도 정기총회 및 학술대회
    • /
    • pp.43-48
    • /
    • 2000
  • 본 논문에서는 디지털 오디오 방송 시스템으로서 사용하기 위한 AAC (MPEG-2 Advanced Audio Coding) 코덱 시스템의 개발에 관하여 기술한다. 인코더 및 디코더는 ETRI가 제안한 디지털 오디오 방송 시스템에 접속하기 위해 MPEG-2 (Moving Picture Experts Group phase 2) 시스템의 TS(Transport Stream) 형식으로 입/출력한다. 내부 오디오 신호처리를 위한 DSP(Digital Signal Processor)로서는 Tl(Texas Instruments) 사의 TMS320C6701 (Floating point, 166 MHz)을 사용하였다. 인코더에서는 DSP 를 4 개까지, 디코더에서는 3 개까지 사용하여 구성할 수 있도록 설계하였다. DSP 에서는 시스템 제어, 오디오 신호 입력, 오디오 신호 처리, TS 신호 발생, 비트스트림 출력 등의 처리를 수행하며, 각 DSP 는 직렬 및 병렬 접속에 의해 서로 데이터를 전달한다. 본 시스템은 이후 다양한 디지털 방송 분야에 활용될 것이다.

  • PDF

AVB 기반의 버스안전용 멀티뷰어의 FPGA 카메라모듈 설계 (Design of FPGA Camera Module with AVB based Multi-viewer for Bus-safety)

  • 김동진;신완수;박종배;강민구
    • 인터넷정보학회논문지
    • /
    • 제17권4호
    • /
    • pp.11-17
    • /
    • 2016
  • 본 논문에서는 버스안전을 위한 다중 HD 카메라 기반의 IP통신망 AVB(Audio Video Bridge) 이더넷 케이블을 연동한 FPGA(Xilinx Zynq702)로 멀티뷰어 플랫폼을 제안하였다. 이러한 AVB(IEEE802.1BA) 시스템은 차량용 네트워크에서 다중 HD 비디오와 오디오 디지털 신호의 실시간 전송이 가능하다. 제안한 멀티뷰어 플랫폼은 기존 이더넷 케이블 1Gbps전송과 2-선 100Mbps 스트림 전송방식을 통해 4개의 초광각 HD 카메라로 부터 H.264 비디오 신호를 다중화하기 위한 지연속도의 개선을 위해 FPGA로 설계하였다. 아울러, 차량용 HD 동영상 전송망에서 시간지연을 최소화하기 위한 AVB 플랫폼은 Zynq 702기반의 H.264 AVC 저지연 코덱의 설계 방안을 제안하였다. 이러한 H.264 AVC 코덱의 부호화/복호화 결과확인을 위해 JM 모델을 참조한 PSNR(Peak Signal-to-noise-ratio)을 분석하였다. 설계한 Zynq 702기반의 H.264 AVC CODEC은 다중 HD 카메라의 다중뷰어 동영상 손실 압축에서 화질 손실에 대한 PSNR은 이론 값과 유사한 HW 결과 값을 확인하였다. 이로서 제안한 AVB기반의 다중 HD 카메라 연동형 멀티뷰어 플랫폼은 H.264 AVC CODEC의 저지연 특성이 차량용 특성에 만족함으로서 버스안전을 위한 주변의 오디오와 비디오 영상감시가 가능할 것이다.

디지털 오디오 방송을 위한 터보부호의 응용 (Application of Turbo Code for Digital Audio Broadcasting (DAB) System)

  • 김한종
    • 한국전자파학회논문지
    • /
    • 제13권2호
    • /
    • pp.176-187
    • /
    • 2002
  • 디지털 오디오 방송(DAB) 시스템을 채널부호화 방범으로 부호화된 OFDM(COFDM) 방식을 채택하고 있다. COFDM은 다중 캐리어 변조(OFDM)와 펑쳐드 콘볼루션 부호기가 결합된 기술이다. 본 논문에서는 펑쳐드 콘볼루션 부호기와 연판정 비터비 복호기를 사용하는 기존의 COFDM DAB 시스템에서 부호율이 1/4 모체부호로부터 부호화 된 4비트 중 처음 한 비트는 펑쳐링되지 않고 언제나 전송된다는 사실에 근거하여 기존 COFDM DAB 시스템에서 정의된 펑쳐링 절차를 수정함이 없이 터보 부호를 적용한 TCOFDM DAB 시스템 모델을 제안한다. COFDM DAB 시스템에 터보 부호기를 적용하기 위해 유효 자유거리가 최대인 터보 부호기 및 복호기 구조를 제안하고 단일 주파수망(SFN) 방송 시스템 구성에 유리한 DAB 전송모드 1에 대해서 기존의 COFDM DAB 시스템과 제안된 TCOFDM DAB 시스템의 성능을 주파수 선택적 라이시안 페이딩 채널 및 주파수 선택적 레일레이 페이딩 채널 환경에서 컴퓨터 시뮬레이션을 통해 성능을 비교, 분석한다.

TeakLite DSP를 이용한 적응형 다중 비트율 광대역 (AMR-WB) 음성부호화기의 실시간 구현 (Real-time Implementation of AMR-WB Speech Codec Using TeakLite DSP)

  • 정희범;김경수;한민수;변경진
    • 한국음향학회지
    • /
    • 제23권3호
    • /
    • pp.262-267
    • /
    • 2004
  • 적응형 다중 비트율 광대역 (AMR-WB) 음성부호화기는 50∼7000 Hz의 오디오 신호를 압축/복원하는 3GPP의 가장 최근의 음성 부호화 표준으로써 23.85 kbit/s에서 6.60 kbit/s까지 9가지의 다중 비트율을 가지고 있다. 본 논문에서는 16비트 고정 소수점형 TeakLite DSP를 이용하여 AMR WB 음성부호화기를 실시간 구현한 결과에 대해 기술하였다. 구현된 AMR-WB 보코더는 가장 높은 비트율인 23.85 kbit/s모드에서 52.2 MIPS의 복잡도를 가지고 있으며, 사용된 프로그램 메모리는 약 17.9 kwords 이고, 데이터 RAM 메모리는 11.8 kwords, 데이터 ROM 메모리는 약 10.1 kwords 이다. 구현된 AMR-WB 프로그램은 3GPP의 표준시험 벡터 23개를 9개 모드에 대해 비트 단위로 일치시켜 검증을 완료하고, 실시간 보드 시험에서도 오디오 신호의 입출력이 왜곡되지 않고 실시간 지연없이 안정적으로 동작하는 것을 확인하였다.