• 제목/요약/키워드: MPEG Audio

검색결과 323건 처리시간 0.023초

MPEG 오디오 최신 표준: USAC 기술 (MPEG Audio New Standard: USAC Technology)

  • 이태진;강경옥;김환우
    • 방송공학회논문지
    • /
    • 제16권5호
    • /
    • pp.693-704
    • /
    • 2011
  • 다양한 기능을 가지는 모바일 기기들이 하나로 융합되어 가는 방향으로 기술이 발전함에 따라, 음성 및 오디오 모두에 대해 우수한 음질을 제공하는 부호화 기술에 대한 요구사항이 증대되고 있다. 이와 같은 새로운 부호화 기술에 대한 요구사항에 따라, MPEG에서는 2007년 10월 82차 회의에서 CfP를 시작으로 USAC 표준화를 시작하였고, 2011년 7월 97차 회의에서 FDIS까지 승인하였다. MPEG-D USAC 기술은 최신 음성 부호화기인 AMR-WB+와 최신 오디오 부호화기인 HE-AAC V2를 융합한 기술로 입력 신호의 특성에 따라 코어 대역 부호화로 AAC, ACELP, TCX 등 다양한 방법 중 하나를 선택하여 부호화를 수행하고, 고대역 부호화 기술로는 SBR, 스테레오 부호화 기술로는 MPEG-Surround를 이용하며, 다양한 코어 코더 사이의 천이를 위한 윈도우 기술을 이용한다. USAC 기술은 음성과 음악 신호 모두에 대해 우수한 음질을 제공할 수 있으며, 모바일 기기로의 멀티미디어 콘텐츠 다운로드, 디지털 라디오, 모바일 TV 및 오디오 북 등에서 응용이 가능하다.

MPEG-D USAC: 통합 음성 오디오 부호화 기술 (MPEG-D USAC: Unified Speech and Audio Coding Technology)

  • 이태진;강경옥;김환우
    • 한국음향학회지
    • /
    • 제28권7호
    • /
    • pp.589-598
    • /
    • 2009
  • 다양한 기능을 가지는 모바일 기기들이 하나로 융합되어 가는 방향으로 기술이 발전함에 따라, 음성 및 오디오 모두에 대해 우수한 음질을 제공하는 부호화 기술에 대한 요구사항이 증대되고 있다. 이와 같은 새로운 부호화 기술에 대한 요구사항에 따라, MPEG에서는 2007년 10월 82차 회의에서 CfP를 시작으로 USAC 표준화를 시작하였고, 2009년 4월 88차 회의에서 WD3까지 완성되었다. MPEG-D USAC 기술은 최신 음성 부호화기인 AMR-WB+와 최신 오디오 부호화기인 HE-AAC V2를 융합한 기술로 입력 신호의 특성에 따라 코어 대역 부호화로 AAC, ACELP, TCX 등 다양한 방법 중 하나를 선택하여 부호화를 수행하고, 고대역 부호화 기술로는 SBR, 스테레오 부호화 기술로는 MPEG-Surround를 이용한다. USAC 기술은 음성과 음악 신호 모두에 대해 모두 우수한 음질을 제공할 수 있으며, 모바일 기기로의 멀티미디어 콘텐츠 다운로드, 디지털 라디오, 모바일 TV 및 오디오 북등에서 응용이 가능하다.

다채널 오디오 코딩을 위한 MPEG Surround-2부: 다양한 모드 및 툴들 (MPEG Surround for Multi-Channel Audio Coding-Part 2: Various Modes and Tools)

  • 방희석
    • 한국음향학회지
    • /
    • 제28권7호
    • /
    • pp.610-617
    • /
    • 2009
  • 본 논문에서는 MPEG Surround의 다양한 모드들과 툴들에 대해서 소개한다. MPEG Surround바이노럴 모드의 경우 HRTFs (Head-Related transfer Functions)를 이용하여 가상의 5.1 채널을 지원하기 때문에 휴대용 오디오 기기에서 헤드폰이나 이어폰을 이용하여 재생할 수 있다. 또한, MPEG Surround는 부가 정보 없이 스테레오 채널을 5.1 채널을 지원하는 Enhanced Matrix 모드, 기존의 3D 코딩 신호에 적용할 수 있는 3D 스테레오 모드, 복호화 과정에서 연산량을 크게 줄일 수 있는 저전력 (Low Power)버전 등을 지원한다. 이 외에도, MPEG Surround는 아티스틱 다운믹스 신호에 대해 적용하는 Arbitrary Downmix Gain (ADG)툴, 기존의 행렬 근거 방법들에 의한 다운믹스 신호에 적용되는 행렬 호환성 (Matrix Compatibility)툴, 고비트율을 사용할 수 있을 때 적용되는 잔차 신호 코딩 (Residual Coding)툴, 박수 소리 등 특정 신호에 대해 사용될 수 있는 GES (Guided Envelope Shaping)툴 등을 지원한다. 중요한 모드 및 툴들에 대해 여러 기관에 의해 수행된 청취 평가의 결과도 함께 보이고 있다.

70MIPS 이내에서 동작하는 MPEG-2 AAC 부호화 칩 설계 (An MPEG-2 AAC Encoder Chip Design Operating under 70MIPS)

  • 강희철;박주성;정갑주;박종인;최병갑;김태훈;김승우
    • 대한전자공학회논문지SD
    • /
    • 제42권4호
    • /
    • pp.61-68
    • /
    • 2005
  • MPEG-2 오디오 압축방식인 AAC(Advanced Audio Coding) LC(Low Complexity) 스테레오 부호화기를 고속으로 구현할 수 있는 칩을 32비트 DSP 코어를 기반으로 설계하고 0.25um CMOS 기술을 이용하여 제작하였다. 계산량과 메모리 용량을 줄이기 위하여 알고리즘 구현방법 측면에서 최적화를 하였으며, FFT(Fast Fourier Transform)를 하드웨어로 구현하여 고속화하였다. 제작된 칩의 크기는 $7.20\times7.20 mm^2$ 이었으며 등가 게이트는 약 830,000 이었으며 70MIPS 이내에서 AAC 부호화를 할 수 있음을 확인하였다.

MPEG-2 AAC 포맷 기반의 오디오 스트리밍 시스템 설계 및 구현 (Design and Implementation of an MPEG-2 AAC Format-based Audio Streaming System)

  • 이승재;이승룡
    • 한국통신학회논문지
    • /
    • 제27권12C호
    • /
    • pp.1251-1264
    • /
    • 2002
  • 현재 주문형 오디오 서비스나 생방송 서비스를 하는 오디오 스트리밍 제품은 제한된 숫자의 클라이언트만을 지원한다는 제약점과, 네트워크 자원의 비효율적인 사용으로 서비스 안정성의 미비와 질적 저하라는 단점을 가지고 있다. 또한, 사용자의 편의성을 위한 동적 서비스 제공에 대한 고려가 미비하여 사용에 불편을 겪는다. 본 논문에서는 이러한 제약점을 해결하기 위한 하나의 방안으로 네트워크 자원을 효율적으로 사용할 수 있는 MPEG-2 AAC 오디오 파일 포맷을 사용하고, 스트리밍 서비스의 안정성과 질적 향상을 위하여 QoS를 지원하는 오디오 스트리밍 전송과 제어에 대한 설계와 구현에 대해 소개한다. 제안된 시스템은 서버와 사용자간의 인터페이스가 고정적인 웹 페이지 하나 만에 의존하고 있어서 정보의 제공에 있어 정적일 수밖에 없는 현재의 정적인 스트리밍 서비스들과는 달리 동적인 서비스를 제공함으로서 사용자와 서버관리에 편의성을 지원하는 새로운 정보관리 기법을 채택하고 있다. 구현 결과 제안된 시스템은 기존의 MP3 파일 포맷을 사용한 스트리밍 시스템 보다 성능이 개선되었고, 서비스의 안정성뿐만 아니라 서버 관리가 용이하다는 장점도 보여주고 있다.

TMS320C541 DSP를 이용한 MP3 디코더 구현 (Implementation of MP3 decoder with TMS320C541 DSP)

  • 윤병우
    • 융합신호처리학회논문지
    • /
    • 제4권3호
    • /
    • pp.7-14
    • /
    • 2003
  • MPEG-1 오디오 표준은 고음질 디지털 오디오 신호의 압축 알고리즘이다. 이 표준은 인코더와 디코더의 기능을 규정하고 있고, 인코더와 디코더 알고리즘의 복잡도와 성능에 따라 세 가지 다른 계층으로 분류된다. 본 논문에서는 MPEG-1 오디오 계층3(MP3) 디코더를 고정소수점 DSP인 TMS320C541 칩으로 구현하였다 MP3 알고리즘은 인간의 청각구조의 심리음향 특성을 이용하는 알고리즘으로 인간의 귀에 들리지 않는 주파수의 성분은 미리 제거함으로써 데이터의 량을 줄이면서 음질의 손실을 최대한 줄이는 알고리즘이다. 이 알고리즘은 다이나믹 레인지가 매우 크기 때문에 고정 소수점으로 구현하기가 쉽지 않다. 본 연구에서는 가중 참조표를 적용하여 계산량을 줄이고 다이나믹 레인지 문제를 해결함으로써 고정 소수점 DSP칩을 이용하여 실시간 시스템을 구현하였다.

  • PDF

MPEG-2 비디오 알고리즘을 이용한 비디오 데이터 압축 (Video Data Compression using the MPEG-2 Video Algorithm)

  • 남재열;이영선;이현주;김재곤;이상미;안치득
    • 한국통신학회논문지
    • /
    • 제18권8호
    • /
    • pp.1069-1082
    • /
    • 1993
  • ISO(International Organization for Standardization)는 디지탈 저장메체용의 비디오 및 관련 오디오 표준 개발을 시작 했는데, 그러한 표준화 노력은 MPEG(Moving Picture Experts Group)이라 명명되었으며 현재 ISO-IEC/JTC1/SC29/WG11이 공식 명칭이다. 현재 MPEG은 비디오 및 관련 오디오를 19Mbps급으로 압축할 수 있는 알고리즘들을 연구하고 있다. 본 논문에서는 MPEG-2 비디오 Test Model 2(TM2)를 이용한 비디오 압축 시뮬레이터 구현에 관하여 논하였고, MPEG 비디오 테스트 시퀸스를 이용한 시뮬레이션 결과를 통해 성능을 분석하였다. 또한 구현된 시뮬레이터를 HDTV 시퀸스 압축에도 적용하였다. 그리고 그 결과를 도표에 나타내었으며, 구현된 비디오 압축 시뮬레이터의 부호화 효율을 개선시킬 수 있는 방법들을 제안하였다.

  • PDF

MPEG 심리음향모델의 고속 구현을 위한 효율적 FFT 연산 (An Efficient Computation of FFT for MPEG/Audio Psycho-Acoustic Model)

  • 송건호;이근섭;박영철;윤대희
    • 대한전자공학회논문지SP
    • /
    • 제41권6호
    • /
    • pp.261-269
    • /
    • 2004
  • 본 논문은 MPEG 오디오 부호화 과정 중 심리음향모델(PAM: Psychoacoustic Model)에 사용되는 FFT를 효율적으로 계산할 수 있는 방법을 제안한다. MPEG 오디오 부호화 과정 중 심리음향 모델 연산은 많은 연산량을 차지하며, 부호화의 실시간 및 저 전력 구현을 위해서는 이의 최적화가 요구된다. 최적화를 위하여 제안하는 알고리듬은 심리음향모델에서 사용하는 입력신호에 대한 1024-샘플 FFT 대신에 서브밴드과정에서 나온 각각의 32개의 밴드에 대하여 32-샘플 FFT를 함으로써 1024-샘플 FFT의 효과를 얻는데 있다. 이때 서브밴드과정을 거친 신호에 대한 FFT에는 에일리어징이 발생하며 이를 줄이기 위하여 버터플라이 구조의 에일리어징 제거블록을 제안한다. 제안한 알고리듬으로 심리음향모델을 구현할 경우 SMR이 약 1dB이내의 오차를 가지며, 기존 알고리듬에 비해 절반의 연산량으로 심리음향 모델을 위한 FFT 스펙트럼을 얻을 수 있다.

MPEG-7 오디오 하위 서술자를 이용한 음악 검색 방법에 관한 연구 (A Study on the Music Retrieval System using MPEG-7 Audio Low-Level Descriptors)

  • 박만수;박철의;김회린;강경옥
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2003년도 정기총회 및 학술대회
    • /
    • pp.215-218
    • /
    • 2003
  • 본 논문에서는 MPEG-7에 정의된 오디오 서술자를 이용한 오디오 특징을 기반으로 한 음악 검색 알고리즘을 제안한다. 특히 timbral 특징들은 음색 구분을 용이하게 할 수 있어 음악 검색뿐만 아니라 음악 장르 분류 또는 Query by humming에 이용 될 수 있다. 이러한 연구를 통하여 오디오 신호의 대표적인 특성을 표현 할 수 있는 특징벡터를 구성 할 수 있다면 추후에 멀티모달 시스템을 이용한 검색 알고리즘에도 오디오 특징으로 이용 될 수 있을 것이다 본 논문에서는 방송 시스템에 적용 할 수 있도록 검색 범위를 특정 컨텐츠의 O.S.T 앨범으로 제한하였다. 즉, 사용자가 임의로 선택한 부분적인 오디오 클립만을 이용하여 그 컨텐츠 전체의 O.S.T 앨범 내에서 음악을 검색할 수 있도록 하였다. 오디오 특징벡터를 구성하기 위한 MPEG-7 오디오 서술자의 조합 방법을 제안하고 distance 또는 ratio 계산 방식을 통해 성능 향상을 추구하였다. 또한 reference 음악의 템플릿 구성 방식의 변화를 통해 성능 향상을 추구하였다. Classifier로 k-NN 방식을 사용하여 성능 평가를 수행한 결과 timbral spectral feature들의 비율을 이용한 IFCR(Intra-Feature Component Ratio) 방식이 Euclidean distance 방식보다 우수한 성능을 보였다.

  • PDF

켑스트럼 영역에서의 오디오 워터마킹 방법 (Digital Audio Watermarking in The Cepstrum Domain)

  • 이상광;호요성
    • 방송공학회논문지
    • /
    • 제6권1호
    • /
    • pp.13-20
    • /
    • 2001
  • 본 논문에서는 켑스트럼 영역에서의 오디오 워터마킹 방법을 제안한다. 광대역 채널에 협대역 신호를 숨기는 대역확산(spread spectrum) 통신과 유사한 방법을 이용하여 워터마크 신호를 오디오 신호의 켑스트럼 성분에 삽입한다. 의사잡음 시퀸스 (pseudo-random sequence)를 이용하여 오디오 신호에 삽입할 워터마크 신호를 발생시킨다 켑스트럼 계수들의 분포와 인간 청각 시스템(Human Auditory System, HAS)의 주파수 마스킹 특성을 고려하여 결정한 가중치를 곱해서 얻은 워터마크 신호는 사람 의 귀로 감지할 수 없을 정도의 크기를 갖는다. 본 논문의 실험 결과에서 보인 것처럼. 오디오 신호의 사용 권한이 없는 사용자들 은 삽입된 워터마크 신호를 검출하기가 통계적으로 거의 불가능하며, 다중 워터마크, MPEG 오디오 부호화. 부가잡음과 같은 다양한 공격에도 소유자에 의해서는 워터마크 신호의 검출이 가능하다.

  • PDF