• 제목/요약/키워드: audio signal processing

검색결과 157건 처리시간 0.033초

MPEG-H 3D 오디오 표준 복호화기 구조 및 연산량 분석 (MPEG-H 3D Audio Decoder Structure and Complexity Analysis)

  • 문현기;박영철;이용주;황영수
    • 한국통신학회논문지
    • /
    • 제42권2호
    • /
    • pp.432-443
    • /
    • 2017
  • MPEG-H 3D 오디오 표준은 UHDTV 등의 초고해상도 방송서비스에 대응하는 실감음향 서비스의 제공을 목표로 한다. 이를 위해 본 표준은 다채널 신호, 객체 신호, 장면 기반 신호의 부호화/복호화 기술과 다양한 재생 환경에서 3차원 오디오 제공을 위한 렌더링 기술, 후처리 기술 등 방대한 기술을 통합하였다. 본 표준의 참조 소프트웨어 복호화기는 여러 모듈들이 결합된 구조로 다양한 모드에서 동작이 가능하며, 각 모듈들이 독립된 실행파일로 순차적으로 실행되어 실시간 처리가 불가능하다. 본 논문에서는 MPEG-H 3D 오디오의 코어 복호화기, 포맷 변환기, 객체 렌더러, 바이노럴 렌더러의 각 함수를 동적 라이브러리화 및 통합하여 프레임 기반 복호화가 가능하도록 하였다. 또한 MPEG-H 3D 오디오의 각 모드별 연산량을 측정하여 다양한 하드웨어 플랫폼에서 적합한 모드를 선택하기 위한 참고 자료를 제공한다. 연산량 분석 결과, 한국 방송 표준에 포함된 저연산량 프로파일은 채널 신호로 렌더링을 할 경우 QMF 합성 연산의 2.8배에서 12.4배의 연산량을 가지며, 바이노럴 렌더링을 할 경우 QMF 합성 연산의 4.1배에서 15.3배의 연산량을 가진다.

변형된 창함수를 사용한 FIR 디지털 필터에 관한 연구 (A Study on the FIR Digital Filter using Modified Window Function)

  • 강경덕;배상범;김남호;류지구
    • 융합신호처리학회논문지
    • /
    • 제4권1호
    • /
    • pp.49-55
    • /
    • 2003
  • 현대산업사회의 발전에 따라 신호처리 분야 중 디지털필터의 사용은 급격히 증가하고 있으며, 특히 디지털 영상처리, 디지털 음성처리, CATV 및 각종 통신 분야 등에서 카메라의 Detail processor, Y/C separator, Ghost제거 필터, 표준변환기(NTSC-PAL), Noise reducer 등으로 많이 사용되고 있다. 이러한 디지털필터에는 일반적으로 IIR(infinite impulse response)과 FIR(finite impulse response) 필터가 있으며, 본 논문에서는 구현이 용이하고 선형위상특성을 갖는 FIR 디지털필터를 설계하였다. FIR 디지털필터 설계에 있어서 통과대역의 차단주파수 부근에서 깁스(gibbs) 현상에 의해 생긴 리플을 완화하기 위해 window함수를 사용한다. 그러나, 기존의 window는 고정된 값으로 되어 있으므로 설계목적에 적합한 window함수를 선택함에 있어 다소 문제점이 있다. 따라서, 본 논문에서는 설계목적에 따라 서 융통성있게 선택이 가능한 파라메터를 부가한 변형된 Hanning window를 설계하였으며, 타당성을 입증하기 위해 디지털필터를 설계하여 기존의 Hamming, Hanning, Blackman, Kaiser window와 비교하였으며, 판단기준으로 peak side-lobe와 천이특성 등을 사용하였다.

  • PDF

시각과 청각에 의한 공간적 지각에 관한 연구 (A Study of the spatial perception by audio-visual information)

  • 이채봉;강대기
    • 융합신호처리학회논문지
    • /
    • 제11권2호
    • /
    • pp.132-136
    • /
    • 2010
  • 본 연구에서는 시청각 자극의 공간적 차이가 지각 공간에 있어서 사물과 영상의 배치에 주는 영향을 조사하기 위해 심리적 실험을 하였다. 실험에서는 시각자극과 청각자극을 동시에 제시하고 두 개의 자극이 공간적으로 어느 정도 차이를 느끼는가를 판단하였다. 시각자극은 정면에 있는 스피커를 중심으로 $-70^{\circ}$, $-40^{\circ}$, $-20^{\circ}$, $0^{\circ}$, $20^{\circ}$, $40^{\circ}$, $70^{\circ}$의 7방향, 청각자극은 시각자극을 중심으로 하여 $-20^{\circ}{\sim}20^{\circ}$까지 $5^{\circ}$ 간격으로 9방향을 제시하였다. 실험 참가자는 시각자극과 청각자극이 어느 정도 차이가 있다라고 느낀 것을 1에서 5까지 5단계 평가 척도를 이용하여 회답하였다. 그 결과 시각자극의 제시 각도가 $0^{\circ}$의 경우는 청각자극의 제시 각도가 시각자극의 제시 각도에서 멀어짐에 따라 점차적으로 크게 나타났으며 제시 각도를 중심으로 좌우 대칭으로 나타났다. 정면에서 우측에 시각자극이 제시된 경우는 청각자극의 제시 각도가 시각자극의 제시 각도에서 멀어짐에 따라 평가치가 크게 되었다. 이것은 시각자극의 제시 각도가 $0^{\circ}$의 경우와 같은 경향을 나타내었다. 반대로 좌측에 시각자극이 제시된 경우는 평가치가 작게 나타났다. 이것은 제시 각도가 멀어짐에도 불구하고 같은 방향에서 제시되고 있다는 것을 알 수 있으며 거리를 짧게 인식하는 경향이 나타났다.

오디오 바이너리 파일을 컬러 QR코드로 표현하는 방법과 그 응용 (A Method to Express Audio Binary Files by Color QR Codes and Its Application)

  • 이충호
    • 융합신호처리학회논문지
    • /
    • 제19권2호
    • /
    • pp.47-53
    • /
    • 2018
  • 본 논문은 MP3 오디오 바이너리 파일을 일련의 컬러 QR 코드로 생성하여 종이에 인쇄할 수 있는 방법을 제안한다. 또한 이 방법이 상당한 압축효과를 가져올 수 있음을 기술한다. 이 방법은 먼저, 한 개의 MP3 파일을 QR코드가 바이너리로 표현할 수 있는 최대용량으로 나눈다. 그런 다음 각각의 분할된 파일들을 흑백 QR코드들로 변환한다. 최종적으로, 분할된 파일을 3개씩 중첩하여 1개의 컬러 QR코드를 만든다. 중첩 시에 3개의 흑백 QR 코드는 각각 적색, 녹색, 청색으로 간주된다. 이 방법에서 한 개의 컬러 QR코드는 2개의 흑백 QR코드 영역이 겹쳐지는 부분은 시안(Cyan), 마젠타(Magenta), 노란색(Yellow)로 표현되며, 3개의 흑백 QR코드가 겹쳐지는 부분은 흑색, 전혀 겹쳐지지 않는 부분은 백색으로 표현한다. 실험결과 약8.5Mb의 MP3파일은 A4용지 9페이지에 인쇄될 수 있다. 부수적인 효과로서 인쇄하지 않은 컬러 QR코드의 크기는 원래의 MP3파일보다 약 15.7배의 압축효과를 가질 수 있음을 보였다. 제안된 방법은 인터넷 액세스가 불가능한 환경에서 사용될 수 있는 장점이 있다.

디지탈 오디오 시스템에서의 오류정정 알고리듬에 관한 연구 (A Study on the Error Correction Algorithm for Digital Audio Systems)

  • 전경일;김남욱;김용득
    • 대한전자공학회논문지
    • /
    • 제26권7호
    • /
    • pp.90-97
    • /
    • 1989
  • 본 논문에서는 최소거리 5를 갖는 C1(32, 28) 및 최소거리 7를 갖는 C2(32, 26) 의 RS부호를 사용하여 2중부호를 구성하고 본부호의 오류정정 알고리듬을 R-DAT를 모델로하여 컴퓨터 시뮬레이션 및 오류정정 능력의 평가를 행한 결과 심볼당 오류률이 0.05 정도로 감소되었다. 복호알고리듬을 주파수 영역에서 실현하는 과정에 제안된 방법이 최근 개발되고 있는 디지탈 신호처리 기술에 적용할 수 있음을 입증하였다.

  • PDF

미소지진(微小地震) 장기관측(長期觀測)을 위한 지진기록계(地震記錄計)의 개발(開發) (Development of Seismic Recorder for Long-term Observation of Microearthquakes)

  • 김성균;조규장;정부흥;문창배;신인철;성낙훈
    • 자원환경지질
    • /
    • 제21권2호
    • /
    • pp.185-191
    • /
    • 1988
  • A two channel seismic recorder suitable for long-term observation of microearthquakes is developed. The direct analogue recording on cassette tape is adopted in the recorder whose circuits of amplifier and mortor units of an audio cassette recorder are modified. The recorder provides contineous record of 10 days with DC 12V battery (100AH) and with standard cassette tape of 60 minute use. The binary coded time signals of date, hour, and minute are generated once a minute by the timing system and absolute time input using radio to measure the time drift is also possible. For the seismic signal processing, the analogue signals from audio cassette player pass A/D converter and digitized data are stored in personal computer. Then visual records can be obtained using computer graphic mode. Basic programs "ADCONVO" and "DRAWO" to accomplish A/D conversions, the creation of data files and visualization of signals were written. Some sample signals reproduced from the recorded tape are presented.

  • PDF

TMS320C64x 기반 MPEG-1 LayerII Decoder의 DSP 구현 (Implementation of the MPEG-1 Layer II Decoder Using the TMS320C64x DSP Processor)

  • 조충상;이영한;오유리;김홍국
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2006년도 하계종합학술대회
    • /
    • pp.257-258
    • /
    • 2006
  • In this paper, we address several issues in the real time implementation of MPEG-1 Layer II decoder on a fixed-point digital signal processor (DSP), especially TMS320C6416. There is a trade-off between processing speed and the size of program/data memory for the optimal implementation. In a view of the speed optimization, we first convert the floating point operations into fixed point ones with little degradation in audio quality, and then the look-up tables used for the inverse quantization of the audio codec are forced to be located into the internal memory of the DSP. And then, window functions and filter coefficients in the decoder are precalculated and stored as constant, which makes the decoder faster even larger memory size is required. It is shown from the real-time experiments that the fixed-point implementation enables us to make the decoder with a sampling rate of 48 kHz operate with 3 times faster than real-time on TMS320C6416 at a clock rate of 600 MHz.

  • PDF

스프레드 스펙트럼 워터마킹 기법의 연구 (A Study on the Spread Spectrum Watermarking Method)

  • 강환일;김갑일;한승수
    • 한국지능시스템학회논문지
    • /
    • 제11권8호
    • /
    • pp.731-735
    • /
    • 2001
  • 본 논문은 새로운 워터마킹기법을 제안하고 이 기법은 실시간 처리에 이용될 수 있다. 웨이브릿변환 대신에 계산량을 줄이기 위해 정수 웨이브릿변환을 이용한다. 본 논문에서 정수 웨이브릿 공간에서 카이자승분포와 관련한 워터마크를 삽입한다. 워터마크를 추출할 때 확산스펙트럼 기법을 이용하고 유사도는 공분산 수열에서 결정하낟. 실험을 통하여 카이 자승분포를 이용한 워터마크를 이용하는 것이 소음에 강인함을 보인다. 이 워터마킹 기법은 동시에 은닉된 정보에 제어되고 오디오 신호에 따라 움직일 수 있는 전기 기기의 제작에 쓰일 수 있다.

  • PDF

청각을 이용한 시각 재현장치의 분석프로그램 개발 (Development of Processing Program for Audio-vision System Based on Auditory Input)

  • 허세진;방성식;서지혜;최현우;김태호;이나희;이유진;박지원;이희중;원철호;이종민
    • 한국멀티미디어학회논문지
    • /
    • 제13권1호
    • /
    • pp.58-65
    • /
    • 2010
  • 본 연구의 궁극적 목적은 시각 장애인들의 안전보행을 위한 단순한 충돌 경보 장치가 아니라 전방의 3차원적 공간 정보를 청각 정보로 변환하여 시각을 재현할 수 있도록 하는 장치 (Audio-vision System)를 개발하기 위함이다. 이를 위하여 본 연구에서는 구동 소프트웨어를 개발하였고 그 유용성을 검증하였다. 30명의 정상지원자를 대상으로 하였으며 평균나이는 25.8세이었다. 다양한 가상의 공간을 분석프로그램에 입력하고 맹검상태에서 피험자가 공간 내 구조물을 그리게 하였다. 먼저 피험자에게 30분간 10개의 대상을 이용한 학습을 실시한 후 별도의 10개의 가상공간에 대한 시험을 채점하고 100점 만점으로 환산하였다. 실험결과 점수는 77점에서 97점이었으며 평균 88.7점이었다. 본 연구에서 자체 제작된 분석프로그램으로 청각정보를 시각정보로 변환하는 기반 기술을 확보하였으며 거리 센서를 확보한다면 제품화 가능성이 있음을 검증하였다.

디지털 방송용 오디오 디코더의 DSP 최적화 구현 (Optimized DSP Implementation of Audio Decoders for Digital Multimedia Broadcasting)

  • 박남인;조충상;김홍국
    • 방송공학회논문지
    • /
    • 제13권4호
    • /
    • pp.452-462
    • /
    • 2008
  • 본 논문에서는 디지털 라디오와 지상파 Digital Multimedia Broadcasting (DMB)에서 사용되는 MUSICAM 이라 불리는 MPEG-1/2 Layer-II 와 MPEG-4 ER-BSAC 디코더를 330 MHz 클럭수를 가지고 동작하는 고정 소수점 digital signal processor (DSP) TMS320C64x+ 상에 실시간 구현한다. 오디오 디코더의 실시간 구현하기 위해, 다음과 같은 여러 단계의 최적화를 수행한다. 첫 째, 메모리 공유, 데이터 타입 재설정 및 루프의 unrolling 과정을 통해, C 코드 레벨에서 최적화를 수행한다. 다음으로, 비트스트림 분석의 재구성, 합성 필터의 변경 및 합성 필터의 윈도우 계수의 재배열을 통해 알고리즘 레벨에서 최적화를 수행한다. 또한, MPEG-1/2 Layer-II 디코더의 합성필터 모듈을 linear assembly program 레벨로 치환한다. Linear assembly program 레벨로 치환하는 이유는 MPEG-1/2 Layer-II 디코더에서 합성 필터 모듈이 가장 많은 계산량을 차지하기 때문이다. 구현된 오디오 디코더의 성능 평가를 위해, 복호화 처리시간의 비율을 측정하고, 최적화된 MPEG 디코더와 레퍼런스 MPEG 디코더로 처리된 오디오 신호 사이의 root mean square (RMS)를 계산한다. 최적화 실시간 구현 결과, MPEG-1/2 Layer-II 와 MPEG-4 ER-BSAC 디코더는 TMS320C64x+가 동작하는 최대 클럭 수의 3%와 11%의 사용으로 각각 동작하며, 오디오 디코더의 품질은 MPEG standard에 정의된 -77.01 dB의 조건을 모두 만족함을 확인할 수 있었다.