• 제목/요약/키워드: Binaural Synthesis

검색결과 6건 처리시간 0.023초

Listener Auditory Perception Enhancement using Virtual Sound Source Design for 3D Auditory System

  • Kang, Cheol Yong;Mariappan, Vinayagam;Cho, Juphil;Lee, Seon Hee
    • International journal of advanced smart convergence
    • /
    • 제5권4호
    • /
    • pp.15-20
    • /
    • 2016
  • When a virtual sound source for 3D auditory system is reproduced by a linear loudspeaker array, listeners can perceive not only the direction of the source, but also its distance. Control over perceived distance has often been implemented via the adjustment of various acoustic parameters, such as loudness, spectrum change, and the direct-to-reverberant energy ratio; however, there is a neglected yet powerful cue to the distance of a nearby virtual sound source that can be manipulated for sources that are positioned away from the listener's median plane. This paper address the problem of generating binaural signals for moving sources in closed or in open environments. The proposed perceptual enhancement algorithm composed of three main parts is developed: propagation, reverberation and the effect of the head, torso and pinna. For propagation the effect of attenuation due to distance and molecular air-absorption is considered. Related to the interaction of sounds with the environment, especially in closed environments is reverberation. The effects of the head, torso and pinna on signals that arrive at the listener are also objectives of the consideration. The set of HRTF that have been used to simulate the virtual sound source environment for 3D auditory system. Special attention has been given to the modelling and interpolation of HRTFs for the generation of new transfer functions and definition of trajectories, definition of closed environment, etc. also be considered for their inclusion in the program to achieve realistic binaural renderings. The evaluation is implemented in MATLAB.

MPEG-H 3D 오디오 표준 복호화기 구조 및 연산량 분석 (MPEG-H 3D Audio Decoder Structure and Complexity Analysis)

  • 문현기;박영철;이용주;황영수
    • 한국통신학회논문지
    • /
    • 제42권2호
    • /
    • pp.432-443
    • /
    • 2017
  • MPEG-H 3D 오디오 표준은 UHDTV 등의 초고해상도 방송서비스에 대응하는 실감음향 서비스의 제공을 목표로 한다. 이를 위해 본 표준은 다채널 신호, 객체 신호, 장면 기반 신호의 부호화/복호화 기술과 다양한 재생 환경에서 3차원 오디오 제공을 위한 렌더링 기술, 후처리 기술 등 방대한 기술을 통합하였다. 본 표준의 참조 소프트웨어 복호화기는 여러 모듈들이 결합된 구조로 다양한 모드에서 동작이 가능하며, 각 모듈들이 독립된 실행파일로 순차적으로 실행되어 실시간 처리가 불가능하다. 본 논문에서는 MPEG-H 3D 오디오의 코어 복호화기, 포맷 변환기, 객체 렌더러, 바이노럴 렌더러의 각 함수를 동적 라이브러리화 및 통합하여 프레임 기반 복호화가 가능하도록 하였다. 또한 MPEG-H 3D 오디오의 각 모드별 연산량을 측정하여 다양한 하드웨어 플랫폼에서 적합한 모드를 선택하기 위한 참고 자료를 제공한다. 연산량 분석 결과, 한국 방송 표준에 포함된 저연산량 프로파일은 채널 신호로 렌더링을 할 경우 QMF 합성 연산의 2.8배에서 12.4배의 연산량을 가지며, 바이노럴 렌더링을 할 경우 QMF 합성 연산의 4.1배에서 15.3배의 연산량을 가진다.

바이노럴 합성을 위한 3채널 HRTF 측정 (3-channel HRTF measurement for binaural synthesis.)

  • 이신렬;김래훈;방희석;성굉모
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 학술발표대회 논문집 제19권 2호
    • /
    • pp.337-340
    • /
    • 2000
  • 입체음향 생성을 위한 기존의 방법은 크게 바이노럴 녹음기법과 머리전달함수(HRTF)를 이용한 바이노럴 합성 기법으로 나눌 수 있다. 기존 2채널 더미헤드를 이용한 바이노럴 녹음기법과 바이노럴 합성기법은 표준 더미헤드를 사용함으로써 청취자 머리와의 오차로 정면 음상 정위의 어려움, "Front-back confusion", 이동 음 음상 정위 어려움 등의 문제로 실제 녹음 현장에서는 거의 사용되지 않고 있다. 본 논문에서 제안한 3채널 더미헤드 기법은 이러한 문제점을 극복할 수 있고, 특히, HRTF 합성 시 기존의 HRTF의 문제점을 극복할 수 있는 새로운 HRTF를 구축할 수 있다. 따라서 바이노럴 합성 기법이 필요한 오락, 시뮬레이터, 음장 가청화 기술(Auralization) 프로그램 등 다양한 분야에서의 적용이 가능하다.

  • PDF

비선형 특징추출 기법에 의한 머리전달함수(HRTF)의 저차원 모델링 및 합성 (Low Dimensional Modeling and Synthesis of Head-Related Transfer Function (HRTF) Using Nonlinear Feature Extraction Methods)

  • 서상원;김기홍;김현석;김현빈;이의택
    • 한국정보처리학회논문지
    • /
    • 제7권5호
    • /
    • pp.1361-1369
    • /
    • 2000
  • For the implementation of 3D Sound Localization system, the binaural filtering by HRTFs is generally employed. But the HRTF filter is of high order and its coefficients for all directions have to be stored, which imposes a rather large memory requirement. To cope with this, research works have centered on obtaining low dimensional HRTF representations without significant loss of information and synthesizing the original HRTF efficiently, by means of feature extraction methods for multivariate dat including PCA. In these researches, conventional linear PCA was applied to the frequency domain HRTF data and using relatively small number of principal components the original HRTFs could be synthesized in approximation. In this paper we applied neural network based nonlinear PCA model (NLPCA) and the nonlinear PLS repression model (NLPLS) for this low dimensional HRTF modeling and analyze the results in comparison with the PCA. The NLPCA that performs projection of data onto the nonlinear surfaces showed the capability of more efficient HRTF feature extraction than linear PCA and the NLPLS regression model that incorporates the direction information in feature extraction yielded more stable results in synthesizing general HRTFs not included in the model training.

  • PDF

방향성을 가진 회전체 소음의 청각계 인지 특성에 관한 연구 (A Study on Auditory Perception Characteristics of Directional Tonal Noise)

  • 서강원;김의열;김성기
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 2012년도 춘계학술대회 논문집
    • /
    • pp.348-353
    • /
    • 2012
  • This paper presents the HRTF based experimental approach to figure out why the human auditory perception on the interior noise source including the directional tonal components does not well match with the dominant features extracted from recorded acoustic signals in terms of psycho-acoustics. Since the general objective evaluation models for tonalness among various sound attributes are a function of width, frequency, excessive level of tonal components respectively, the directional tonal components cannot be properly evaluated without considering the effects of head-related transfer function on the binaural auditory perception. Thus, the directivity of source is additionally considered to prevent the erroneous conclusions from the same sound source in the process of source identification. The signal synthesis technique is used to solve a little difficulty in measuring all of desired acoustic signals for jury evaluation. The sound attributes of synthetic acoustics signals are analyzed to roughly predict the results of jury evaluation in advance by using sound quality factors such as loudness, sharpness, roughness, fluctuation strength and tonality. The jury evaluation is carefully conducted based on the recommended guideline suggested by N. Ottoet al. Each sound is respectively evaluated by selecting a value between -2 and 2 in intervals of 0.2 point. Through above procedure, based on the results of jury evaluation, it is confirmed that serious problems can be caused in the process of analyzing the dominant sound attributes in terms of psycho-acoustics according to the type of a microphone and a playback system.

  • PDF

머리 전달 함수의 보간에 적합한 왜곡 척도 (A Relevant Distortion Criterion for Interpolation of the Head-Related Transfer Functions)

  • 이기승;이석필
    • 한국음향학회지
    • /
    • 제28권2호
    • /
    • pp.85-95
    • /
    • 2009
  • 양이 재생 환경에서 다양하고 정확한 공간 이미지 형성을 위해서는 다양하고 세분화된 머리 전달 함수가 요구된다. 방대한 양의 머리 전달 함수를 효과적으로 감축하기 위한 방법으로, 모든 방향에 대한 머리 전달 함수를 몇 개의 대표 값들을 이용해 보간을 통해 얻는 방법이 주로 사용되고 있다. 본 논문에서는 머리 전달 함수의 보간 시 중요한 역할을 하는 보간 왜곡의 측정 방법에 대해 연구하였다. 다양한 객관적 왜곡 측정 방법을 이용하여 보간된 머리전달 함수와 본래의 머리전달 함수 간 차이를 표현하였으며 차이 값과 청취 테스트의 결과를 비교, 분석하였다. 분석 결과로부터 음원의 공간 이미지 차이를 가장 잘 반영하는 객관적 왜곡 측정 방법을 선택하였으며 이를 실제 보간 기법에 적용하였다. 3명의 사람으로부터 측정된 머리전달함수와 1개의 마네킹에서 측정된 머리 전달함수에 제안된 방법을 적용한 결과, 3명의 사람에 대한 머리전달 함수에 대해서는 멜-주파수 켑스트럼 왜곡이, 4 종류의 머리전달 함수에 대해서는 시간 영역의 신호 대 왜곡비자 음원의 공간 이미지 차이를 가장 잘 예측하는 왜곡 척도임을 알 수 있었다.