• 제목/요약/키워드: Head-related impulse response

검색결과 14건 처리시간 0.019초

보편적인 기저함수를 이용한 개인의 머리전달함수 모델링 (Modeling of individual head-related impulse responses using a set of general basis functions)

  • 황성목;박영진;박윤식
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 2007년도 추계학술대회논문집
    • /
    • pp.1430-1436
    • /
    • 2007
  • A principal components analysis (PCA) of the median head-related impulse responses (HRIRs) in the CIPIC HRTF database reveals that the individual HRIRs can be adequately reconstructed by a linear combination of 12 orthonormal basis functions. These basis functions can be used generally to model arbitrary HRIRs, which are not included in the process to obtain the basis functions. To clarify whether these basis functions can be used to model other set of arbitrary HRIRs, an numerical error analysis for modeling and a series of subjective listening tests were carried out using the measured and modeled HRIRs. The results showed that the set of individual HRIRs, which were measured in our lab using different measurement conditions, techniques, and source positions, can be well modeled with reasonable accuracy. Furthermore, all subjects reported not only the accurate vertical perception but also the front-back discrimination with the modeled HRIRs based on 12 basis functions. However, as less basis functions were used for HRIR modeling, the modeling accuracy and localization performance deteriorated.

  • PDF

보편적인 기저함수를 이용한 중앙면상의 머리전달함수 모델링 (Modeling of Median-plane Head-related Impulse Responses Using a Set of General Basis Functions)

  • 황성목;박영진;박윤식
    • 한국소음진동공학회논문집
    • /
    • 제18권4호
    • /
    • pp.448-457
    • /
    • 2008
  • A principal components analysis (PCA) of the median-plane head-related impulse responses (HRIRs) in the CIPIC HRTF database reveals that the individual HRIRs in the median plane can be adequately reconstructed by a linear combination of 12 orthonormal basis functions. These basis functions can be used to model arbitrary median-plane HRIRs, which are not included in the process to obtain the basis functions. Memory size can be reduced up to 5-fold depending on the number of HRIRs to be modeled. To clarify whether these basis functions can be used to model other set of arbitrary median plane HRIRs, a numerical error analysis for modeling and a series of subjective listening tests were carried out using the measured and modeled HRIRs. The results showed that the set of individual HRIRs in the median plane, which were measured in our lab using different measurement conditions, techniques, and source positions, can be modeled with reasonable accuracy. All subjects, involved in the subjective listening test, reported not only the accurate vertical perception but also the front-back discrimination with the modeled HRIRs based on 12 basis functions.

A DNN-Based Personalized HRTF Estimation Method for 3D Immersive Audio

  • Son, Ji Su;Choi, Seung Ho
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제13권1호
    • /
    • pp.161-167
    • /
    • 2021
  • This paper proposes a new personalized HRTF estimation method which is based on a deep neural network (DNN) model and improved elevation reproduction using a notch filter. In the previous study, a DNN model was proposed that estimates the magnitude of HRTF by using anthropometric measurements [1]. However, since this method uses zero-phase without estimating the phase, it causes the internalization (i.e., the inside-the-head localization) of sound when listening the spatial sound. We devise a method to estimate both the magnitude and phase of HRTF based on the DNN model. Personalized HRIR was estimated using the anthropometric measurements including detailed data of the head, torso, shoulders and ears as inputs for the DNN model. After that, the estimated HRIR was filtered with an appropriate notch filter to improve elevation reproduction. In order to evaluate the performance, both of the objective and subjective evaluations are conducted. For the objective evaluation, the root mean square error (RMSE) and the log spectral distance (LSD) between the reference HRTF and the estimated HRTF are measured. For subjective evaluation, the MUSHRA test and preference test are conducted. As a result, the proposed method can make listeners experience more immersive audio than the previous methods.

Proposal on the Diagnostic Criteria of Definite Isolated Otolith Dysfunction

  • Park, Han Gyeol;Lee, Jun Ho;Oh, Seung Ha;Park, Moo Kyun;Suh, Myung-Whan
    • Journal of Audiology & Otology
    • /
    • 제23권2호
    • /
    • pp.103-111
    • /
    • 2019
  • Background and Objectives: Dizzy patients with abnormal otolith function tests, despite a normal caloric response, are defined as having specific (isolated) otolith organ dysfunction. This study was performed to compare the differences in clinical presentation between isolated otolith dysfunction (iOD) patients with lab- and Sx-based iOD group and lab-based iOD symptoms. Subjects and Methods: The medical records of 23 iOD patients with normal caloric response but abnormal cervical vestibular evoked myogenic potential (VEMP), ocular VEMP, or subjective visual vertical were reviewed. Non-spinning vertigo was considered as otolith-related symptoms. The patients' age, onset of dizziness, Numeric Rating Scale on the severity of dizziness, and concomitant vestibular disorders were analyzed. Results: Patients in the lab-based iOD group were significantly older than those in the lab- and Sx-based iOD group. Known vestibular disorders were significantly more common in the lab-based iOD group (83.3%) compared to the lab- and Sx-based iOD group (18.2%). Despite the normal caloric response, catch-up saccade was found in the video head impulse test in more than half (54.5%) of the lab-based iOD group patients. There was no catch-up saccade in the lab- and Sx-based iOD group. There were no significant differences in gender ratio, frequency of dizziness attacks, and duration of illness. Conclusions: We propose new definitions of definite iOD (lab- and Sx-based iOD) and probable iOD (lab- or Sx-based iOD). These new definitions may help researchers to identify patients who are more likely to have true iOD, and facilitate comparisons of results between different studies.

Proposal on the Diagnostic Criteria of Definite Isolated Otolith Dysfunction

  • Park, Han Gyeol;Lee, Jun Ho;Oh, Seung Ha;Park, Moo Kyun;Suh, Myung-Whan
    • 대한청각학회지
    • /
    • 제23권2호
    • /
    • pp.103-111
    • /
    • 2019
  • Background and Objectives: Dizzy patients with abnormal otolith function tests, despite a normal caloric response, are defined as having specific (isolated) otolith organ dysfunction. This study was performed to compare the differences in clinical presentation between isolated otolith dysfunction (iOD) patients with lab- and Sx-based iOD group and lab-based iOD symptoms. Subjects and Methods: The medical records of 23 iOD patients with normal caloric response but abnormal cervical vestibular evoked myogenic potential (VEMP), ocular VEMP, or subjective visual vertical were reviewed. Non-spinning vertigo was considered as otolith-related symptoms. The patients' age, onset of dizziness, Numeric Rating Scale on the severity of dizziness, and concomitant vestibular disorders were analyzed. Results: Patients in the lab-based iOD group were significantly older than those in the lab- and Sx-based iOD group. Known vestibular disorders were significantly more common in the lab-based iOD group (83.3%) compared to the lab- and Sx-based iOD group (18.2%). Despite the normal caloric response, catch-up saccade was found in the video head impulse test in more than half (54.5%) of the lab-based iOD group patients. There was no catch-up saccade in the lab- and Sx-based iOD group. There were no significant differences in gender ratio, frequency of dizziness attacks, and duration of illness. Conclusions: We propose new definitions of definite iOD (lab- and Sx-based iOD) and probable iOD (lab- or Sx-based iOD). These new definitions may help researchers to identify patients who are more likely to have true iOD, and facilitate comparisons of results between different studies.

원형 머리 모델을 이용한 머리 전달 함수의 보간 (HRTF Interpolation Using a Spherical Head Model)

  • 이기승;이석필
    • 한국음향학회지
    • /
    • 제27권7호
    • /
    • pp.333-341
    • /
    • 2008
  • 본 논문에서는 머리 전달 함수에 대한 새로운 보간 기법을 제안하였다. 제안된 기법은 각 방위각에 대한 머리 전달 함수의 충격파 응답이 인접 방위각에 대한 시간 지연된 충격파 응답의 선형 보간으로 주어진다고 가정하였다. 각 방위각에 대한 충격파 응답의 시간 지연은 방위각, 머리의 물리적 형태, 음원과 머리의 거리 정보를 이용하여 추정될 수 있는 귀와 음원간의 전파시간과 최소 자승 오차를 갖도록 하는 교정값의 합으로 주어진다. 또한 제안된 모델에서는 보간 시 방위각의 간격을 고정 간격이 아닌 가변 간격으로 하였으며 본래 충격파 응답과 보간된 충격파 응답이 본래의 충격파 응답과 비교하여 청취 상으로 큰 차이가 느껴지지 않고, 보간에 필요한 충격파 응답의 재수가 최소화되는 조건을 만족하도록 결정하였다. 제안된 보간 모델의 유용성을 검증하기 위하여 더미 헤드 및 3명의 사람으로부터 측정된 머리 전달 함수에 대해 제안된 보간 모델을 적용하였다 머리 전달 함수는 0도의 고도각을 갖는 수평면을 5도 간격의 방위각으로 분할한 총 72개가 사용되었으며, 실험 결과 전체 머리 전달 함수 중 단지 $30\sim40%$ 만을 사용하고 나머지는 보간에 의해 얻어진 머리전달 함수를 사용하더라도 청취상의 음원의 위치가 변동되지 않음을 알 수 있었다.

HRTF를 이용한 헤드폰 기반의 다채널 입체음향 생성 (Headphone-based multi-channel 3D sound generation using HRTF)

  • 김시호;김경훈;배건성;최송인;박만호
    • 대한전자공학회논문지SP
    • /
    • 제42권1호
    • /
    • pp.71-77
    • /
    • 2005
  • 본 논문에서는 5.1채널 입체음향 오디오 신호를 2채널의 헤드폰으로 재생하기 위한 HRTF (Head Related Transfer Function) 기반의 입체음향 생성 시스템에 대하여 다룬다. 각 채널의 모노 입력신호는 HRTF를 이용한 바이노럴(binaural) 필터링을 통해 가상적으로 음상정위되며, 입체감과 공간감을 증가시키기 위해 잔향효과가 추가된다. 연산량 감소를 위해 음상정위 성능을 저하시키지 않는 범위에서 HRTF의 임펄스 응답 탭 수를 줄였으며, 잔향효과를 위한 음장제어부에서는 초기반사열중 주요한 성분만을 지연기로 모델링하였다. 또한 비개인화된 HRTF DB에 의란 앞/뒤 혼돈 문제를 줄이기 위하여 앞/뒤 스펙트럼의 차를 가중치로 하여 HRTF 스펙트럼을 강조하는 방법을 적용하였다. 구현한 시스템의 성능 평가 결과, 단순한 스테레오 방법이나 2채널 Down Mixing 방식에 비해 현실감 있고 방향성 있는 입체음향을 느낄 수가 있었다.

주파수 워핑된 공통 극점을 이용한 음향 간섭제거기의 설계 및 구현 (Design and Implementation of Crosstalk Canceller Using Warped Common Acoustical Poles)

  • 정재웅;박영철;윤대희;이석필
    • 한국음향학회지
    • /
    • 제29권5호
    • /
    • pp.339-346
    • /
    • 2010
  • 음향 간섭제거기는 머리전달함수 (head-related impulse response; HRIR)의 길이에 큰 영향을 받게 되어, 일반적으로 큰 차수의 필터를 필요로 한다. 간섭제거필터의 길이를 줄이기 위한 방법으로 주파수 워핑, 공통 극점과 영점 (common acoustical pole and zero; CAPZ) 모델링 등의 방법들이 제안되었는데, 본 논문에서는 이 두 가지 방법을 결합한 방법을 제안한다. 이를 위해, 주파수 워핑 영역에서 공통 극점과 영점 모델링을 통해 필터를 설계하며, 디워핑 과정을 통해 종래의 선형 영역에서 안정된 필터를 구현한다. 제안된 방법은 주파수 워핑을 통한 간섭제거 성능 향상과 공통 극점 모델링을 통한 필터 계수 감소를 함께 제공할 수 있다. 이러한 성능을 검증하기 위해 다양한 컴퓨터 모의 실험을 진행하였다.

멀티채널 룸임펄스 응답 기반 외재화 알고리즘 (Sound Externalization using Multichannel Room Impulse Response)

  • 장인선;이용주;장대영;강경옥
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2008년도 동계학술대회
    • /
    • pp.139-142
    • /
    • 2008
  • 헤드폰 또는 이어폰으로 오디오 청취 시 흔히 음상이 머리 내부에 맺히는 현상이 발생하게 되며, 이러한 현상을 음상 내재화(Inside Head Localization; IHL)라 한다. 오디오의 음상이 머리 주변 혹은 머리 내부에 맺히게 되면 공간감이나 입체감이 떨어지게 되어 음향의 현실감을 저하시키게 되며 또한 청취에 따른 피로도가 증가하게 된다. 이러한 음상 내재화 현상을 제거하여, 헤드폰/이어폰을 통해 오디오 청취 시 음상이 머리의 외부에 맺히도록(Out of Head Localization; OHL) 하는 기술을 음상 외재화(Sound Externalization) 기술이라 한다. 룸 임펄스 응답이 방향 큐와 연계하여 생성되었을 경우 외재화가 가능하다는 실험적 사실을 바탕으로 기존의 음상 외재화 방법은 일반적인 HRTF (Head Related Transfer Function)를 이용하여 외재화 필터를 구성해왔다. 본 논문에서는 구체마이크로폰을 이용하여 녹음한 멀티채널 룸 임펄스 응답을 기반으로 모델링 된 외재화 필터를 이용한 음원 외재화 방법을 제안한다. 또한 실험 및 결과 분석을 통하여 본 알고리즘의 전방 음원 외재화 성능의 우수성을 입증하고, 외재화 알고리즘 적용 후의원 신호 음상 보존 성능을 확인한다.

  • PDF

고역 주파수 영역에서 HRTF의 간략화에 관한 연구 (A study on the simplification of HRTF within high frequency region)

  • 이채봉
    • 융합신호처리학회논문지
    • /
    • 제12권1호
    • /
    • pp.1-6
    • /
    • 2011
  • 본 연구에서는 머리전달함수(Head-Related Transfer Function : HRTF) 고역 주파수 영역에서의 간략화가 음상정위에 미치는 영향에 관하여 검토하였다. 이를 위해 HRTF를 측정하였으며 측정한 HRTF에 대하여 분석한 결과, 음원 반대편(음원에서 멀리 떨어진 귀)의 HRTF 고역 주파수 특성은 회절의 성질을 고려하면 머리에 의해 거의 감쇄가 된다. 이와 같이 감쇄된 주파수 영역에 대해서는 정위에 미치지 않는다고 가정하면 간략화가 가능하다. 간략화는 경계 주파수를 차단 주파수로 하는 지역통과 필터를 삽입하여 고역의 주파수 진폭특성을 평탄하게 함으로서 간략화를 하였다. 간략화를 한 HRTF를 평가하기 위하여 청취실험을 하였다. 청취실험의 결과, 정위오차에 대해서는 HRTF의 주파수 특성을 간략화 하여도 방향 지각에 영향이 없다는 것이 나타났다. 전후 혼란율에 대해서는 HRTF의 8kHz 이상의 주파수 특성을 간략화 하여도 영향이 없음이 나타났다. 최종적으로는 HRTF의 8kHz 이상의 주파수 특성에 본 연구의 간략화를 적용하여도 음상정위에 영향을 미치지 않는다는 것이 나타났다.