• 제목/요약/키워드: Psychoacoustic Model

검색결과 55건 처리시간 0.021초

난청인의 통화 청취도 향상을 위한 전화기 개발 (A Development of Telephone for the Hearing Impaired to Improve Listening Ability of Telephone Speech)

  • 이상민;송철규;이영묵;김원기
    • 대한의용생체공학회:의공학회지
    • /
    • 제18권4호
    • /
    • pp.457-466
    • /
    • 1997
  • 청력장애인이 전화상의 말에 대한 청취력을 향상시킬수 있는 보청기능이 있는 전화기를 개발하였다. 최근 청력장애인이 늘어나고 있으며 생산자로서의 사회참여 욕구 또한 늘어나고 있는데 이들은 자신의 핸디캡을 메워줄 보조기기를 강력히 원하고 있다. 보청기능 전화기는 음성으로써 외부 정보를 획득할 수 있는 기본적인 통신 보조기기의 한 형태이다. 본 연구팀은 청력장애인의 청력특성을 분석하고 전화기에 청력 보상법을 적용함으로써 보청기능이 있는 새로운 모델의 전화기를 개발하였고 3가지 분야의 시험(전기적 시험, 단어 인지도 시험, 사용자 시험)을 수행하여 이 전화기의 유용성을 평가하였다. 새 전화기는 4개의 대역통과필터를 가지고 있으며 각 밴드의 중심주파수는 전화라인의 특성과 심리음향학적인 특성을 고려하여 500, 1000, 2000, 3000 Hz로 설정하였다. 청력장애인은 전화기의 증폭특성을 자신의 청력에 맞도록 피팅(fitting)할 수 있다. 즉 자신의 손실된 청력을 잘 보상하도록 4개 필터밴드에 대한 볼륨조절을 개별적으로 조정할 수 있다. 전화기의 전체 이득은 250~32000Hz 대역내에서 20㏈ 이상이다. 시험결과 새 모델의 전화기가 기존의 전화기보다 청력장애인의 전화음성 이해도를 향상 시킨다고 증명되었다. 향후 측음 및 잡음 억제, 주파수 대역분리, 청력패턴 보상과 심리음향적 라우드니스(loudness)보상에 대한 연구가 필요하며 공학과 임상 분야에서의 청력장애인의 언어 이지특성 연구를 통하여 더욱 발전된 전화기가 개발될 수 있다고 판단된다.

  • PDF

회귀모형과 신경망모형을 이용한 차량공조시스템의 음질 인덱스 구축 및 비교 (Construction and Comparison of Sound Quality Index for the Vehicle HVAC System Using Regression Model and Neural Network Model)

  • 박상길;이해진;심현진;이유엽;오재응
    • 한국소음진동공학회논문집
    • /
    • 제16권9호
    • /
    • pp.897-903
    • /
    • 2006
  • The reduction of the vehicle interior noise has been the main interest of noise and vibration harshness (NVH) engineers. The driver's perception on the vehicle noise is affected largely by psychoacoustic characteristic of the noise as well as the SPL. In particular, the heating, ventilation and air conditioning (HVAC) system sound among the vehicle interior noise has been reflected sensitively in psychoacoustics view point. Even though the HVAC noise is not louder than overall noise level, it clearly affects subjective perception to drivers in the way of making to be nervous or annoyed. Therefore, these days a vehicle engineer takes aim at developing sound quality as well as reduction of noise. In this paper, we acquired noises in the HVAC from many vehicles. Through the objective and subjective sound quality (SQ) evaluation with acquiring noises recorded by the vehicle HVAC system, the simple and multiple regression models were obtained for the subjective evaluation 'Pleasant' using the semantic differential method (SDM). The regression procedure also allows you to produce diagnostic statistics to evaluate the regression estimates including appropriation and accuracy. Furthermore, the neural network (NN) model were obtained using three inputs(loudness, sharpness and roughness) of the SQ metrics and one output(subjective 'Pleasant'). Because human's perception is very complex and hard to estimate their pattern, we used NN model. The estimated models were compared with correlations between output indexes of SQ and hearing test results for verification data 'Pleasant'. As a result of application of the SQ indexes, the NN model was shown with the largest correlation of SQ indexes and we found possibilities to predict the SQ metrics.

향상된 버퍼 제어 방법을 사용한 3D 오디오 핵심 부호화기 (A 3D Audio Core-Codec Employing an Improved Buffer Control Method)

  • 김인철
    • 방송공학회논문지
    • /
    • 제25권2호
    • /
    • pp.233-241
    • /
    • 2020
  • 본 논문에서는 3DA 핵심 부호화기의 FD 처리부의 성능 향상을 위해 새로운 버퍼 제어 기법을 제안하였다. 제안한 버퍼 제어 기법은 3GPP의 심리음향 모델과 스펙트럼 공백 회피 기법을 포함한 율-왜곡 제어부를 채택하였다. 그런 다음, 활동성이 높은 프레임에 충실한 비트 할당이 이루어질 수 있도록 3GPP 버퍼 제어 방법을 수정하였다. 본 논문에서 제안한 버퍼 제어 방법의 성능은 MUSHRA 테스트를 통해 평가되었고, 그 결과 3DA RM9 및 3GPP AAC의 버퍼 제어 방법보다 우수한 성능을 보임을 입증한다.

지각 모델링을 이용한 디지털 오디오 워터마킹 방법 (Digital Audio Watermarking Scheme Using Perceptual Modeling)

  • 석종원;홍진우
    • 방송공학회논문지
    • /
    • 제6권2호
    • /
    • pp.195-202
    • /
    • 2001
  • 디지털 워터마킹 기법은 디지털 멀티미디어 컨텐츠의 저작권 보호를 위한 새로운 해결책으로 제시되고 있으며, 국내외에서 이와 관련된 연구가 활발히 진행되고 있다. 본 논문에서는 최근 들어 많은 관심을 끌고있는 디지털 오디오의 저작권 보호를 위한 새로운 워터마킹 방법을 소개한다. 제안된 워터마킹 기법은 MPEG의 심리음향모델을 사용하여 지각적으로 감지되지 않을 뿐 아 니라, 워터마크 검출 시에도 전처리 과정을 거쳐 원본 오디오 신호 없이도 워터마크의 검출이 가능하다. 개발된 오디오 워터마킹기술은 원본 오디오에 비해 오디오의 품질이 떨어지지 않을 뿐 아니라, 워터마크를 제거하고자 가해지는 다양한 공격에도 워터마크가 제거되지 않는 특징을 가지고 있다. 또한, 기존의 확산대역 방식을 이용하는 워터마킹 방법이 시간축 변형 공격에 상당히 취약한 단점을 가지는 것에 비해, 제안된 방법은 변형된 형태의 원본 신호를 워터마크로 사용하여 시간축 공격에도 안정적으로 워터마크를 검출할 수 있었다.

  • PDF

심리음향모델과 SOLA 알고리즘을 이용한 코러스 칩 설계 (The Design of Chorus DSP Chip Using Psychoacoustic Model and SOLA Algorithm)

  • 김태훈;박주성
    • 한국음향학회지
    • /
    • 제19권3호
    • /
    • pp.11-19
    • /
    • 2000
  • 본 논문에서는 가요 반주기의 육성 코러스 기능을 구현하는데 핵심적인 기능을 하는 반도체 칩 설계에 관한 내용을 다룬다. 육성 데이터는 많은 저장 용량을 필요로 하고 있으므로 압축이 필요하고, 반주기의 키 및 템포 변화에 따라 육성 데이터의 키와 템포를 변화시키는 것이 필요하다. 본 연구에서는 압축을 위해서는 MPEG-1 오디오 계층1, 키 및 템포 변환을 위해서는 SOLA(Synchronized Overlap and Add) 알고리즘을 적절하게 변형하였다. 변형된 알고리즘을 구현할 수 있는 ASIC(Application Specific Integrated Circuit)을 설계하고 FPGA로 검증한 후 칩으로 제작하였다. 제작된 칩은 실제 시스템에 응용되어 정상적으로 동작하는 것을 확인하였다.

  • PDF

A Scalable Audio Coder for High-quality Speech and Audio Services

  • 이길호;이영한;김홍국;김도영;이미숙
    • 대한음성학회지:말소리
    • /
    • 제61호
    • /
    • pp.75-86
    • /
    • 2007
  • In this paper, we propose a scalable audio coder, which has a variable bandwidth from the narrowband speech bandwidth to the audio bandwidth and also has a bit-rate from 8 to 320 kbits/s, in order to cope with the quality of service(QoS) according to the network load. First of all, the proposed scalable coder splits bandwidth of the input audio into narrowband up to around 4 kHz and above. Next, the narrowband signals are compressed by a speech coding method compatible to an existing standard speech coder such as G.729, and the other signals whose bandwidth is above the narrowband are compressed on the basis of a psychoacoustic model. It is shown from the objective quality tests using the signal-to-noise ratio(SNR) and the perceptual evaluation of audio quality(PEAQ) that the proposed scalable audio coder provides a comparable quality to the MPEG-1 Layer III (MP3) audio coder.

  • PDF

저전송률 오디오 부호화에서 음성 신호의 성능 개선을 위한 마스킹 임계값 적응기법 향상 (Enhanced Adjustment Strategy of Masking Threshold for Speech Signals in Low Bit-Rate Audio Coding)

  • 이창헌;강홍구
    • 한국음향학회지
    • /
    • 제29권1호
    • /
    • pp.62-68
    • /
    • 2010
  • 본 논문에서는 기존 마스킹 임계값 적응 방식을 개선하여 저전송률 오디오 부호화에서 음성 신호에 대한 성능을 향상시킨다. 포먼트 영역 검색 이후, 각 포먼트 영역의 평균 에너지와 해당 서브밴드의 에너지 비율을 이용하여 마스킹 임계값을 변화시킨다. 상대적으로 에너지가 큰 밴드에 대해서는 더 많은 양자화 노이즈가 허용되는 반면, 청각적으로 민감한 스펙트럴 밸리에서는 비트 할당을 높여 양자화 에러를 좀 더 줄인다. 이는 음성 부호화에서 널리 사용되는 지각 가중(perceptual weighting) 개념을 반영한 것이다. 객관적 음질 평가 결과, 제안한 알고리즘이 기존 방식에 비해 음성 신호에 대한 성능을 향상시킨다는 것을 확인하였다.

MPEG 통합 음성/오디오 코덱을 위한 오픈 소스 부호화 기술에 관한 연구 (Research on Open Source Encoding Technology for MPEG Unified Speech and Audio Coding)

  • 송정욱;이준일;강홍구
    • 전자공학회논문지
    • /
    • 제50권1호
    • /
    • pp.86-96
    • /
    • 2013
  • 통합 음성/오디오 부호화기 (Unified Speech and Audio Coding, USAC)는 2011년 MPEG에서 FDIS (Final Draft International Standard)를 승인받은 최고 성능의 통합 음성/오디오 부호화기이다. 전통적으로 MPEG에서는 복호화기 기술만 표준화하므로 인코더 기술에 대한 고찰이 쉽지 않을 뿐 아니라, 예제로 공개하는 인코더 (Reference Model, RM)의 경우에도 기본 아이디어만을 포함하고 있기 때문에 이를 사용할 경우 성능 저하가 매우 심각하다. 성능 열화는 매우 심각하다. 이러한 문제를 최소화하기 위해 오픈 소스 기반으로 진행되고 있는 프로젝트 JAME에서는 USAC에 적용된 핵심 인코더 기술의 성능을 최대화 할 수 있는 방법을 제안하고 있다. 본 논문에서는 입력 신호에 따라 두 코더가 선택적으로 동작되게 하는 신호 분류기와 심리 음향 모델을 기반으로 하는 주파수 부호화 기술, 그리고 전이 윈도우 기술 등의 주요 인코더 기술들에 대하여 소개한다. 또한 FDIS를 위한 verification test 결과와 Common Encoder의 성능 평가를 덧붙인다.

회귀모형과 신경망모형을 이용한 차량공조시스템의 음질 인덱스 구축 (Construction of Sound Quality Index for the Vehicle HVAC System Using Regression Model and Neural Network Model)

  • 박상길;이해진;심현진;이정윤;오재응
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 2006년도 춘계학술대회논문집
    • /
    • pp.1443-1448
    • /
    • 2006
  • The reduction of the vehicle interior noise has been the main interest of NVH engineers. The driver's perception on the vehicle noise is affected largely by psychoacoustic characteristic of the noise as well as the SPL. In particular, the HVAC sound among the vehicle interior noise has been reflected sensitively in the side of psychology. Even though the HVAC noise is not louder than overall noise level, it clearly affects subjective perception in the way of making a diver become nervous or annoyed. Therefore, these days a vehicle engineer takes aim at developing sound quality as well as reduction of noise. In this paper, we acquired noises in the HVAC from many vehicles. Through the objective and subjective sound quality evaluation with acquiring noises caused by the vehicle HVAC system, the simple and multiple regression models were obtained for the subjective evaluation 'Pleasant' using the sound quality metrics. The regression procedure also allows you to produce diagnostic statistics to evaluate the regression estimates including appropriation and accuracy. Furthermore, the neural network model were obtained using three inputs(loudness, sharpness and roughness) of the sound quality metrics and one output(subjective 'Pleasant'). And then the models were compared with correlations between sound quality index outputs and hearing test results for 'Pleasant'. As a result of application of the sound quality index, the neural network was verified with the largest correlation of the sound quality index.

  • PDF

MPEG 오디오 부호화기를 위한 향상된 프리 에코 컨트롤 알고리듬 (Enhanced Pre echo Control Algorithm for MPEG Audio Coders)

  • 이창준;이재성;박영철
    • 방송공학회논문지
    • /
    • 제11권2호
    • /
    • pp.191-199
    • /
    • 2006
  • 본 논문은 심리음향 모델 II(PAM II)를 기반으로 한 MPEG 오디오 코더에 대해서 효율적으로 프리 에코(pre echo)를 제어하는 알고리듬을 제안한다. 프리 에코 제어는 PAM II에서 마스킹 임계값 계산의 마지막 단계로써, 현재 프레임에 대해서 발생하는 양자화 오차를 최소화시키는 역할을 한다. 기존에 부호화기에서 프리 에코는 추정되는 마스킹 임계치가 이전 프레임에서 얻어진 값을 넘지 않도록 제한함으로써 결정된다. 기존의 방법에서 사용되는 프리 에코 제어는 단구간 블록(short block)은 물론 장구간 블록(long block)에 대해서도 사용되는데, 이는 마스킹 임계값을 불필요하게 떨어뜨려 전체적인 양자화 잡음 레벨을 높이는 문제를 발생시킨다. 본 논문에서는 이러한 문제를 해결할 수 있는 효율적인 프리 에코 제어 과정을 제안하였다. 음질 테스트 결과에서 변화가 심한 오디오 신호에 대해서 ITU R 테스트를 시행한 결과 제안된 방법이 평균적으로 0.4점 이상 개선된 결과를 보였다.