• Title/Summary/Keyword: 음향음성학

Search Result 748, Processing Time 0.023 seconds

A Speech Recognition Using Instantaneous SNR Estimation and RASTA Processing (순시적인 신호대 잡음비 예측과 RASTA 기법을 이용한 음성인식)

  • 배현권;오문식;이행세
    • The Journal of the Acoustical Society of Korea
    • /
    • v.17 no.1
    • /
    • pp.55-59
    • /
    • 1998
  • 본 논문에서는 잡음에 강한 음성 인식기를 위한 음성의 특징 추출에 관해서 살펴 보았다. 지금까지의 음성 인식기는 조용한 실험실 환경하에서 학습이 이루어지나 실제 테스 트는 여러 가지 환경에서 이루어지므로, 이러한 환경 변화에 따라 음성인식 시스템의 성능 이 감소함을 보여왔다. 이를 보완하기 위해 여러 가지 연구가 진행되고 있으나 본 연구에서 는 음성의 특징 추출 부분에서 순시적인 신호대 잡음비 예측과 잡음에 강한(RASTA)처리를 하므로써 인식율을 향상시켰다.

  • PDF

Model adaptation employing DNN-based estimation of noise corruption function for noise-robust speech recognition (잡음 환경 음성 인식을 위한 심층 신경망 기반의 잡음 오염 함수 예측을 통한 음향 모델 적응 기법)

  • Yoon, Ki-mu;Kim, Wooil
    • The Journal of the Acoustical Society of Korea
    • /
    • v.38 no.1
    • /
    • pp.47-50
    • /
    • 2019
  • This paper proposes an acoustic model adaptation method for effective speech recognition in noisy environments. In the proposed algorithm, the noise corruption function is estimated employing DNN (Deep Neural Network), and the function is applied to the model parameter estimation. The experimental results using the Aurora 2.0 framework and database demonstrate that the proposed model adaptation method shows more effective in known and unknown noisy environments compared to the conventional methods. In particular, the experiments of the unknown environments show 15.87 % of relative improvement in the average of WER (Word Error Rate).

On the Perceptually Important Phase Information in Acoustic Signal (인지에 중요한 음향신호의 위상에 대해)

    • The Journal of the Acoustical Society of Korea
    • /
    • v.19 no.7
    • /
    • pp.28-33
    • /
    • 2000
  • For efficient quantization of speech representation, it is common to incorporate Perceptual characteristics of human hearing. However, the focus has been confined only to the magnitude information of speech, and little attention has been paid to phase information. This paper presents a novel approach, termed perceptually irrelevant phase elimination (PIPE), to find out irrelevant phase information of acoustic signals in terms of perception. The proposed method, which is based on the observation that the relative phase relationship within a critical band is perceptually important, is derived not only for stationary Fourier signal but also for harmonic signal. The proposed method is incorporated into the analysis/synthesis system based on harmonic representation of speech, and subjective test results demonstrate the effectiveness of proposed method.

  • PDF

Review of Standard Sound Quality Assessment Methods for the Transmitted and Processed Sounds (음질 평가법의 표준과 연구 동향 - 전송 처리음 분야)

  • Oh, Wongeun
    • The Journal of the Acoustical Society of Korea
    • /
    • v.32 no.3
    • /
    • pp.214-226
    • /
    • 2013
  • Assessing the quality of audio signals is an important consideration in making high quality sounds and various methods have been developed. This paper provides a general framework of sound quality and a technical overview of the international standard methods which are described in ITU-T, ITU-R, IEC and ANSI Recommendations in the speech intelligibility, speech quality, and audio quality areas. In addition, some recent findings and future works are included.

A Study on the Word Selection for Intelligibility Assessment of Synthesized Speech by Rule (규칙 합성음성의 이해성 평가를 위한 단어표 구성에 관한 연구)

  • 홍진우;김순협;강성훈
    • The Journal of the Acoustical Society of Korea
    • /
    • v.9 no.6
    • /
    • pp.22-28
    • /
    • 1990
  • 최근에 음성합성 기술이 발전됨에 따라 이러한 기술을 이용한 새로운 통신 서비스가 등장하고 있으며 그 표준 설정에 있어서 음성 품질은 아주 중요한 요인이 된다. 따라서, 시스템 알고리즘의 진단 적 평가 및 평가치의 상호 비교를 위해 품질 평가방법을 개발하는 것은 매우 중요하다. 본 논문에서는 규칙 합성음성의 이해성 평가를 위한 기본적 사항들과 개념을 기술하고 ,이해성 평가에 사용되는 단어 표를 구성하는 방법과 단어표를 제안하였다.

  • PDF

Frequency-Weighting linear predictive analysis of speech (Frequency-Weighting을 이용한 음성의 선형상측)

  • 김상준;윤종관;조동활
    • The Journal of the Acoustical Society of Korea
    • /
    • v.4 no.1
    • /
    • pp.43-54
    • /
    • 1985
  • 이 논문에서는 Frequency weighting을 이용하여 선형예측 부호화기의 명료성을 개선하는 방법 을 연구한다. 잡음이 섞이지 않은 음성에 대해서는 음성을 분석하기전에 frequency weighting을 행한다. 또한 잡음이 섞인 음성인 경우에는 잡음성분을 spectral subtraction 방법에 의해서 제거한 다음에 frequency weighting을 준다. 이 때 frequency weighting을 주기 위해서 귀의 특성과 연관되어 잘 알려 진 C- message weighting 함수, flanagan weighting 함수 및 articulation index를 약간 수정한 weighting 함수를 사용했다. 여러 객관적인 distance measure를 사용하여 frequency weighting 방법의 성능을 측정하고 귀로 들어 본 결과, frequency weighting 방법을 사용하여 선형예측 방법에 의한 합성 음의 명료도를 효율적으로 개선할 수 있었다.

  • PDF

A Study on the Single Word Recognition using Composite Neural Network (복합신경망을 이용한 단음식에 대한 연구)

  • 김석동;이행세
    • The Journal of the Acoustical Society of Korea
    • /
    • v.11 no.6
    • /
    • pp.23-31
    • /
    • 1992
  • 신경망을 이용한 음성인식에 관한 연구이다. 우선 음성을 음소로 분리하였다. 그런다음 각각의 음소를 인식하였다. 음소인식을 위해 제어망과 몇 개의 소규모 망으로 구성된 복합신경망을 이용하였다. 제어망은 음소가 어느 집단에 속하는가를 결정하고, 소규모망에서는 각 집단에 속하는 음소를 인식한다. 마지막으로 프레임별 인식 결과를 누적하여 음소를 판별하였다.

  • PDF

Distorted Speech Rejection For Automatic Speech Recognition under CDMA Wireless Communication (CDMA이동통신환경에서의 음성인식을 위한 왜곡음성신호 거부방법)

  • Kim Nam Soo;Chang Joon-Hyuk
    • The Journal of the Acoustical Society of Korea
    • /
    • v.23 no.8
    • /
    • pp.597-601
    • /
    • 2004
  • This paper introduces a pre-rejection technique for wireless channel distorted speech with application to automatic speech recognition (ASR) Based on analysis of distorted speech signals over a wireless communication channel. we propose a method to reject the channel distorted speech with a small computational load. From a number of simulation results. we can discover that tile pre-rejection algorithm enhances the robustness of speech recognition operation.