• 제목/요약/키워드: Speech Enhancement Algorithm

검색결과 134건 처리시간 0.021초

텔레메틱스 단말용 음성 인식을 위한 음성향상 알고리듬 및 칩 구현 (Implementation of Chip and Algorithm of a Speech Enhancement for an Automatic Speech Recognition Applied to Telematics Device)

  • 김형국
    • 한국ITS학회 논문지
    • /
    • 제7권5호
    • /
    • pp.90-96
    • /
    • 2008
  • 본 논문은 텔레메틱스 단말용 음성인식을 위한 음성향상 단일 칩 알고리듬을 제시한다. 제안된 방법은 잡음제거와 에코제거의 두 단계로 구성되어 있으며, 첫 단계로 크로스 스펙트럼 추정에 기반한 적응필터를 통해 에코를 제거하고, 두번째 단계로 Generalized Gamma분포기반의 LSA 음성추정 방식 추정을 통해 외부 배경잡음을 제거하여 음성의 음질을 향상시킨다. 적은 계산량이 요구되는 제안된 알고리즘을 토대로 구현된 단일 칩의 성능은 다양한 잡음환경에서 신호 대잡음비율과 음성인식 평가에서 기존의 방법보다 향상된 결과를 나타내었다.

  • PDF

잡음 추정 알고리즘을 이용한 신뢰성 있는 코드벡터 조합의 선정 방법 (A Selection Method of Reliable Codevectors using Noise Estimation Algorithm)

  • 정승모;김무영
    • 전자공학회논문지
    • /
    • 제52권7호
    • /
    • pp.119-124
    • /
    • 2015
  • 배경잡음에 강인한 음성인식을 위한 전처리기로써 음성향상 기법이 요구되고 있다. 코드북 기반의 음성향상 기법은 기존 잡음 추정 알고리즘들과 비교하여 nonstationary 배경잡음 환경에 강인하다는 장점이 있다. 하지만 코드북 정보에 의존적이기 때문에 입력신호와 상관성이 떨어지는 코드벡터의 조합을 사용할 경우 성능이 급격히 떨어진다는 단점이 있다. 본 논문에서는 학습된 음성과 잡음 코드벡터를 조합하는 과정에서 입력신호와 상관성이 떨어지는 코드벡터의 조합을 제거함으로써, Log-Spectral Distortion (LSD)과 Perceptual Evaluation of Speech Quality (PESQ) 관점에서 기존 코드북 기반 알고리즘의 성능을 향상시켰다.

An Enhanced Clarity of Husky Voice by Dissonant Frequency Filtering

  • Kang, Sang-Ki;Baek, Seong-Joon
    • 음성과학
    • /
    • 제12권4호
    • /
    • pp.71-76
    • /
    • 2005
  • There have been numerous studies on the enhancement of noisy speech signal. In this paper, we propose a new speech enhancement method, that is, a filtering of a dissonant frequency combined with noise suppression algorithm. The simulation results indicate that the proposed method provides a significant gain in voice clarity. Therefore if the proposed enhancement scheme is used as a pre-filter, the perceptual clarity of husky voice is greatly enhanced.

  • PDF

Filtering of a Dissonant Frequency for Speech Enhancement

  • Kang, Sang-Ki;Baek, Seong-Joon;Lee, Ki-Yong;Sun, Koeng-Mo
    • The Journal of the Acoustical Society of Korea
    • /
    • 제22권3E호
    • /
    • pp.110-112
    • /
    • 2003
  • There have been numerous studies on the enhancement of the noisy speech signal. In this paper, we propose a completely new speech enhancement scheme, that is, a filtering of a dissonant frequency (especially F# in each octave of the tempered scale) based on the fundamental frequency which is developed in frequency domain. In order to evaluate the performance of the proposed enhancement scheme, subjective tests (MOS tests) were conducted. The subjective test results indicate that the proposed method provides a significant gain in audible improvement especially for speech contaminated by colored noise and speaking in a husky voice. Therefore when the filter is employed as a pre-filter for speech enhancement, the output speech quality and intelligibility is greatly enhanced.

중첩 U-Net 기반 음성 향상을 위한 다중 레벨 Skip Connection (Multi-level Skip Connection for Nested U-Net-based Speech Enhancement)

  • 황서림;변준;허준영;차재빈;박영철
    • 방송공학회논문지
    • /
    • 제27권6호
    • /
    • pp.840-847
    • /
    • 2022
  • 심층 신경망(Deep Neural Network) 기반 음성 향상에서 입력 음성의 글로벌 정보와 로컬 정보를 활용하는 것은 모델의 성능과 밀접한 연관성을 갖는다. 최근에는 다중 스케일을 사용하여 입력 데이터의 글로벌 정보와 로컬 정보를 활용하는 중첩 U-Net 구조가 제안되었으며, 이러한 중첩 U-Net은 음성 향상 분야에도 적용되어 매우 우수한 성능을 보였다. 그러나 중첩 U-Net에서 사용되는 단일 skip connection은 중첩된 구조에 알맞게 변형되어야 할 필요성이 있다. 본 논문은 중첩 U-Net 기반 음성 향상 알고리즘의 성능을 최적화하기 위하여 다중 레벨 skip connection(multi-level skip connection, MLS)을 제안하였다. 실험 결과, 제안된 MLS는 기존의 skip connection과 비교하여 다양한 객관적 평가 지표에서 큰 성능 향상을 보이며 이를 통해 MLS가 중첩 U-Net 기반 음성 향상 알고리즘의 성능을 최적화시킬 수 있음을 확인하였다. 또한, 최종 제안 모델은 다른 심층 신경망 기반 음성 향상 모델과 비교하여서도 매우 우수한 성능을 보인다.

A User friendly Remote Speech Input Unit in Spontaneous Speech Translation System

  • 이광석;김흥준;송진국;추연규
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 춘계종합학술대회 A
    • /
    • pp.784-788
    • /
    • 2008
  • In this research, we propose a remote speech input unit, a new method of user-friendly speech input in speech recognition system. We focused the user friendliness on hands-free and microphone independence in speech recognition applications. Our module adopts two algorithms, the automatic speech detection and speech enhancement based on the microphone array-based beamforming method. In the performance evaluation of speech detection, within-200msec accuracy with respect to the manually detected positions is about 97percent under the noise environments of 25dB of the SNR. The microphone array-based speech enhancement using the delay-and-sum beamforming algorithm shows about 6dB of maximum SNR gain over a single microphone and more than 12% of error reduction rate in speech recognition.

  • PDF

음성 향상을 위한 최소값 제어 음성 존재 부정확성의 추적기법 (Minima Controlled Speech Presence Uncertainty Tracking Method for Speech Enhancement)

  • 이우정;장준혁
    • 한국음향학회지
    • /
    • 제28권7호
    • /
    • pp.668-673
    • /
    • 2009
  • 본 논문에서는 최소값 제어 음성 존재 부정확성의 추정기법을 이용한 음성 향상 기법을 제안한다. 기존의 음성 존재 부정확성 추정기법에서는 간단한 a posteriori SNR에 근거하여 프레임, 채널마다 다른 a priori음성 부재 확률값을 결정하여 음성 부재 확률 계산에 적용하였다. 본 논문에서 제안된 알고리즘은 기존 음성 존재 부정확성 추적방법과는 달리 최소값 제어방법을 이용하여 주파수성분별 최소값에 근거한 강인한 a priori음성 부재 확률값 추정방법을 통해 음성 부재 확률에 적용하여 음성을 향상시킨다. 제안된 음성 향상 기법은 ITU-T P.862 perceptual evaluation of speech quality (PESQ)를 이용하여 평가하였고 기존의 음성 존재 부정확성 추적방법보다 향상된 결과를 나타내었다.

유색 잡음에 오염된 음성의 향상을 위한 백색 변환을 이용한 일반화 부공간 접근 (A Generalized Subspace Approach for Enhancing Speech Corrupted by Colored Noise Using Whitening Transformation)

  • 이정욱;손경식;박장식;김현태
    • 한국정보통신학회논문지
    • /
    • 제15권8호
    • /
    • pp.1665-1674
    • /
    • 2011
  • 본 논문에서는 유색잡음에 의해 오염된 음성신호의 음성향상 알고리즘을 제안한다. 유색잡음과 음성신호가 서로 상관이 없을 경우 유색잡음은 백색화 변환을 통해 무색잡음으로 변환된다. 이 변환된 신호를 음성신호 향상을 위한 일반화된 부공간 접근법에 적용한다. 전처리 과정에서의 백색화 변환으로 발생되는 음성 스펙트럼 왜곡은 제안한 알고리즘의 후처리를 통해 역 백색화하여 복구한다. 제안한 알고리즘의 성능을 컴퓨터 시뮬레이션으로 확인하였다. 사용한 유색잡음은 자동차 잡음과 멀티 토커 배블 잡음이다. AURORA 및 TIMIT 데이터 베이스에서 취득한 데이터로 실험했을 때 제안하는 방법이 신호대잡음비 및 스펙트럼 왜곡 측면에서 기존 접근법보다 개선됨을 확인하였다.

MMSE-STSA 기반의 음성개선 기법에서 잡음 및 신호 전력 추정에 사용되는 파라미터 값의 변화에 따른 잡음음성의 인식성능 분석 (Performance Analysis of Noisy Speech Recognition Depending on Parameters for Noise and Signal Power Estimation in MMSE-STSA Based Speech Enhancement)

  • 박철호;배건성
    • 대한음성학회지:말소리
    • /
    • 제57호
    • /
    • pp.153-164
    • /
    • 2006
  • The MMSE-STSA based speech enhancement algorithm is widely used as a preprocessing for noise robust speech recognition. It weighs the gain of each spectral bin of the noisy speech using the estimate of noise and signal power spectrum. In this paper, we investigate the influence of parameters used to estimate the speech signal and noise power in MMSE-STSA upon the recognition performance of noisy speech. For experiments, we use the Aurora2 DB which contains noisy speech with subway, babble, car, and exhibition noises. The HTK-based continuous HMM system is constructed for recognition experiments. Experimental results are presented and discussed with our findings.

  • PDF

보청기를 위한 IMCRA 기반 저연산 음성 향상 알고리즘 (Low-Complexity Speech Enhancement Algorithm Based on IMCRA Algorithm for Hearing Aids)

  • 전유용;이상민
    • 재활복지공학회논문지
    • /
    • 제11권4호
    • /
    • pp.363-370
    • /
    • 2017
  • 본 논문에서는 향상된 최소값 제어 재귀 평균 (improved minima controlled recursive averaging, IMCRA) 알고리즘과 로그 최소값 평균 제곱 오차 (log minimum mean square error, logMMSE)를 기반으로 한 저연산 음성 향상 알고리즘을 제안한다. IMCRA 알고리즘은 버퍼를 이용하여 일정 구간에서 입력 신호 전력의 최소값을 추적하고 최소값과 입력 신호의 비율을 통해 음성 존재를 확인한다. 이러한 과정에서 많은 연산이 필요하며 연산량을 줄이기 위해서 음성 존재 확률을 기반으로한 주파수 밴드별 시변 스무딩으로 최소값을 추적한다. 제안된 알고리즘은 0dB, 5dB, 10dB 그리고 15dB 신호 대 잡음비에서 평균 2.778%, 3.481%, 2.980% 그리고 2.162% 음성 품질이 향상되었으며, 평균 9.570% 연산량이 감소한 것을 확인하였다.