• Title/Summary/Keyword: 보상인식

Search Result 440, Processing Time 0.03 seconds

Speech enhancement method based on feature compensation gain for effective speech recognition in noisy environments (잡음 환경에 효과적인 음성인식을 위한 특징 보상 이득 기반의 음성 향상 기법)

  • Bae, Ara;Kim, Wooil
    • The Journal of the Acoustical Society of Korea
    • /
    • v.38 no.1
    • /
    • pp.51-55
    • /
    • 2019
  • This paper proposes a speech enhancement method utilizing the feature compensation gain for robust speech recognition performances in noisy environments. In this paper we propose a speech enhancement method utilizing the feature compensation gain which is obtained from the PCGMM (Parallel Combined Gaussian Mixture Model)-based feature compensation method employing variational model composition. The experimental results show that the proposed method significantly outperforms the conventional front-end algorithms and our previous research over various background noise types and SNR (Signal to Noise Ratio) conditions in mismatched ASR (Automatic Speech Recognition) system condition. The computation complexity is significantly reduced by employing the noise model selection technique with maintaining the speech recognition performance at a similar level.

Pre-Processing for Performance Enhancement of Speech Recognition in Digital Communication Systems (디지털 통신 시스템에서의 음성 인식 성능 향상을 위한 전처리 기술)

  • Seo, Jin-Ho;Park, Ho-Chong
    • The Journal of the Acoustical Society of Korea
    • /
    • v.24 no.7
    • /
    • pp.416-422
    • /
    • 2005
  • Speech recognition in digital communication systems has very low performance due to the spectral distortion caused by speech codecs. In this paper, the spectral distortion by speech codecs is analyzed and a pre-processing method which compensates for the spectral distortion is proposed for performance enhancement of speech recognition. Three standard speech codecs. IS-127 EVRC. ITU G.729 CS-ACELP and IS-96 QCELP. are considered for algorithm development and evaluation, and a single method which can be applied commonly to all codecs is developed. The performance of the proposed method is evaluated for three codecs, and by using the speech features extracted from the compensated spectrum. the recognition rate is improved by the maximum of $15.6\%$ compared with that using the degraded speech features.

A Compensation of the Duration Bounds According to Speaking Speed (발음 속도에 따른 지속시간 제한 값의 보상)

  • Yang Tae-Young;Lee Chungyong;Youn Dae Hee;Cha Il-Whan
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.193-196
    • /
    • 2000
  • 본 논문에서는 제한 지속시간 모델링(bounded duration modeling)의 지속시간 제한 값(duration bound)을 화자의 발음 속도에 따라 조절해주는 발음 속도 보상 알고리즘을 제안한다. 제안된 알고리즘은 두 번의 인식 과정을 수행하는데, 1차 인식 과정은 화자의 발음 속도를 추정하기 위한 과정이고, 2차 인식 과정이 인식 결과를 얻기 위한 과정이다. 1차 인식 과정에서 추정된 화자의 발음 속도에 따라, 지속시간 제한 값을 증가, 또는 감소시킨 후, 2차 인식과정에 사용한다. 제안된 알고리즘은 CHMM 기반의 한국어 연결 숫자음 인식 시스템에 적용되었으며, KAIST에서 제작된 4-7자리 연결 숫자음 데이터베이스인 DigitDB를 대상으로 성능을 평가하였다. 인식 실험 결과, 제안된 발음 속도 보상 알고리즘이 적용된 인식 시스템에서는 $96.26\% 단어 인식률을 얻어, 제안된 알고리즘이 적용되지 않은 인식 시스템의 $94.72\%보다 $1.54\% 향상된 인식 성능을 얻을 수 있었다.

  • PDF

A Spectral Compensation Method for Noise Robust Speech Recognition (잡음에 강인한 음성인식을 위한 스펙트럼 보상 방법)

  • Cho, Jung-Ho
    • 전자공학회논문지 IE
    • /
    • v.49 no.2
    • /
    • pp.9-17
    • /
    • 2012
  • One of the problems on the application of the speech recognition system in the real world is the degradation of the performance by acoustical distortions. The most important source of acoustical distortion is the additive noise. This paper describes a spectral compensation technique based on a spectral peak enhancement scheme followed by an efficient noise subtraction scheme for noise robust speech recognition. The proposed methods emphasize the formant structure and compensate the spectral tilt of the speech spectrum while maintaining broad-bandwidth spectral components. The recognition experiments was conducted using noisy speech corrupted by white Gaussian noise, car noise, babble noise or subway noise. The new technique reduced the average error rate slightly under high SNR(Signal to Noise Ratio) environment, and significantly reduced the average error rate by 1/2 under low SNR(10 dB) environment when compared with the case of without spectral compensations.

Speech Recognition in Noise Environments Using SPLICE with Phonetic Information (음성학적인 정보를 포함한 SPLICE를 이용한 잡음환경에서의 음성인식)

  • Kim Doo Hee;Kim Hyung Soon
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.83-86
    • /
    • 2002
  • 훈련과정과 인식과정에서의 주변환경 잡음과 채널 특성 등의 불일치는 음성인식 성능을 급격히 저하시킨다. 이러한 불일치를 보상하기 위해서 켑스트럼 영역에서의 다양한 전처리 방법이 시도되고 있으며 최근에는 stereo 데이터와 잡음 음성의 Gaussian Mixture Model (GMM)을 이용해 보상벡터를 구하는 SPLICE 방법이 좋은 결과를 보이고 있다(1). 기존의 SPLICE가 전체 발성에 대해서 음향학적인 정보만으로 Gaussian 모델을 구하는 반면 본 논문에서는 발성에 해당하는 음소정보를 고려하여 전체 음향 공간을 각 음소에 대해 나누어서 모델링하고 각 음소에 대한 Gaussian 모델과 그 음소에 해당하는 음성데이터만을 이용하여 음소별 보상벡터가 훈련되도록 하였다. 이 경우 보상벡터는 잡음이 각 음소에 미치는 영향을 보다 자세히 나타내게 된다. Aurora 2 데이터베이스를 이용한 실험결과, 제안된 방법이 기존의 SPLICE방법에 비해 성능향상을 보였다.

  • PDF

A Noise Robust Speech Recognition Method Using Model Compensation Based on Speech Enhancement (음성 개선 기반의 모델 보상 기법을 이용한 강인한 잡음 음성 인식)

  • Shen, Guang-Hu;Jung, Ho-Youl;Chung, Hyun-Yeol
    • The Journal of the Acoustical Society of Korea
    • /
    • v.27 no.4
    • /
    • pp.191-199
    • /
    • 2008
  • In this paper, we propose a MWF-PMC noise processing method which enhances the input speech by using Mel-warped Wiener Filtering (MWF) at pre-processing stage and compensates the recognition model by using PMC (Parallel Model Combination) at post-processing stage for speech recognition in noisy environments. The PMC uses the residual noise extracted from the silence region of enhanced speech at pre-processing stage to compensate the clean speech model and thus this method is considered to improve the performance of speech recognition in noisy environments. For recognition experiments we dew.-sampled KLE PBW (Phoneme Balanced Words) 452 word speech data to 8kHz and made 5 different SNR levels of noisy speech, i.e., 0dB. 5dB, 10dB, 15dB and 20dB, by adding Subway, Car and Exhibition noise to clean speech. From the recognition results, we could confirm the effectiveness of the proposed MWF-PMC method by obtaining the improved recognition performances over all compared with the existing combined methods.

A Study on Channel Mis-match Compensation Technique for Robust Speaker Verification System (강인한 화자확인 시스템을 위한 채널 불일치 보상 기법에 관한 연구)

  • 강철호;정희석
    • The Journal of the Acoustical Society of Korea
    • /
    • v.23 no.3
    • /
    • pp.228-234
    • /
    • 2004
  • In this paper, we proposed the compensation technique that overcomes the limitations of the conventional approaches through summing up the bias terms between world's codebook and individual codebook vectors of feature parameters. But, mean compensation without condition can bring higher false acceptance. Therefore, the proposed technique compensates the channel mis-match condition by weighted bias sum using nonlinear function regarding to the distortion between speech and silence. The simulation results show that the FRR (flase reject rate) is decreased 14.95% when the proposed algorithm was applied.

Channel Identification and Predistorter Design Using Stochastic Gradient Method (통계적 경사 근사법에 의한 채널 인식 및 전치 보상기의 설계)

  • 인민교;은창수;김용진
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.25 no.12B
    • /
    • pp.2060-2068
    • /
    • 2000
  • 이 논문은 선형 송·수신 필터의 메모리와 증폭기의 비선형성에 기인하는, 메모리 있는 비선형 시스템의 인식(identification)과 보상에 대해 다룬다. 이와 같은 비선형 시스템은 메모리가 있는 두 개의 선형 시스템 사이에 메모리 없는 비선형 시스템이 있는 것으로 모델링할 수 있으며, 통계적 경사 근사법(stochastic gradient method)으로 선형 시스템의 필터 계수와, 다항식으로 표현되는 비선형 시스템의 계수를 구한다. 이렇게 모델링 되는 통신 채널은 통계적 경사 근사법과 간접 학습 구조를 사용하여 전치 보상기를 설계함으로써 보상한다. 여기서 제시한 비선형 보상 방법은 특정한 통신 채널 모델이 필요 없으며, 적응적으로도 적용이 가능하다.

  • PDF

A Fuzzy-Compensative-Operator Based Information Fusion Method and Its Applications (퍼지보상 연산자를 이용한 정보융합 방법 및 응용)

  • 이준환;김찬성;엄경배
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.18 no.9
    • /
    • pp.1257-1268
    • /
    • 1993
  • 본 논문에서는 퍼지보상(compensative) 연산자를 이용하는 정보융합(information fusion) 방법을 제안하였다. 제안된 정보융합 방법에서는 보상적인 성질을 갖는 퍼지 총체화(aggregation) 연산자를 역오류전파(back-propagation)신경회로망의 활성화함수(activation function)로 간주하고, 이들 연산자에 수반된 파라메터들을 학습에 의해 결정한다. 결정된 연산자의 파라메터들은 학습자료에 나타난 의사 결정에 수반된 보상도를 표현할 수 있으며, 평가에 불필요한 정보원을 제거하는 성질도 가지고 있다. 제안된 정보융합 구조는 평가지수(sub-criterion)들의 만족도를 입력으로 학습에 의해 결정된 보상연산자에 의해 총체화된 만족도를 제공한다. 제안된 방법은 패턴 인식 문제와 칼라영상의 분할과 인식등 컴퓨터비죤 문제에 적용하여 그 정당성을 입증하였다.

  • PDF