Speech Recognition in Noise Environments Using SPLICE with Phonetic Information

Kim Doo Hee;Kim Hyung Soon;

Proceedings of the Acoustical Society of Korea Conference (한국음향학회:학술대회논문집)

spring
/
Pages.83-86
/
2002

The Acoustical Society of Korea (한국음향학회)

Speech Recognition in Noise Environments Using SPLICE with Phonetic Information

음성학적인 정보를 포함한 SPLICE를 이용한 잡음환경에서의 음성인식

Kim Doo Hee (Dept. of Electronics Engineering, Pusan National University) ;
Kim Hyung Soon (Dept. of Electronics Engineering, Pusan National University)

김두희 (부산대학교 전자공학과) ;
김형순 (부산대학교 전자공학과)

Published : 2002.07.01

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

훈련과정과 인식과정에서의 주변환경 잡음과 채널 특성 등의 불일치는 음성인식 성능을 급격히 저하시킨다. 이러한 불일치를 보상하기 위해서 켑스트럼 영역에서의 다양한 전처리 방법이 시도되고 있으며 최근에는 stereo 데이터와 잡음 음성의 Gaussian Mixture Model (GMM)을 이용해 보상벡터를 구하는 SPLICE 방법이 좋은 결과를 보이고 있다(1). 기존의 SPLICE가 전체 발성에 대해서 음향학적인 정보만으로 Gaussian 모델을 구하는 반면 본 논문에서는 발성에 해당하는 음소정보를 고려하여 전체 음향 공간을 각 음소에 대해 나누어서 모델링하고 각 음소에 대한 Gaussian 모델과 그 음소에 해당하는 음성데이터만을 이용하여 음소별 보상벡터가 훈련되도록 하였다. 이 경우 보상벡터는 잡음이 각 음소에 미치는 영향을 보다 자세히 나타내게 된다. Aurora 2 데이터베이스를 이용한 실험결과, 제안된 방법이 기존의 SPLICE방법에 비해 성능향상을 보였다.

Proceedings of the Acoustical Society of Korea Conference (한국음향학회:학술대회논문집)

Speech Recognition in Noise Environments Using SPLICE with Phonetic Information

음성학적인 정보를 포함한 SPLICE를 이용한 잡음환경에서의 음성인식

Abstract

Keywords

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)