기저막 특성을 이용한 새로운 음성 특징 추출 및 성능 분석

Performance of analysis and extraction of speech feature using characteristics of basilar membrane

  • 이철희 (전북대학교 전자정보공학부) ;
  • 신유식 (전북대학교 전자정보공학부) ;
  • 정성환 (전북대학교 전자정보공학부) ;
  • 김종교 (전북대학교 전자정보공학부)
  • 발행 : 2000.09.01

초록

본 논문에서는 음성 인식률 향상을 위한 여러 가지방법들 중에서 음성특징 파라미터 추출 방법에 관한 한가지 방법을 제시하였다. 본 논문에서는 청각 특성을 기반으로 한 MFCC(met frequency cepstrum coef-ficients)와 성능 향상을 위한 방법으로 GFCC (gamma-tone filter frequency cepstrum coefficients)를 제시하고 음성 인식을 수행하여 성능을 분석하였다. MFCC에서 일반적으로 사용하는 임계 대역 필터로 삼각 필터(triangular filter) 대신 청각 구조의 기저막(basilar membrane)특성을 묘사한 gammatone 대역 통과 필터를 이용하여 특징 파라미터를 추출하였다. DTW 알고리즘으로 인식률을 분석한 결과 삼각 대역 필터를 이용한 것보다 gammatone 대역 통과 필터를 이용한 추출법이 약 2∼3%의 성능 향상을 보였다.

키워드