음성인식을 위한 알고리즘에 관한 연구

A study on the algorithm for speech recognition

  • 김선철 (한국기술교육대학교 정보기술공학부 전기공학과) ;
  • 이정우 (한국기술교육대학교 정보기술공학부 전기공학과) ;
  • 조규옥 (한국기술교육대학교 정보기술공학부 전기공학과) ;
  • 박재균 (한국기술교육대학교 정보기술공학부 전기공학과) ;
  • 오용택 (한국기술교육대학교 정보기술공학부 전기공학과)
  • 발행 : 2008.07.16

초록

음성인식 시스템을 설계함에 있어서는 대표적으로 사람의 성도 특성을 모방한 LPC(Linear Predict Cording)방식과 청각 특성을 고려한 MFCC(Mel-Frequency Cepstral Coefficients)방식이 있다. 본 논문에서는 MFCC를 통해 특징파라미터를 추출하고 해당 영역에서의 수행된 작업을 매틀랩 알고리즘을 이용하여 그래프로 시현하였다. MFCC 방식의 추출과정은 최초의 음성신호로부터 전처리과정을 통해 아날로그 신호를 디지털 신호로 변환하고, 잡음부분을 최소화하며, 음성 부분을 강조한다. 이 신호는 다시 Windowing을 통해 음성의 불연속을 제거해 주고, FFT를 통해 시간의 영역을 주파수의 영역으로 변환한다. 이 변환된 신호는 Filter Bank를 거쳐 다수의 복잡한 신호를 몇 개의 간단한 신호로 간소화 할 수 있으며, 마지막으로 Mel-cepstrum을 통해 최종적으로 특징 파라미터를 얻고자 하였다.

키워드