Feature Extraction from the Strange Attractor for Speaker Recognition

화자인식을 위한 어트랙터로 부터의 음성특징추출

  • Kim, Tae-Sik (Dept. of Computer Science, Keimyung University)
  • Published : 1994.01.01

Abstract

A new feature extraction technique utilizing strange attractor and artificial neural network for speaker recognition is presented. Since many signals change their characteristics over long periods of time, simple time-domain processing techniques should e capable of providing useful information of signal features. In many cases, normal time series can be viewed as a dynamical system with a low-dimensional attractor that can be reconstructed from the time series using time delay. The reconstruction of strange attractor is described. In the technique, the raw signal will be reproduced into a geometric three dimensional attractor. Classification decision for speaker recognition is based upon the processing or sets of feature vectors that are derived from the attractor. Three different methods for feature extraction will be discussed. The methods include box-counting dimension, natural measure with regular hexahedron and plank-type box. An artificial neural network is designed for training the feature data generated by the method. The recognition rates are about 82%-96% depending on the extraction method.

화자인식을 위한 음성특징을 카오스의 어트랙터와 신경망를 이용해서 추출하는 방법을 제시한다. 기존의 음성신호 표현방법과 특징 추출법은 음성인식 시스템에서 별 무리가 없이 사용되었으나 2차원 표현에서 오는 한계는 아직까지 극복해야할 과제로 남아있다. 본 연구에서는 최근 각광받고있는 새로운 시그날표현기법인 카오스이론이 스트레인저 어트랙터를 이용하여 음성특징을 추출하는 화자인식시스템에 적용하고자 한다. 입력된 음성신호는 3차원 공간안에서 어트랙터라 불리우는 기하학적인 형태로 표현되는데 이 3차원 어트랙터를 이용하면 기존의 2차원적인 표현으로부터 얻는 특징보다 더 많은 정보를 추출할 수 있을 것이다. 특징추출 기법은 3가지를 제안하였고 각 기법으로 추출된 특징벡터는 신경회로망을 통해 학습되어 인식률을 실험하였다. 제시한 기법들에 따라 다르나 인식률은 약 82%부터 96%까지 나타났다.

Keywords