Analysis of Eigenvalues of Covariance Matrices of Speech Signals in Frequency Domain for Various Bands

음성 신호의 주파수 영역에서의 주파수 대역별 공분산 행렬의 고유값 분석

  • Published : 2016.05.25


Speech Signals consist of signals of consonants and vowels, but the lasting time of vowels is much longer than that of consonants. It can be assumed that the correlations between signal blocks in speech signal is very high. But the correlations between signal blocks in various frequency bands can be quite different. Each speech signal is divided into blocks which have 128 speech data. FFT is applied to each block. Various frequency areas of the results of FFT are taken and Covariance matrix between blocks in a speech signal is extracted and finally eigenvalues of those matrix are obtained. It is studied that in the eigenvalues of various frequency bands which band can be used to get more reliable result.

음성 신호는 자음 신호와 모음 신호의 결합으로 이루어져 있지만 그 특성상 자음보다는 모음 신호의 지속시간이 길다. 따라서 전체적으로 음성 신호 블록들 사이의 상관관계가 상당히 크다고 간주할 수 있다. 하지만 같은 음성 신호 내에서도 주파수 대역별로 그 상관관계가 다르게 나타난다. 음성신호를 128개의 데이터를 갖는 블록들로 나눈 후 각 블록의 FFT를 구한다. 여러 주파수 대역별 FFT 값으로 부터 이웃 블록들과의 공분산 행렬을 구하고 이 행렬로부터 고유값을 계산해 낸다. 이중 첫 번 째 고유값은 주성분과 관련이 있다. 다양한 주파수 대역별로 주성분을 구한 후 이 주성분의 값들이 대역별로 어떻게 나타나는지 그 분포를 알아보고 어떤 대역의 공분산 행렬의 고유값을 선택해야 더 안정적인 결과를 얻을 수 있을지 분석한다.
