Korean Word Recognition using the Transition Matrix of VQ-Code and DHMM

VQ코드의 천이 행렬과 이산 HMM을 이용한 한국어 단어인식

  • Published : 1994.08.01

Abstract

In this paper, we propose methods for improving the performance of word recognition system. The ray stratey of the first method is to apply the inertia to the feature vector sequences of speech signal to stabilize the transitions between VQ cdoes. The second method is generating the new observation probabilities using the transition matrix of VQ codes as weights at the observation probability of the output symbol, so as to take into account the time relation between neighboring frames in DHMM. By applying the inertia to the feature vector sequences, we can reduce the overlapping of probability distribution of the response paths for each word and stabilize state transitions in the HMM. By using the transition matrix of VQ codes as weights in conventional DHMM. we can divide the probability distribution of feature vectors more and more, and restrict the feature distribution to a suitable region so that the performance of recognition system can improve. To evaluate the performance of the proposed methods, we carried out experiments for 50 DDD area names. As a result, the proposed methods improved the recognition rate by $4.2\%$ in the speaker-dependent test and $12.45\%$ in the speaker-independent test, respectively, compared with the conventional DHMM.

본 논문에서는 단어 인식 시스템의 성능 개선을 위하여 다음과 같은 두가지 방법을 제안한다. 첫번째 방법은 VQ 코드간의 천이를 안정화시키기 위하여 음성신호의 특징벡터 시퀀스에 관성을 적용하는 방법이고, 두번째 방법은 이산 HMM 모델에서 인접 프레임 간의 시간 상관성을 고려하기 위하여 VQ 코드의 천이행렬을 출력 심벌의 관측확률에 가중치로 이용하여 새로운 관측확률을 발생하는 방법이다. 특징벡터 시퀀스에 관성을 도입함으로서, SOFM상의 각 단어에 대한 반응경로에서 확률분포가 중첩되는 것을 억제하여 HMM의 상태천이를 안정화 시킬 수 있다. 기존의 이산 HMM에 VQ 코드의 천이행렬을 가중치로 적용함으로써, 특징벡터의 확률분포를 더욱 세분화하고, 특징분포를 적당한 영역으로 제한함으로써 인식시스템의 성능을 개선할 수 있다. 제안한 방법을 평가하기 위하여 50개의 DDD 지역명을 대상으로 인식 실험을 수행하였다. 실험 결과에 의하면, 제안된 방법이 기존의 HMM 모델에 비해 화자종속 실험에서는 $4.2\%$의 인식률 향상과 화자 독립 실험에서는 $12.45\%$의 인식률 향상을 얻을 수 있었다.

Keywords