A Study on Korean 4-connected Digit Recognition Using Demi-syllable Context-dependent Models

반음절 문맥종속 모델을 이용한 한국어 4 연숫자음 인식에 관한 연구

  • 이기영 (관동대학교 정보통신공학과) ;
  • 최성호 (관동대학교 정보통신공학과) ;
  • 이호영 (서울대학교 언어학과) ;
  • 배명진 (숭실대학교 정보통신공학과)
  • Published : 2003.04.01

Abstract

Because a word of Korean digits is a syllable and deeply coarticulatied in connected digits, some recognition models based on demisyllables have been proposed by researchers. However, they could not show an excellent recognition results yet. This paper proposes a recognition model based on extended and context-dependent demisyllables, such as a tri-demisyllable like a tri-phone, for the Korean 4-connected digits recognition. For experiments, we use a toolkit of HTK 3.0 for building this model of continuous HMMs using training Korean connected digits from SiTEC database and for recognizing unknown ones. The results show that the recognition rate is 92% and this model has an ability to improve the recognition performance of Korean connected digits.

한국어 숫자음은 단음절이며 연결된 숫자음 사이에 연음현상의 영향 때문에 한국어 연결 숫자음의 인식방법으로 반음절에 기반한 모델들이 제시되어 왔다. 기존에 제안된 반음절이나 반음절+반음절의 인식모델을 이용한 방법에서는 아직까지 우수한 인식성능을 보이지 못하고 있다. 본 논문에서는 확장된 문맥종속 반음절 모델을 이용한 한국어 4 연숫자음 인식방법을 제안한다. 실험에서 연결숫자음은 SiTEC의 4 연숫자음 데이터 베이스를 사용하였으며 학습과 인식방법으로는 HTK 3.0의 C-HMM을 이용하였다. 기존의 방법들과 인식율을 비교해 본 결과, 92%의 비교적 우수한 인식성능을 보였다.

Keywords

References

  1. Proc. ICASSP v.1 The 1994 HTK large vocabulary speech recognition system P.C.Woodland;C.J.Leggetter;J.Odell;V.Valtchev;S.J.Young
  2. 한국음향학회지 v.14 no.5 HMM과 연결 숫자음의 후 처리를 이용한 음성 다이얼링에 관한 연구 양진우;김순혐
  3. Improvement in connected Digit Recognition Using Higher order Spectral and Energy J.G.Wilpon;L.R.Rabiner
  4. 한국음향학회지 v.17 no.5 반음절 단위 HMM을 이용한 연속 숫자 음성 인식 윤재선;홍광석
  5. 음성과학 v.8 no.4 반음절기반의 한국어 연속 숫자음 인식과 그 후처리에 대한 연구 정재부;정훈;정익주
  6. 제15회 음성통신 및 신호처리 워크샵 v.15 no.1 한국어 연결숫자인식을 위한 숫자 모델링에 관한 연구 김기성;김승희;김형순;지민제
  7. The HTK Book Version 3.0 Microsoft S.Young;D.Kershaw;J.Odell;D.Ollason;V.Valtchev;P.Woodland
  8. Proc. of the IEEE v.77 no.2 A tutorial on Hidden Markov Models and selected application in speech recognition L.R.Rabiner
  9. Technical report, Cambridge University Engineering Department Large Vocabulary Continuous Speech Recognition: a Review Young, Steve
  10. Robustness in Automatic Speech Recognition J.C.Junqua;J.P.Haton