Improving the Performance of a Speech Recognition System in a Vehicle by Distinguishing Male/Female Voice

성별 구별방법에 의한 자동차 내 음성 인식 성능 향상

  • Published : 2000.12.01

Abstract

본 논문은 주행중인 자동차 환경에서 운전자의 안전성 및 편의성의 동시 확보를 위하여, 보조적인 스위치 조작 없이 상시 음성의 입, 출력이 가능한 시스템을 제안하였다. 이대 잡음에 강인한 threshold 값을 구하기 위하여, 1.5초마다 기준 에너지와 영 교차율을 변경하였으며 대역 통과 여과기를 이용하여 1차, 2차로 나누어 실시간 상태에서 자동으로, 정확하게 끝점 검출을 처리하였다. 또한 남성, 여성을 피치검출로 구분하여 모델을 선택하게 하였고, 주행중인 자동차 속도에 따라 가장 적합한 모델을 사용하기 위하여 Idle-40km, 40-80km, 80-100km로 구분하여 남성, 여성 모델을 각각 구분하여 인식할 수 있게 하였다. 그리고, 음성의 특징 벡터와 인식 알고리즘은 PLP 13차와 OSDP(one-Stage Dynamic Programming)을 사용하였다. 본 실험은 서울시내 도로 및 내부 순환도로에서 각각 속도별로 구분하여 화자독립 인식 실험을 한 결과 40-80km 상태에서 남자는 96.8%, 여자는 95.1%, 80-100km 상태에서는 남자 91.6%, 여자는 90.6%의 인식결과를 얻을 수 있었고, 화자종속 인식실험 결과 40-80km 상태에서 남자는 98%, 여자는 96%, 80-100km 상태에서는 남자는 96%, 여자는 94%의 높은 인식률을 얻었으므로, system의 유효성을 입증하였다.

Keywords

References

  1. 이기철, '차량소음에 강한 고립단어 음성인식에 관한 연구', MS Thesis, KAIST, 1995
  2. A. Noll, 'Problem of Speech Recognition in Mobile Environments,' ICSLP90, Vol.2, pp.1133-1136, 1990
  3. Chafic MOKBEL, Ge'rard CHOLLET, 'An Improved Noise Compensation Algorithm for Word Recognition in the Car,' ICASSP91, Vol.2, pp.925-928, May 14-17
  4. L.R. Rabiner, M. R. Sambur, 'An Algorithm for Determining the Endpoints of Isoated Utterances,' The Bell System Technical Journal, Vol.54, No.2, PP.297-315, Feb. 1975
  5. L.R. Rabiner, 'On the use of Autocorrelation Analysis for Pitch Detection,' J. Acoust., Speech, Signal processing, Vol. ASSP-25, pp.24-33, Feb. 1977
  6. H. Herrnanskv, 'Perceptual Linear Predictive (PLP) Analysis of Speech,' J. Acoust. Soc. Am. 87(4), pp.1738-1752, Apr. 1990
  7. H. Ney, 'The Use of a One-Stage Dynamic Programming Algorithm for Connected Word Recognition,' IEEE Transaction on Acoustics, Speech, and Signal Processing, Vol. ASSP-32, No.2, pp.263-271 Apr. 1984 https://doi.org/10.1109/TASSP.1984.1164320
  8. 변용규, 'DMS 모델을 이용한 단독어 인식에 관한 연구' 박사학위 논문, 광운대학교, 1990, 12
  9. L.R. Rabiner, B.H. Juang, 'Fundamentals of Speech Recognition,' Prentice Hall, 1993
  10. H.G. Hirsch, P. Meyer and H.W. Ruehl, 'Improved Speech Recognition Using High-Pass filtering of Subband Envelopes,' EUROSPEECH91, Vol.2, pp.413-416, Sep. 1991
  11. P. Lockwood, C. Baiilargeat, J.M. Gillot, J. Boudy, G. Faucon, 'Noise Reduction for Speech Enhancement in Cars: Non-Linear Spectrl Subtraction/ Kalman Filtering,' EUROSPEECH91, pp, 83-86, Vol.1, Sep. 1991
  12. L.R. Rabiner, M.R. Sarnbur, 'An Algorithm for Determining the EndPoints of Isolated Utterances,' The Bell System Technical Journal, Vol.54, No.2, pp.297-315, Feb. 1975
  13. 배명진, 이상효 '디지탈 음성분석,' 동영출판사. 1998
  14. 이정기,남동선,양진우,김순협 '실시간 윈도우 환경에서 DMS모델을 이용한 자동 음성 제어 시스템에 관한 연구', 한국음향학회지, 19권 3호,pp.51-56,Apr 2000
  15. 양진우,김순협 '주행중인 자동차 환경에서의 음성인식 연구' 한국음향학회지,19권 5호,pp.3-8,July 2000