Performance Comparison of Filler Models and Word Spotting Ratio for Sentence Rejection in Phoneme-based Recognition Networks

문장 거부를 위한 음소기반 인식 네트워크에서의 필러 모델 비율과 단어 검출률의 성능비교

  • Kim Hyung-Tai (Dept. of Computer and Information Communication Engineering, Kangwon National Univ.) ;
  • Lee Byung-Hyuk (Dept. of Computer and Information Communication Engineering, Kangwon National Univ.) ;
  • Ha Jin-Young (Dept. of Electrical and Computer Engineering, Kangwon National Univ.)
  • 김형태 (강원대학교 컴퓨터정보통신공학과) ;
  • 이병혁 (강원대학교 컴퓨터정보통신공학과) ;
  • 하진영 (강원대학교 전기전자정보통신공학부)
  • Published : 2005.07.01

Abstract

음성인식 시스템에서 입력된 음성 데이터에 대해 비인식 대상을 거부하는 기능은 신뢰도 보장 측면에 있어서 상당히 중요하며, 신뢰도를 높이기 위해서는 단순한 인식기능 외에 부적절한 입력 패턴의 거부 기능이 필요하다. 본 논문에서는 이러한 신뢰성 문제를 해결하기 위하여 음소기반 인식 네트워크에서 필러 모델 방법과 단어 검출률 방법을 사용하여 실험하였고, 문장의 단어 수에 따른 두 방법의 문장 거부 성능을 FAR과 FRR의 평균을 최소화 하는 값을 각각 구함으로써 비교${\cdot}$분석 하였다. 그 결과 필러모델 방법이 좀 더 나은 거부 성능을 보였고, 단어 검출률을 이용하는 방법이 인식 네트워크를 전부 거치지 않아도 되므로 실행속도와 메모리 절약에서 효과적이었다.

Keywords