An Endpoint Detection Algorithm for Noise Speech using Band Energy

대역에너지를 이용한 잡음음성의 끝점검출 알고리즘

  • Park Ki-Sang (Department of Information and Communication Eng., Yeungnam University) ;
  • Suk Su-Young (Department of Information and Communication Eng., Yeungnam University) ;
  • Jung Ho-Youl (Department of Information and Communication Eng., Yeungnam University) ;
  • Chung Hyun-Yeol (Department of Information and Communication Eng., Yeungnam University)
  • 박기상 (영남대학교 대학원 정보통신공학과) ;
  • 석수영 (영남대학교 대학원 정보통신공학과) ;
  • 정호열 (영남대학교 대학원 정보통신공학과) ;
  • 정현열 (영남대학교 대학원 정보통신공학과)
  • Published : 2002.07.01

Abstract

음성인식 시스템의 실용화를 위해서 우선적으로 해결되어야 될 문제중 하나로 잡음환경하에서의 끝점검출을 들 수 있다. 잡음이 존재하지 않는 환경에서는 기존의 에너지 파라미터만으로도 어느정도 신뢰성있는 끝점 구간을 검출할 수 있으나 도심 소음과 같은 실제 잡음환경하에서는 대부분 좋지 않은 결과를 보인다. 본 논문에서는 도심환경의 배경잡음을 제거하는 방법으로 입력되는 음성에 대하여 주변소음에 의해 손상된 음성스펙트럼의 크기 성분만을 제거하는 전처리 기법인 Bark scale에 기반한 스펙트럼 차감법을 사용하고, 인간의 청각특성을 고려하여 음성의 주파수 대역을 3개의 대역으로 분리한 후, 대역별로 세밀한 에너지 문턱치값을 설정하여 음성의 끝점을 탐색하는 방법을 제안한다. 제안한 방법의 유효성을 확인하기 위해 실제 사무실 및 지하철역 등의 잡음환경하에서 녹음된 데이터베이스를 이용하여 끝점검출을 수행한 결과 기존의 에너지와 영교차율을 이용한 방법에 비해 평균 $46\%$의 오차율 감소와 대역에너지만을 사용한 경우에 비해 평균 $17\%$의 오차율 감소를 나타내어 제안한 방법의 유효성을 확인할 수 있었다.

Keywords