Processing of Morphological Transformation for Korean Continuous Speech Recognition

한국어 연속음성 인식을 위한 형태론적 변형 처리

  • Published : 2003.04.01

Abstract

한국어는 형태론적 변형 현상이 자주 일어나게 되어 최종적으로 음성인식의 성능에 졸지 않은 영향을 끼친다. 본 논문에서는 연속음성 인식의 성능 개선을 위해 형태론적 변형을 처리하는 방법을 제시하고 짧은 형태소를 결합하여 의사형태소를 추출하고자 한다. 이 방법은 음성인식의 성능 개선을 위하여 품사세트와 사전을 다시 정의하고 텍스트 정규화를 수행한다. 그리고 불규칙 용언 처리의 규칙을 작성하고 나머지 형태론적 변형현상은 에러 패턴을 분석하여 빈출 어휘 중심 및 다단계로 규칙 처리하였다. 마지막으로, 단음절 형태소들을 결합함으로써 최종적으로 원하는 의사형태소를 구할 수 있었다. 제안된 시스템은 오 인식률이 높은 단음절 형태소들을 결합하여 성능 향상이 기대됨은 물론, 형태론적 변형현상에서는. 9~10%의 높은 성능 향상을 가져올 수 있었다.

Keywords