Postprocessing of A Speech Recognition using the Morphological Anlaysis Technique

형태소 분석 기법을 이용한 음성 인식 후처리

  • 박미성 (정회원, 경북대학교 컴퓨터공학과) ;
  • 김미진 (정회원, 경북대학교 컴퓨터공학과) ;
  • 김계성 (정회원, 경북대학교 컴퓨터공학과) ;
  • 김성규 (정회원, 경북대학교 컴퓨터공학과) ;
  • 이문희 (정회원, 경북대학교 컴퓨터공학과) ;
  • 최재혁 (정회원, 신라대학교 컴퓨터교육과) ;
  • 이상조 (정회원, 경북대학교 컴퓨터공학과)
  • Published : 1999.04.01

Abstract

There are two problems which will be processed to graft a continuous speech recognition results into natural language processing technique. First, the speaking's unit isn't consistent with text's spacing unit. Second, when it is to be pronounced the phonological alternation phenomena occur inside morphemes or among morphemes. In this paper, we implement the postprocessing system of a continuous speech recognition that above all, solve two problems using the eo-jeol generator and syllable recoveror and morphologically analyze the generated results and then correct the failed results through the corrector. Our system experiments with two kinds of speech corpus, i.e., a primary school text book and editorial corpus. The successful percentage of the former is 93.72%, that of the latter is 92.26%. As results of experiment, we verified that our system is stable regardless the sorts of corpus.

연속 음성 인식 결과를 자연어 처리 기술과 접목시키기 위해 처리해야 할 두가지 문제점이 있다. 첫째는 말하는 단위와 문서의 띄어쓰기 단위가 일치하지 않는다는 것이고, 둘째는 발음시 형태소 내부 및 형태소 간에 음운 변동 현상이 생긴다는 것이다. 본 논문에서는 이 두가지 문제를 어절생성기와 음절복원기로 해결하고, 생성된 결과들을 형태소 분석하여 실패한 결과들은 교정기를 통해 교정하는 연속 음성 인식 후처리 시스템을 구현하였다. 제안한 시스템의 실험은 두 종류의 음성 말뭉치 ?, 교과서 음성 말뭉치와 사설 음성 말뭉치를 대항으로 수행하였다. 각 말뭉치에 대한 성공률은 각각 93.72%, 92.26% 였고, 이 실험으로 제안한 시스템은 음성 말뭉치의 종류에 민감하지 않는 안정된 시스템임을 알 수 있었다.

Keywords