한국정보과학회:학술대회논문집 (Proceedings of the Korean Information Science Society Conference)
- 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
- /
- Pages.25-27
- /
- 2006
- /
- 1598-5164(pISSN)
음성 인식 후처리를 위한 띄어쓰기 오류의 교정
Word Spacing Error Correction for the Postprocessing of Speech Recognition
- Lim Dong-Hee (Dept. of Computer Science, Kookmin University) ;
- Kang Seung-Shik (Dept. of Computer Science, Kookmin University) ;
- Chang Du-Seong (Advanced Technology Lab., KT)
- 발행 : 2006.06.01
초록
음성인식 결과는 띄어쓰기 오류가 포함되어 있으며 이는 인식 결과에 대한 이후의 정보처리를 어렵게 하는 요인이 된다. 본 논문은 음성 인식 결과의 띄어쓰기 오류를 수정하기 위하여 품사 정보를 이용한 어절 재결합 기법을 기본 알고리즘으로 사용하고 추가로 음절 바이그램 및 4-gram 정보를 이용하는 띄어쓰기 오류 교정 방법을 제안하였다. 또한, 음성인식기의 출력으로 품사 정보가 부착된 경우와 미부착된 경우에 대한 비교 실험을 하였다. 품사 미부착된 경우에는 사전을 이용하여 품사 정보를 복원하였으며 N-gram 통계 정보를 적용했을 때 기본적인 어절 재결합 알고리즘만을 사용 경우보다 띄어쓰기 정확도가 향상되는 것을 확인하였다.
키워드