Merging Context Information and Recognition Result for Robust Speech Recognition in Noisy Environments

Song, Won-Moon;Kim, Eun-Ju;Kim, Myung-Won;

한국정보과학회:학술대회논문집 (Proceedings of the Korean Information Science Society Conference)

한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
/
Pages.733-735
/
2005
/
1598-5164(pISSN)

한국정보과학회 (Korean Institute of Information Scientists and Engineers)

잡음 환경에서의 강인한 음성인식을 위한 문맥 정보와 음성인식 결과의 융합

Merging Context Information and Recognition Result for Robust Speech Recognition in Noisy Environments

송원문 (숭실대학교 컴퓨터학부) ;
김은주 (숭실대학교 컴퓨터학부) ;
김명원 (숭실대학교 컴퓨터학부)

Song, Won-Moon (School of Computing, Soongsil University) ;
Kim, Eun-Ju (School of Computing, Soongsil University) ;
Kim, Myung-Won (School of Computing, Soongsil University)

발행 : 2005.11.01

PDF

PDF 다운로드

⟨ 이전 논문 다음 논문 ⟩

초록

최근 음성인식 분야 에서는 잡음 환경에서 좀 더 신뢰도 높은 음성 인식 결과물 얻기 위하여 인식 결과 도출 단계에서 여러 가지 정보를 융합 하는 방법이나 인식결과를 후처리 하여 새로운 결과를 얻어 내는 방법들이 연구 되고 있다. 본 논문에서는 개인 모바일 기기에서의 음성 인식 환경에서 사용자의 발화 패턴 정보를 가지는 문맥 정보를 활용함으로서 잡음 환경에서의 음성 정보 손실에 따른 인식률 하락을 보완하는 방법을 제안한다. 먼저 사용자의 기기 사용 로그나 발화 로그 정보로부터 특정 명령어들의 순차적 발화 패턴을 마이닝하여 문맥 정보를 구성한다. 이 후 음성 발화시에 인식기의 최종 인식 결과에 대한 신뢰도가 떨어진다고 판단될 때 앞서 얻어진 문맥 정보의 신뢰도를 인식기의 각 후보단어들의 인식률과 융합하여 새로운 인식 결과를 도출해 낸다. 이러한 과정에서 인식기 결과에 대한 신뢰성을 판단하는 기준을 실험을 통하여 결정 하였으며 신뢰성이 기준 이하일 경우의 융합 과정을 위하여 후보 단어 인식률과 문맥정보를 적절히 융합할 수 있는 방법을 제안한다.

한국정보과학회:학술대회논문집 (Proceedings of the Korean Information Science Society Conference)

잡음 환경에서의 강인한 음성인식을 위한 문맥 정보와 음성인식 결과의 융합

Merging Context Information and Recognition Result for Robust Speech Recognition in Noisy Environments

초록

키워드

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)