Phonetic Tied-Mixture Syllable Model for CSR

Kim Bong-Wan;Lee Yong-Ju;

한국음향학회:학술대회논문집 (Proceedings of the Acoustical Society of Korea Conference)

한국음향학회 (The Acoustical Society of Korea)

연속 음성 인식을 위한 PTM 음절 모델

Phonetic Tied-Mixture Syllable Model for CSR

김봉완 (원광대학교 SiTEC, 원광대학교 전기, 전자 및 정보공학부) ;
이용주 (원광대학교 SiTEC, 원광대학교 전기, 전자 및 정보공학부)

Kim Bong-Wan (SiTEC, Wonkwang Univ.) ;
Lee Yong-Ju (SiTEC, Wonkwang Univ.)

발행 : 2004.05.01

PDF

PDF 다운로드

⟨ 이전 논문 다음 논문 ⟩

초록

최근 연속 음성 인식에서의 성능 향상을 위하여 음절을 인식 단위로 사용하고자 하는 노력들이 보고되고 있다. 그러나 음절의 경우 음소에 비해 학습성이 좋지 않고 모델의 수가 많으므로 음절 경계에서의 문맥 종속 모델링이 어렵다는 단점을 갖고 있다. 본 논문에서는 음절의 이러한 단점을 극복하기 위하여 모노폰과 트라이폰을 이용하여 음절 모델을 합성하는 방법을 제안한다. 제안된 모델은 트라이폰에 비하여 평균 $55\%$, PTM에 비하여 평균 $13\%$의 인식 속도 향상을 보이며, 동일한 속도일 경우 PTM, 트라이폰 모델 모두에 대하여 ERR이 약$8\%$ 향상됨을 볼 수 있었다.

한국음향학회:학술대회논문집 (Proceedings of the Acoustical Society of Korea Conference)

연속 음성 인식을 위한 PTM 음절 모델

Phonetic Tied-Mixture Syllable Model for CSR

초록

키워드

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)