Bimodal Speech Recognition Modeling Using Neural Networks

;;;;

한국정보과학회:학술대회논문집 (Proceedings of the Korean Information Science Society Conference)

한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
/
Pages.567-569
/
2003
/
1598-5164(pISSN)

한국정보과학회 (Korean Institute of Information Scientists and Engineers)

신경망을 이용한 이중모달 음성 인식 모델링

Bimodal Speech Recognition Modeling Using Neural Networks

류정우 (숭실대학교 컴퓨터학부) ;
성지애 (숭실대학교 컴퓨터학부) ;
이순신 (숭실대학교 컴퓨터학부) ;
김명원 (숭실대학교 컴퓨터학부)

발행 : 2003.04.01

PDF

PDF 다운로드

⟨ 이전 논문 다음 논문 ⟩

초록

최근 잡음환경에서 강인한 음성인식을 위해 음성 잡음에 영향을 받지 않은 영상정보를 이용한 이중모달 음성인식 연구가 활발히 진행되고 있다. 기존 음성인식기로 좋은 성능을 보이는 HMM은 이질적인 정보를 융합하는데 있어 많은 제약과 어려움을 가지고 있다. 하지만 신경망은 이질적인 정보를 효율적으로 융합할 수 있는 장점을 가지고 있으며 그에 대한 많은 연구가 수행되고 있다. 따라서 본 논문에서는 잡음환경에 강인한 이중모달 음성 인식 모델로 이중모달 신경망(BN-NN)을 제안한다. 이중모달 신경망은 특징융합 방법으로 음성정보와 영상정보를 융합하고 있으며. 입력정보의 특성을 고려하기 위해 윈도우와 중복영역의 개념을 적용하여 시제위치를 고려하도록 설계되어있다. 제안된 모델은 잡음환경에서 음성인식기와 성능을 비교하고, 화자독립 고립단어 인식에서 기존 융합방법인 CHMM과 비교하여 그 가능성을 확인한다.

한국정보과학회:학술대회논문집 (Proceedings of the Korean Information Science Society Conference)

신경망을 이용한 이중모달 음성 인식 모델링

Bimodal Speech Recognition Modeling Using Neural Networks

초록

키워드

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)