후지쯔에 있어서의 음성 자동인식의 현상과 장래

Automatic Speech Recognition Research at Fujitsu

  • 발행 : 1991.02.01

초록

본 논문에서는, 후지쯔의 음성 자동인식 관련 제품 개발의 역사, 현재의 상품, 그리고 앞으로의 연구 개발에 대해서 소개한다. 현재는 4,000단어로 부터 12,000단어를 인식하는 특정 화자형의 F2360, 17단어를 인식하는 불특정 화자형의 F2355 L/S를 판매하고 있으며, 앞으로의 연구 개발로는 음소 변형에 적극적으로 대처하고, 자연적인 발성을 인식하기 위한 기초 기술을 개발할 계획에 있다. 인식할 단어의 문자 표기에 음향 segment 변형 규칙을 적용하여 음향 segment network를 자동 생산하여서 입력 음성과의 조합을 행한다. 이 기초 기술을 대어휘 단어 음성 인식에 응용하기 위해서 필요한 단어 후보 선택 방식, 문절 발성을 문장 입력에 응용하기 위한 문절 후보 생성 방식과 문 검사 방식에 대해서도 서술한다.

The history of automatic speech recognition research, and current and future speech products at Fujitsu are introduced here. The speech recognition research at Fujitsu started in 1970. Our research efforts have results in the production of a speaker dependent 12,000 word discrete / connected word recognizer(F2360), and a speaker independent 17 word discrete word recognizer(F2355L/S). Currently, we are working on a larger vocabulary speech recognizer, in which an input utterance will be matched with networks representing possible phonemic variations. Its application to text input is also discussed.

키워드