Proceedings of the Acoustical Society of Korea Conference (한국음향학회:학술대회논문집)
- spring
- /
- Pages.21-24
- /
- 2002
Common Speech Database Collection
공통음성 DB 구축
- Kim Sanghum (SpeechTechnology Research Center, Network Laboratory, ETRI) ;
- Oh Seungshin (SpeechTechnology Research Center, Network Laboratory, ETRI) ;
- Jung Ho-Young (SpeechTechnology Research Center, Network Laboratory, ETRI) ;
- Jeong Hyung-Bae (SpeechTechnology Research Center, Network Laboratory, ETRI) ;
- Kim Jeong-Se (SpeechTechnology Research Center, Network Laboratory, ETRI)
- 김상훈 (한국전자통신연구원 네트워크연구소 음성정보연구센타) ;
- 오승신 (한국전자통신연구원 네트워크연구소 음성정보연구센타) ;
- 정호영 (한국전자통신연구원 네트워크연구소 음성정보연구센타) ;
- 전형배 (한국전자통신연구원 네트워크연구소 음성정보연구센타) ;
- 김정세 (한국전자통신연구원 네트워크연구소 음성정보연구센타)
- Published : 2002.07.01
Abstract
본 논문은 ETRI 음성정보연구센터에서 추진하고 있는 공통음성 DB 구축에 관하여 기술한다. 총 3 년(2001 11-2004. 10) 동안 음성인식, 음성합성, 화자인식 등 다양한 용도의 음성 DB 를 수집할 예정이며, 1년차인 2002 년에는 총 14 종의 음성 DB 를 수집할 계획이다. 공통 음성 DB 는 다양한 통신망(마이크, 헤드셋, VoIP, 유무선 전화망), 지역, 성별, 발성환경(사무실, 지하철, 도로 등)을 고려하여 설계하였으며, 발성대상은 숫자, 단어, 문장이고, 발성방법은 자유발화, 대화체, 낭독체 등 다양한 스타일의 음성 DB 로 구성되어 있다. 이에 본 논문에서는 총 14 종에 해당하는 공통음성 DB 의 구축내역과 구축방안 및 DB 구축 일정에 관해 기술하고자 한다.
Keywords