Abstract
Children develop their language skill rapidly between age 3 and 5. To meet the child's language development through a variety of experiences, it is necessary to develop age-appropriate contents. So it needs to develop various contents using speech interface for children, but there is no speech database of korean children. In this paper, we develop speech database of 3 to 5 years old children in korean. For collecting accurate children's speech, child education experts examine in the speech database development process. The words for database are selected from MCDI-K in two stage and children speak a word three times. Such collected speech are tokenized by child and word and stored in database. This speech database will be transferred through web and, hopefully, be the foundation of development of children-oriented contents.
유아는 만3~5세 사이에 언어 능력이 빠르게 발달하게 된다. 유아의 언어발달에 맞는 다양한 경험을 위해서는 그 시기에 맞는 콘텐츠 개발이 필요하다. 다양한 콘텐츠 개발을 위해 유아에 맞는 음성 인터페이스를 이용하는 것이 필요하지만, 한국어에서는 유아를 대상으로 한 데이터베이스가 구축이 되지 않았다. 본 논문에서는 한국어에서 만 3~5세 유아들의 객관화되고 정확한 음성 데이터 수집을 설계하기 위하여 발달시기에 맞는 적절한 단어 선정 및 성인과 다른 유아의 행동 특성 유형을 파악하는 과정을 거쳐 음성 데이터 베이스를 구축하였다. 단어의 경우 MCDI-K에서 두 단계를 걸쳐 선정하였고, 유아는 한 단어 당 세 번씩 발성하였다. 이렇게 수집된 음성 데이터는 유아별, 단어별 파일 토큰화 과정을 거쳐 데이터베이스로 구축되었다. 한국어 유아 음성 데이터베이스는 웹 페이지를 통한 기술 이전을 할 계획이며, 이를 통하여 유아들의 언어 발달에 유익한 다양한 콘텐츠 개발에 그 익일을 담당할 것으로 기대한다.