• 제목/요약/키워드: Korean dialog system

검색결과 63건 처리시간 0.023초

ETRI 소용량 대화체 음성합성시스템 (ETRI small-sized dialog style TTS system)

  • 김종진;김정세;김상훈;박준;이윤근;한민수
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2007년도 한국음성과학회 공동학술대회 발표논문집
    • /
    • pp.217-220
    • /
    • 2007
  • This study outlines a small-sized dialog style ETRI Korean TTS system which applies a HMM based speech synthesis techniques. In order to build the VoiceFont, dialog-style 500 sentences were used in training HMM. And the context information about phonemes, syllables, words, phrases and sentence were extracted fully automatically to build context-dependent HMM. In training the acoustic model, acoustic features such as Mel-cepstrums, logF0 and its delta, delta-delta were used. The size of the VoiceFont which was built through the training is 0.93Mb. The developed HMM-based TTS system were installed on the ARM720T processor which operates 60MHz clocks/second. To reduce computation time, the MLSA inverse filtering module is implemented with Assembly language. The speed of the fully implemented system is the 1.73 times faster than real time.

  • PDF

SALT 기반 음성 웹 페이지의 자동 생성 (Automatic Generation of Voice Web Pages Based on SALT)

  • 고유정;김윤중
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권3호
    • /
    • pp.177-184
    • /
    • 2010
  • 음성 브라우저가 등장함에 따라, 음성 대화 어플리케이션이 웹 환경에서 사용이 가능하게 되었다. 음성 대화 어플리케이션은 음성 웹 페이지로 구성되어 있다. 음성 웹 페이지의 대화 스크립트는 SALT(Speech Application Language Tags) 언어 등으로 기술되어야 한다. 기존 웹 페이지들은 음성 대화를 고려하지 않고 시각용(visual)용으로 제작되었지만, 이들 웹 페이지에도 음성 대화를 이용하여 처리할 수 있는 요소들이 있다. 따라서 본 논문에서는 시각용으로 제작된 HTML 웹 페이지로부터 대화처리가 가능한 요소들을 추출하고 해당대화를 SALT로 생성해내는 음성 웹 페이지의 자동 생성방법을 제안하였다. 제안한 음성 웹 페이지의 자동 생성기는 어휘 분석기와 구문 분석기로 구성된 번역기로, HTML로 기술된 웹 페이지를 HTML+SALT로 기술된 음성 웹 페이지로 변환한다. 변환된 음성 웹 페이지는 기존의 마우스, 키보드롤 이용한 처리도 가능하고 음성 대화 처리도 가능하도록 설계되었다.

대화음성인식 시스템 구현을 위한 기본 플랫폼 개발 (Development of a Baseline Platform for Spoken Dialog Recognition System)

  • 정민화;서정연;이용주;한명수
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2003년도 5월 학술대회지
    • /
    • pp.32-35
    • /
    • 2003
  • This paper describes our recent work for developing a baseline platform for Korean spoken dialog recognition. In our work, We have collected about 65 hour speech corpus with auditory transcriptions. Linguistic information on various levels such as mophology, syntax, semantics, and discourse is attached to the speech database by using automatic or semi-automatic tools for tagging linguistic information.

  • PDF

캐드 환경에서 플라스틱 사출 금형 설계 시스템의 개발 (Development of Plastic Injection Mold Design System on the CAD Environment)

  • 조용무
    • 한국정밀공학회지
    • /
    • 제15권2호
    • /
    • pp.68-74
    • /
    • 1998
  • In this work, we have been concerned with developing an intelligent mold design system for plastic injection molding on the AutoCAD. We have concentrated on building a viable environment, including a mold parts database and a menu-driven user interface. This provides a more interactive and interface for selection of optimal mold-base and mold parts in mold design system. This work presents a method which allows the designer to select the mold parts and mold-base directly within an AutoCAD environment. It can also automatically generate detailed 3D drawings of the mold parts and mold-base. The system shows its potential capability for future enhancement. Since the system is independent of the data, it could easily be extended to other mold-bases and mold parts. In addition, it can be linked to the molding analysis system by creating subtracted 3-D models.

  • PDF

전자동 수문설계 소프트웨어 개발에 관한 연구 (A Study on Development of Automatic Water-gate Design Software)

  • 서병태;김일수
    • 한국공작기계학회논문집
    • /
    • 제10권3호
    • /
    • pp.50-54
    • /
    • 2001
  • Manufacturing is characterized by increasing product variety and technical complexity, decreasing levels of demand, expanding global competition and declining profitability of organizations. To survive in such a complex environment, development of the automatic design system into design and manufacturing can be introduced to increase the flexibility and adaptability to markets. This paper presents the development of an automatic water-gate design system that composed of a main program and three modules, and was programmed by AutoLISP language under AutoCAD system. The devel-oped system is capable of generating water-gate design automatically according to input data as customer requirement.

  • PDF

DSP보드를 이용한 전화음성용 실시간 화자인증 시스템의 구현에 관한 연구 (An Implementation of Real-Time Speaker Verification System on Telephone Voices Using DSP Board)

  • 이현승;최홍섭
    • 대한음성학회지:말소리
    • /
    • 제49호
    • /
    • pp.145-158
    • /
    • 2004
  • This paper is aiming at implementation of real-time speaker verification system using DSP board. Dialog/4, which is based on microprocessor and DSP processor, is selected to easily control telephone signals and to process audio/voice signals. Speaker verification system performs signal processing and feature extraction after receiving voice and its ID. Then through computing the likelihood ratio of claimed speaker model to the background model, it makes real-time decision on acceptance or rejection. For the verification experiments, total 15 speaker models and 6 background models are adopted. The experimental results show that verification accuracy rates are 99.5% for using telephone speech-based speaker models.

  • PDF

영어 회화 교육을 위한 예제 기반 대화 시스템 (Example-based Dialog System for English Conversation Tutoring)

  • 이성진;이청재;이근배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권2호
    • /
    • pp.129-136
    • /
    • 2010
  • 본 논문에서는 영어 회화 교육을 위한 예제 기반 대화 시스템에 대해 논한다. 기존의 획일적인 멀티미디어 영어 학습에서 벗어나 자연어 처리 및 대화 기술을 이용하여 지능적인 일대일 영어 회화 교육 제공을 목적으로 한다. 본 시스템은 미숙한 학습자 발화를 이해할 수 있으므로 불완전한 언어 구사 능력으로도 대화를 참여할 수 있는 체험형 학습을 제공한다. 이를 통해 학습자에게 영어를 배우려는 흥미로운 동기를 부여한다. 또한 학습자의 표현력 향상을 위한 교육적인 도움 기능을 갖추고 있다. 이를 위해 우리는 학습자의 미숙한 표현을 이해하는 담화 상황 고려 발화의도 인식 모델, 도메인 확장성이 뛰어난 예제 기반 대화 관리 모델, 교육 및 평가 기능을 개발하였다. 실험 결과 학습자의 발화에 에러가 많아도 높은 발화의도 인식 성능을 보였으며 대화 상황에 적합한 피드백을 제공하여 학습자가 회화 연습을 끝까지 마치도록 도와 교육 효과에 이바지함을 알 수 있었다.

Design for Proximity Voice Chat System in Multimedia Environments

  • Jae-Woo Chang;Jin-Woong Kim;Soo Kyun Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권3호
    • /
    • pp.83-90
    • /
    • 2024
  • 본 연구에서는 멀티미디어 환경에서 상호작용 시스템 중 하나인, 음성 대화 기술에 대하여 근접 음성 대화 시스템을 적용하는 솔루션을 제안한다. 사용자 아바타들 간 거리에 따라 음성의 볼륨을 조절하고, 가청 거리를 벗어난 사용자에게는 음소거를 적용하는 방식으로 멀티미디어 공간에서 여러 사용자 간의 음성 대화 방식을 설계하였다. 본 연구의 가장 큰 특징은 경제적인 개발을 위해, 거리를 기반으로 먼 거리에 있는 사용자에게는 저음질의 음성을 전달하고, 비 가청 지역에 들어선 사용자에게는 음성 데이터를 전송하지 않게 하는, reliable UDP 기반 능동적 서버 시스템에 있다. 제안 시스템은 사전에 완성하였던 유니티 게임 엔진 기반 프로젝트에서 성능을 측정하였으며, 본 연구에서 제안한 시스템을 메타버스 콘텐츠, 실시간 대전 액션 게임과 같이 여러 사용자 간 상호작용을 제공하는 환경에서 적극적으로 이용되는 것을 기대할 수 있다.

대화형 로봇의 화자 추종을 위한 sound localization (Sound localization for Teller Following of A dialog type Humanoid Robot)

  • 심현민;이종실;권오상;이응혁;홍승홍
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2001년도 합동 추계학술대회 논문집 정보 및 제어부문
    • /
    • pp.111-114
    • /
    • 2001
  • In this paper, we supposed teller following algorithm that using sound localization for developing dialog type humanoid robot. A sound localization is studied for develop the techniques of an efficient 3-D sound system based on the psychoacoustics of spatial hearing with multimedia or virtual reality. When a robot talk with human, it is necessary that robot follow human for improved human interface and adaptive noise canceling. We apply this algorithm to robot system.

  • PDF

LBS를 위한 무선 인터넷 DGPS 구현 (The Realization of the Wireless Internet DGPS for LBS)

  • 강준묵;조성호;이은수
    • 대한공간정보학회지
    • /
    • 제16권1호
    • /
    • pp.3-12
    • /
    • 2008
  • 본 연구는 LBS를 위한 비주얼 베이직 Active X 컨트롤을 이용한 무선 인터넷 DGPS 구축이다. 시스템 개발에 사용된 DGPS 보정방법은 웹상의 위치 보정방법과 양방향 통신에 있어 편리성을 고려하여 좌표 보정방법을 사용하였다. 위치정보 출력 모듈은 PictureBox 컨트롤과 bitblt 함수를 이용하여 개발하였다. 서버와 클라이언트 간의 인터넷 DGPS 통신 모듈은 MS Comm 컨트롤, MS Winsock 컨트롤(TCP/IP), MS CommonDialog 컨트롤, MS Sysinfo 컨트롤 구성요소를 사용하여 개발하였으며 구축된 시스템을 웹에 게시하였다. 구축된 시스템을 이용하여 실시간 무선 인터넷 DGPS를 수행한 결과, 서버 시스템 상의 클라이언트 추적, 클라이언트 시스템에서의 항법, 제 3 이용자의 클라이언트 추적이 근 실시간 가능하였다.

  • PDF