• Title/Summary/Keyword: voiceXML

검색결과 101건 처리시간 0.024초

웹으로 운용하는 음성인식 무인자동교환시스템 (Web based VAD using HUVOIS solution)

  • 김희경
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
    • /
    • pp.47-48
    • /
    • 2004
  • 최근 음성시장은 VoiceXML 을 이용하여 간단히 시나리오를 작성할 수 있어, 보다 쉽게 다양한 어플리케이션을 개발하여 서비스할 수 있게 되었다. HUVOIS-VAD 는 KT가 자체 개발한 음성인식/합성 플랫폼 시스템인 HUVOIS 에 VXML 을 이용하여 시나리오를 구성한 음성인식/합성 VAD 시스템으로, 사내 및 사외 여러 사이트에 설치 운용 중이다. 특히, Web 을 기반으로 운용시스템을 구축하여 운용자는 어느 곳에서나, 운용 DB를 점검하거나, 인식사전을 구성하고, 운용할 수 있으며, 사용자 또한 개인의 DB 를 직접 관리하도록 하고, 회사의 DB 와 연계하여 개인의 VAD로 동시에 사용할 수 있도록 하고 있다. 본 논문에서는 Web 을 기반으로 구성된 HUVOIS-VAD 시스템에 대하여 기술하고자 한다.

  • PDF

디지털 TV 환경에서 음성인식을 통한 동적 EPG 제어 시스템 설계 및 구현 (Design and Implementation of the Speech Recognition-based Dynamic EPG Control System in Digital Broadcasting environment)

  • 김성원;나희주;시장현;김정환;정문열
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2007년도 학술대회 1부
    • /
    • pp.216-221
    • /
    • 2007
  • 디지털 방송은 수많은 프로그램과 기존의 아날로그 방송에서 볼 수 없었던 다양한 서비스를 제공하며 발전하고 있다. 하지만 시청자들에게는 방송 서비스 채널과 기능이 많아질수록 원하는 채널을 검색하고 전환하는 과정이 어렵고 복잡한 일이 되어 버릴 수 밖에 없을 것이다. 이에 본 논문에서는 이러한 정보 획득과정의 축소를 위해 전통적인 리모콘으로 채널을 검색하고 이동하는 절차를 벗어나 음성인식을 통한 동적 EPG(Electronic Program Guide) 제어 시스템을 설계하고 구현하고자 한다. 이는 EPG정보와 시청자의 TV시청 성향 및 History를 기반으로 구동되는 시스템으로 음성대화의 구조적 정의가 가능한 VXML(VoiceXML) 인터프리터를 활용한다. 본 논문에서 제안하는 대화형 인터페이스는 다양한 디지털방송 서비스에 접목이 가능 할 것이며, 새로운 형태의 디지털 가전기기 파일럿 인터페이스 개발에 도움이 될 것이라 기대한다.

  • PDF

모바일 환경을 위한 멀티모달 미들웨어의 설계 및 구현 (Design and Implementation of Multimodal Middleware for Mobile Environments)

  • 박성수;안세열;김원우;구명완;박성찬
    • 대한음성학회지:말소리
    • /
    • 제60호
    • /
    • pp.125-144
    • /
    • 2006
  • W3C announced a standard software architecture for multimodal context-aware middleware that emphasizes modularity and separates structure, contents, and presentation. We implemented a distributed multimodal interface system followed the W3C architecture, based on SCXML. SCXML uses parallel states to invoke both XHTML and VoiceXML contents as well as to gather composite or sequential multimodal inputs through man-machine interactions. We also hire Delivery Context Interface(DCI) module and an external service bundle enabling middleware to support context-awareness services for real world environments. The provision of personalized user interfaces for mobile devices is expected to be used for different devices with a wide variety of capabilities and interaction modalities. We demonstrated the implemented middleware could maintain multimodal scenarios in a clear, concise and consistent manner by some experiments.

  • PDF

홈 네트워크 환경에서 음성인식기반 사용자 인터페이스를 통한 가전기기 제어 시스템 구현 (Implementation of Home Appliance Control System with Speech Recognition based User Interfaces in Home Network Environments)

  • 김연우;장현수;김구수;엄영익
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.735-738
    • /
    • 2007
  • 컴퓨팅 기술의 발전에 따라 유비쿼터스 시대로의 이행이 가속화되고 있다. 이에 따라 홈 네트워크 분야에 대한 연구와 상용화를 위한 노력이 활발해지고 있다. 이와 더불어 가전기기들의 종류는 다양해지고 복잡해지면서 사용자들의 가전기기 이용에 있어 사용법을 익혀야하는 어려움이 있다. 이러한 문제점을 해결하기 위한 일환으로 디지털 장치들을 편하게 사용하기 위한 멀티 모달 사용자 인터페이스가 요구되고 있다. 본 논문에서 네트워크 가전기기 제어가 가능한 홈 네트워크 미들웨어인 UPnP를 사용하여 VoiceXML을 통한 음성인식기반 사용자 인터페이스와 디지털 장치 제어 시스템을 제안하고 구현한 후 실험하였다.

레퍼런스 클럭을 이용한 객차 PI 시스템 동기화 및 자막 편집기 개발 (Synchronization of the Train PIS using the reference clock and development of a subtitle authoring tool)

  • 김정훈;장동욱;한광록
    • 한국컴퓨터정보학회논문지
    • /
    • 제12권4호
    • /
    • pp.1-10
    • /
    • 2007
  • 본 논문은 열차 내에서 승객의 편의를 제공하고 긴급 상황에 대한 대피 안내 방송 및 자막 서비스와 광고 등의 효과를 극대화하기 위한 네트워크 기반의 승객 안내 시스템 개발에 대하여 기술한다. 기존 시스템은 영상 및 자막 그리고 음성 안내 등의 정보를 방송하기 위해 VGA 신호 분배기를 이용하고 있다. UDP와 TCP/IP 프로토콜을 적용하여 기존 시스템을 개선하고, 이 경우 발생하는 데이터 손실 및 차량 간의 동기화 문제를 해결하기 위하여 레퍼런스 클럭을 이용한다. 열차의 운행 스케줄에 따른 자동 안내 방송과 광고 효과의 향상을 위하여 다양한 3D 효과로 자막을 재생 하도록 XML 기반의 자막 편집기를 개발하였고, 시뮬레이션을 통해 성능을 평가 한다.

  • PDF

지식의 온톨로지화를 위한 관리 시스템 아키텍처 (The Conference Management System Architecture for Ontological Knowledge)

  • 홍현우;고광산;김창수;정재길;정회경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 추계종합학술대회
    • /
    • pp.1115-1118
    • /
    • 2005
  • 인터넷 기술이 발전함에 따라 이를 이용한 온라인 회의 시스템이 개발되고 있다. 현재의 온라인 회의 시스템은 문자, 음성, 화상 등과 같은 멀티미디어 기술을 도입하여 기존의 오프라인 회의와 달리 공간의 제약에서 벗어날 수 있다는 장점이 있기 때문에 많은 기업과 조직에 도입되고 있다. 하지만 온라인 회의 시스템은 회의 시간이 길어질수록 발언 내용이 많아지고 회의 내용에 대한 일관된 인식이 떨어지기 쉽다는 단점이 있다. 이에 본 논문에서는 온톨로지(Ontology) 개념을 도입하여 회의 내용을 지식화 하고 이를 XML(Extensible Markup Language)로 구조화하여 요약 및 관리 할 수 있는 회의 관리 시스템 아키텍처를 제시였다. 또한 이렇게 제시된 아키텍처의 객관적인 검증과 체계적이고 시각화된 관리를 위해 지식기반 회의 관리 시스템을 설계 및 구현하였다.

  • PDF

향상된 부가 서비스 지원을 위한 SIP 프락시 서버의 확장 설계 및 구현 (Extended Design And Implementation of SIP Proxy Server or Improved Additional Internet Telephony Service)

  • 민경주;이종화;강신각;박기식
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2002년도 추계종합학술대회
    • /
    • pp.875-879
    • /
    • 2002
  • 호 처리 언어(CPL : Call Processing Language)는 공중 전화망에서 제공하는 다양한 부가 서비스를 인터넷 상에서 개발할 수 있는 기술로서, IETF IPTEL 워킹 그룹에서 개발한 표준이다. 사용자들은 CPL을 이용하여 호 전환, 호 방지와 같은 다양한 부가서비스를 요청할 수 있으며, 이것들은 스크립트 형태로 SIP(Session Initiation Protocol) Registrar에 등록되어 실질적인 서비스를 제공받게 된다. 본 논문에서는 CPL을 지원하는 프락시 서버의 동작 중, 향상된 부가서비스 지원을 위한 프락시 서버와 CPL 서버간 동작에 대한 설계 및 구현에 대해서 기술하고자 한다. 이러한 향상된 부가 서비스를 지원함으로써, 인터넷 텔레포니(VoIP : Voice over Internet Protocol) 서비스를 이용하는 사용자의 요구 사항 반영에 크게 기여할 수 있다. CPL을 지원하는 SIP 프락시 서버는 리눅스 커널 버전 2.4.x 상에서 C언어를 이용하여 설계 및 구현하였고, CPL 서버는 라이브러리로, 프락시 서버와 연동하여 동작한다.

  • PDF

Implementation of Android-based Interactive Edutainment Contents Using Authoring Tool Developed for Interactive Animation

  • Song, Mi-Young
    • 한국컴퓨터정보학회논문지
    • /
    • 제23권4호
    • /
    • pp.71-80
    • /
    • 2018
  • In this paper, we developed an interactive animation authoring tool and developed the Android based interactive edutainment contents. The authoring tool for creating interactive animations developed in this paper is based on a graphical user interface, so users can easily create interactive animations. Interactive animation contents created by this authoring tool can be created as images and xml files so that they can be used directly on mobile devices. In order to increase learning efficiency for children, Android-based interactive edutainment electronic storybooks, which is implemented using this authoring tool, provided a recording function to listen to the parents' voice as well as an interactive action in which the characters move in accordance with the story line. We also provided a STEAM game that combines creativity and imagination with creative science and technology. Therefore, by creating the edutainment contents through the proposed authoring tool for interactive animation, various interactive animation contents could be produced more easily than the code implementation method. Through this study, I hope that it will be helpful for the development of various interactive edutainment contents to provide educational contents considering the quantity and quality to infants.

오감자극을 활용한 자동화된 온라인 뇌파 DB구축 시스템 구현 (Implementation of automated online brain-wave DB building system using the five senses stimulation)

  • 김대진;권태구;신정훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 춘계학술발표대회
    • /
    • pp.729-732
    • /
    • 2008
  • 유비쿼터스 시대의 도래에 따른 서비스의 고급화는 다양한 형태의 사용자 단말기의 개발을 유도 하였으며, 이러한 사용자 단말기의 변화는 다양한 형태의 인간친화형 사용자 인터페이스의 개발로 이어지게 되었다. 이러한 다양한 형태의 인간친화형 사용자 인터페이스 중, 인간의 뇌를 활용한 사용자 인터페이스, 즉 BCI에 관한 연구가 산발적으로 다양하게 진행되고 있다. 현재 진행되어지고 있는 다양한 형태의 BCI관련 연구들은, 연구 초기 수준을 극복하지 못하는 실정이며, 이러한 연구 개발의 지체 이유로는 DB구축부터 시작한 체계적인 연구가 이루어지고 있지 않는 점을 들 수 있다. 또한, 뇌파 신호의 수집 시 효율적인 피험자 지침 관련 연구가 없는 실정이며 기 구현되어진 대부분의 시스템이 로컬시스템 형태로 구성되어져 DB 구축 시 한정적인 피험자 수, 대용량의 뇌파 DB수집 시 한계, 뇌파 DB의 신뢰성이 저하되는 문제점을 야기한다. 본 논문에서는 이러한 문제점을 극복하기 위하여 VoiceXML을 활용한 온라인 기반의 DB구축 시스템 구현을 제안 하며 신뢰성 및 객관성을 확보 하고자 한다.

모바일 기기 기반 사용자 중심형 전시관 정보 안내 시스템의 설계 및 구현 (Design and Implementation of user centric pavilion information guide system based on commercial mobile device)

  • 윤현주;부소영;최유주
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권2호
    • /
    • pp.187-199
    • /
    • 2006
  • 본 논문에서는 PDA(Personal Digital Assistant: 이하 PDA라 약칭함)와 같은 모바일 기기를 기반으로 하여 사용자가 원하는 대로 시스템의 인터페이스가 구성되는 사용자 중심형 전시관 정보 안내 시스템을 제안한다. 이는 PDA나 휴대폰 등과 같은 모바일 기기를 기반으로 제작함으로써 이동하는 사용자에게 휴대성의 편리를 제공하며, 기존의 브라우저와는 다르게 작은 디바이스 화면에서도 모든 데이터들에 대한 정보가 한 화면에 디스플레이되며, 사용자와의 인터랙션을 통하여 사용자가 원하는 정보를 중심으로 시스템의 인터페이스와 정보 요소를 구성할 수 있게 하여 이용에 편리성을 더한다. 또한 안내 대상의 위치 정보와 상세 정보 등을 글, 이미지, 음성, 동영상 등의 다양한 형태로 사용자에게 제공하는 데 그 특징이 있다. 본 논문에서 시스템은 미디어 정보 데이터베이스를 갖추고 있는 미디어 데이터 서버와 데이터베이스와 휴대용 안내시스템을 실시간으로 동시에 제어하기 위한 휴대용 시스템 컨트롤 서버 그리고 사용자의 요구 사항을 입력받고 구성된 안내 정보를 디스플레이하는 휴대용 안내 시스템 등으로 구성된다. 각 시스템은 TCP/IP기반의 네트워크 연결과 여러 전시관 형태나 데이터의 종류에 따라 갱신 및 추가, 교환이 가능하도록 하기 위한 XML(extensible Markup Language)과 JAVA 2 Micro Edition 기반의 제작을 제시한다. 이는 어떤 모바일 기기에서도 사용할 수 있게 하는 시스템의 범용성을 높일 수 있다.

  • PDF