• Title/Summary/Keyword: 다이얼로그

Search Result 30, Processing Time 0.021 seconds

A Study on VoiceXML Application of User-Controlled Form Dialog System (사용자 주도 폼 다이얼로그 시스템의 VoiceXML 어플리케이션에 관한 연구)

  • Kwon, Hyeong-Joon;Roh, Yong-Wan;Lee, Hyon-Gu;Hong, Hwang-Seok
    • The KIPS Transactions:PartB
    • /
    • v.14B no.3 s.113
    • /
    • pp.183-190
    • /
    • 2007
  • VoiceXML is new markup language which is designed for web resource navigation via voice based on XML. An application using VoiceXML is classified into mutual-controlled and machine-controlled form dialog structure. Such dialog structures can't construct service which provide free navigation of web resource by user because a scenario is decided by application developer. In this paper, we propose VoiceXML application structure using user-controlled form dialog system which decide service scenario according to user's intention. The proposed application automatically detects recognition candidates from requested information by user, and then system uses recognition candidate as voice-anchor. Also, system connects each voice-anchor with new voice-node. An example of proposed system, we implement news service with IT term dictionary, and we confirm detection and registration of voice-anchor and make an estimate of hit rate about measurement of an successive offer from information according to user's intention and response speed. As the experiment result, we confirmed possibility which is more freely navigation of web resource than existing VoiceXML form dialog systems.

Implementation of Dialog Server using SIP and VoiceXML (SIP와 VoiceXML을 이용한 다이얼로그 서버의 구현)

  • 김재철;이명근;이상정
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10e
    • /
    • pp.412-414
    • /
    • 2002
  • 본 논문에서는 PSTN망을 사용하는 일반전화기 사용자와 인터넷 전화 등이 접근할 수 있는 다이얼로그서버를 구현한다. 개발되는 다이얼로그서버는 VoiceXML로 작성된 서비스 컨텐츠를 사용하고, 이를 HTTP를 통하여 가져오며, DTMF 등의 사용자 입력을 받아서 미리 저장된 음성 데이터나 TTS 컴포넌트 등을 통한 음성정보 서비스를 제공한다.

  • PDF

Dialog Enhancement Algorithm for Multimedia Contents (멀티미디어 콘텐츠를 위한 다이얼로그 명료도 향상 알고리즘)

  • Ji, Youna;Park, Young-cheol
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2016.06a
    • /
    • pp.86-89
    • /
    • 2016
  • 본 논문에서는 멀티미디어 콘텐츠의 명료도를 향상시켜 사용자가 주변 환경과 관계없이 안정적인 볼륨에서 오디오 청취를 할 수 있는 다이얼로그 명료도 향상 알고리즘을 제안한다. 최근 모바일 기기들의 발달로 다양한 환경에서 영화, TV 또는 동영상 등의 멀티미디어 콘텐츠를 즐기는 일이 늘어나고 있다. 이러한 경우 시청자는 주변 환경에 따라 영상의 오디오 볼륨을 조절하게 되는데 주변 소음에 비하여 과하게 증폭된 볼륨은 주변에 피해를 끼치거나 고막에 손상을 일으킬 수 있으며 반대로 주변에 비해 너무 작은 오디오 볼륨은 시청을 어렵게 한다는 단점이 있다. 본 논문에서는 수신단에서 멀티미디어 콘텐츠의 오디오 신호로부터 다이얼로그 성분을 검출하여 음성 명료도 향상 알고리즘을 적용시켜 동일한 볼륨에서도 음성의 명료도를 높이는 알고리즘을 제안한다. 본 알고리즘은 다이얼로그를 검출하여 단순히 증폭 시키는 기존 기술들과 달리 전체 에너지는 유지하면서 명료도에 중요한 영향을 미치는 주파수 대역에 에너지를 집중시키는 에너지 재분배 방식을 이용해 동일한 볼륨에서도 더 높은 음성 명료도를 기대할 수 있다. 컴퓨터 시뮬레이션을 통해 본 논문에서 제안한 알고리즘이 명료도에 중요한 영향을 미치는 주파수대역을 적절히 증폭시킴을 확인할 수 있었다.

  • PDF

Intelligibility Enhancement of Multimedia Contents Using Spectral Shaping (스펙트럼 성형기법을 이용한 멀티미디어 콘텐츠의 명료도 향상)

  • Ji, Youna;Park, Young-cheol;Hwang, Young-su
    • Journal of the Institute of Electronics and Information Engineers
    • /
    • v.53 no.11
    • /
    • pp.82-88
    • /
    • 2016
  • In this paper, we propose an intelligibility enhancement algorithm for multimedia contents using spectral shaping. The dialogue signals is essential to understand the plot of audio-visual media contents such as movie and TV. However, the non-dialogue components as like sound effects and background music often degrade the dialogue clarity. To overcome this problem, this paper tries to improves the dialogue clarity of audio soundtracks which contain important cues for the visual scenes. In the proposed method, the dialogue components are first detected by soft masker based on speech presence probability (SPP) which is widely used in speech enhancement field. Then, extracted dialogue signals are applied to the spectral shaping method. It reallocate the spectral-temporal energy of speech to enhanced the intelligibility. The total energy is maintained as unchanged via a loudness normalization process to prevent saturation. The algorithm was evaluated using the modeled and real movie soundtracks and it was shown that the proposed algorithm enhances the dialogue clarity while preserving the total audio power.

Implementation of Extended Automatic Callback Service in SIP-based VoIP System (SIP 기반의 VoIP 시스템에서의 확장된 자동 콜백 서비스의 구현)

  • Jo Hyun-Gyu;Lee Ky-Soo;Jang Choon-Seo
    • The KIPS Transactions:PartC
    • /
    • v.12C no.2 s.98
    • /
    • pp.251-260
    • /
    • 2005
  • On the internet phone or PSTN(Public Switched Telephone Network), the automatic callback is an useful service in the case of busy state when one user calls the other. By using this service, automatic redial is possible when the other party hangs up. However, in the basic automatic callback service, the user who wants callback should wait until the other party hangs up even in the case of emergency. Therefore in this paper, to solve this problem we have extended CPL(Call Processing Language) and, within user system we have included and linked this extended CPL processing module and dialog event package which processes SIP INVITE initiated dialog state informations. We have implemented this system for being used in SIP(Session Initiation Protocol)-based VoIP(Voice over IP) system.

Interview - "It is the exhibition's plan to disassemble and fragment for criticism and history It is hopped to utilize the exhibition media actively in order to promote architectural discourse" (인터뷰 - "비평·역사를 해체·파편화시키는 게 '전시기획' 건축담론 활성화되도록 전시매체 적극 활용해주길" _ 정다영 국립현대미술관 학예연구사)

  • Jang, Yeong-Ho
    • Korean Architects
    • /
    • s.594
    • /
    • pp.170-181
    • /
    • 2018
  • 국립현대미술관은 김중업건축박물관과 공동주최로 건축사 김중업을 조명하는 '김중업 다이얼로그'전을 8월 30일부터 12월 16일까지 국립현대미술관 과천 중앙홀과 2전시실에서 열고 있다. 그가 설계한 30여 년간의 건축물과 관련된 사진과 자료 3000여 점이 전시중이다. 전시는 학예연구사의 안목과 해석작업이 중요하다. 역사와 문화라는 재료를 요리하는 학예연구사의 안목에 따라 그 가치가 빛나거나 그 반대일 수 있는데, 이런 이유로 학예연구사는 전시기획에 대한 권한을 갖고 역사해석, 전시방법 선택 등을 하게 된다. 정다영 학예연구사는 2011년부터 국립현대미술관의 건축부문 학예연구사로 일해 왔다. 올해 베네치아 건축 비엔날레 한국관 공동 큐레이터로 참여해 '스테이트 아방가르드의 유령'전을 기획했으며, 이번 '김중업 다이얼로그'전도 그의 작품이다. 월간 '공간'에서 약 6년간 기자생활을 하고, 학예연구사의 길을 걷고 있는 그녀는 전시라는 매체를 통해 건축의 영역과 담론을 확장 증폭시켜 관계를 맺고 퍼트리는 어쩌면 당대 건축계에 가장 필요한 일을 해주고 있다.

  • PDF

On the Development of Animated Tutoring Dialogue Agent for Elementary School Science Learning (초등과학 수업을 위한 애니메이션 기반 튜터링 다이얼로그 에이전트 개발)

  • Jeong, Sang-Mok;Han, Byeong-Rae;Song, Gi-Sang
    • Journal of The Korean Association of Information Education
    • /
    • v.9 no.4
    • /
    • pp.673-684
    • /
    • 2005
  • In this research, we have developed a "computer tutor" that mimics the human tutor with animated tutoring dialog agent and the agent was integrated to teaching-learning material for elementary science subject. The developed system is a natural language based teaching-learning system using one-to-one dialogue. The developed pedagogical dialogue teaching-learning system analysis student's answer then provides appropriate answer or questions after comparing the student's answer with elementary school level achievement. When the agent gives either question or answer it uses the TTS(Text-to-Speech) function. Also the agent has an animated human tutor face for providing more human like feedback. The developed dialogue interface has been applied to 64 6th grade students. The test results show that the test group's average score is higher than the control group by 10.797. This shows that unlike conventional web courseware, our approach that "ask-answer" process and the animated character, which has human tutor's emotional expression, attracts students and helps to immerse to the courseware.

  • PDF

Design and Implementation of VoiceXML Document Storage System Using RDBMS (RDBMS를 이용한 VoiceXML 문서 저장 시스템 설계와 구현)

  • 박주현;진민
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2001.11a
    • /
    • pp.397-401
    • /
    • 2001
  • 대화형 음성 응답 시스템은 비용이 많이 들고 폐쇄된 환경에서만 개발이 가능했었지만 VoiceXML이라는 표준화된 문서의 개발로 인하여 새로운 국면을 맞이하게 되었다. 본 논문에서는 관계형 데이터베이스를 기반으로 한 다이얼로그 단위로 분리 저장하는 VoiceXML 문서 저장 시스템을 설계하고 구현하였다. 음성을 서비스할 수 있는 VoiceXML 문서를 관계 데이터베이스를 이용하여 VoiceXML 문서 저장 모델을 설계하고 VoiceXML 문서의 구조적 정보를 효과적으로 표현하고 저장하는 방법을 제안한다.

  • PDF