• 제목/요약/키워드: Voice Interaction

검색결과 157건 처리시간 0.025초

호 제어 마크업 해석기 개발 및 음성 대화 시스템과의 연동 (Design and Implementation of a Call Control Markup Interpreter and Its Interaction with Voice Dialog Systems)

  • 이경아;권지혜;김지영;홍기형
    • 대한음성학회지:말소리
    • /
    • 제53호
    • /
    • pp.171-183
    • /
    • 2005
  • Call Control eXtensible Markup (CCXML) is a standard language that supports a call control of voice dialog systems such as VoiceXML based systems. CCXML allows developers to handle telephony calls in an easy way without deep knowledge about telephony networks and their switching systems.We design and implement a call control markup interpreter. At the implementation, we use a Dialogic JCT-LS board, but, by designing a wrapping class for CTI (computer telephony board) features, the interpreter can easily adopt other CTI boards. We also design and implement event-based interaction scheme between the interpreter and voice dialog systems. For verifying the interaction scheme, we implement a simple voice dialog system.

  • PDF

스마트홈 대화형 인터페이스의 의인화 효과 음성-채팅 인터랙션 유형에 따른 실험 연구 (Effects of Anthropomorphic Conversational Interface for Smart Home: An Experimental Study on the Voice and Chatting Interactions)

  • 홍은지;조광수;최준호
    • 한국HCI학회논문지
    • /
    • 제12권1호
    • /
    • pp.15-23
    • /
    • 2017
  • 이 연구는 인간성의 개념과 구성 요인들을 스마트 홈 맥락에서 대화형 에이전트에 적용하여, 의인화의 수준과 인터랙션 유형이 사용자 감성 경험과 향후 이용 의도에 미치는 효과를 알아보고자 하였다. 실험연구를 통한 분석 결과 의인화의 고-저 수준과 인터랙션의 음성-채팅 유형은 친밀도, 호감도, 향후 이용 의도에 영향을 미치는 것으로 나타났다. 즉, 의인화 수준이 높고, 음성 인터랙션인 경우 대화형 에이전트를 더 친밀하고 호감이 가며 향후에도 계속해서 이용하고 싶은 대상으로 평가하였다. 또한, 의인화의 고-저 수준과 관계없이, 채팅에 비해 음성 인터랙션이 심리적 저항감이 낮았다. 향후 이용 의도에 대해서 의인화 수준과 인터랙션 유형의 상호작용 효과가 발견되었다. 즉, 채팅 인터랙션은 의인화의 효과가 나타나지 않은 반면, 음성 인터랙션의 경우 의인화의 효과가 나타났다. 따라서, 음성 대화형 스마트홈 에이전트는 의인화 수준을 높이는 방향으로 설계가 되어야 사용자들의 지속적 이용을 기대할 수 있다.

대화 지속성 암묵적 단서를 고려한 차량 내 음성 인터랙션 구조 연구 (A Study on the In-Vehicle Voice Interaction Structure Considering Implicit context with Persistence of Conversation)

  • 남궁기찬
    • 한국융합학회논문지
    • /
    • 제12권2호
    • /
    • pp.179-184
    • /
    • 2021
  • 본 연구에서는 차량 내 음성 인터랙션을 사용하는 사용자의 대화 행태를 탐색적으로 살펴보았다. 본 연구의 목적은 시스템과의 음성 인터랙션에서 사용자들이 기대하는 대화 요소를 파악하여 사람 간의 대화와 유사한 음성 인터랙션을 가능하게 하기 위한 구조적 개선점을 제시하는 것이다. 사용자의 차량 내 음성 인터랙션 행태를 관찰하기 위해 맥락 질문법을 통해 자료를 수집하고 개방 코딩을 사용하여 인터뷰 내용을 분석하였다. 이를 통해 음성 인터랙션 기능의 유용성을 탐구할 수 있었으며, 이러한 유용성은 기능에 대한 사용자의 만족도와 사용 지속성을 증가시킨다는 점에서 매우 중요하다. 본 연구는 기술에 대한 사용자의 경험적 요구를 대인관계 모델인 대화의 관점에서 분석하였다는 점에서 의미가 있다고 할 수 있다.

AI기반 음성인식 서비스 특성과 상호 작용성 및 이용 의도 간의 구조적 관계 (The Structural Relationships of between AI-based Voice Recognition Service Characteristics, Interactivity and Intention to Use)

  • 이서영
    • 한국IT서비스학회지
    • /
    • 제20권5호
    • /
    • pp.189-207
    • /
    • 2021
  • Voice interaction combined with artificial intelligence is poised to revolutionize human-computer interactions with the advent of virtual assistants. This paper is analyzing interactive elements of AI-based voice recognition services such as sympathy, assurance, intimacy, and trust on intention to use. The questionnaire was carried out for 284 smartphone/smart TV users in Korea. The collected data was analyzed by structural equation model analysis and bootstrapping. The key results are as follows. First, AI-based voice recognition service characteristics such as sympathy, assurance, intimacy, and trust have positive effects on interactivity with the AI-based voice recognition service. Second, the interactivity with the AI-based voice recognition service has positive effects on intention to use. Third, AI-based voice recognition service characteristics such as interactional enjoyment and intimacy have directly positive effects on intention to use. Fourth, AI-based voice recognition service characteristics such as sympathy, assurance, intimacy and trust have indirectly positive effects on intention to use the AI-based voice recognition service by mediating the effect of the interactivity with the AI-based voice recognition service. It is meaningful to investigate factors affecting the interactivity and intention to use voice recognition assistants. It has practical and academic implications.

Greeting, Function, and Music: How Users Chat with Voice Assistants

  • Wang, Ji;Zhang, Han;Zhang, Cen;Xiao, Junjun;Lee, Seung Hee
    • 감성과학
    • /
    • 제23권2호
    • /
    • pp.61-74
    • /
    • 2020
  • Voice user interface has become a commercially viable and extensive interaction mechanism with the development of voice assistants. Despite the popularity of voice assistants, the academic community does not utterly understand about what, when, and how users chat with them. Chatting with a voice assistant is crucial as it defines how a user will seek the help of the assistant in the future. This study aims to cover the essence and construct of conversational AI, to develop a classification method to deal with user utterances, and, most importantly, to understand about what, when, and how Chinese users chat with voice assistants. We collected user utterances from the real conventional database of a commercial voice assistant, NetEase Sing in China. We also identified different utterance categories on the basis of previous studies and real usage conditions and annotated the utterances with 17 labels. Furthermore, we found that the three top reasons for the usage of voice assistants in China are the following: (1) greeting, (2) function, and (3) music. Chinese users like to interact with voice assistants at night from 7 PM to 10 PM, and they are polite toward the assistants. The whole percentage of negative feedback utterances is less than 6%, which is considerably low. These findings appear to be useful in voice interaction designs for intelligent hardware.

조작 방식에 따른 음성과 소리 피드백의 할당 방법 가전제품과의 상호작용을 중심으로 (An Arrangement Method of Voice and Sound Feedback According to the Operation : For Interaction of Domestic Appliance)

  • 홍은지;황해정;강연아
    • 한국HCI학회논문지
    • /
    • 제11권2호
    • /
    • pp.15-22
    • /
    • 2016
  • 가전제품과 사용자와의 상호작용 방식이 다양해지고 있다. 사용자는 리모컨, 터치스크린 등으로 기기를 제어할 수 있고, 기기 역시 사운드, 음성, 시각적 신호 등 다양한 방식으로 사용자에게 피드백을 줄 수 있게 되었다. 그러나 사용자의 조작 방식에 따른 피드백 방식을 배정하는 원칙이나 기준이 없어 각 브랜드, 기기 별로 임의로 배정되어 있는 상황이다. 본 연구에서는 사용자가 가전제품을 음성 명령을 통해 조작할 때와 버튼으로 조작할 때 가전제품에서 주어지는 피드백의 방식으로 음성, 소리 중 어떤 방식이 적절한지 실험을 통해 알아보았다. 본 연구에서는 조작 방식(음성 인식, 버튼), 피드백 방식(음성 안내, 소리)의 조합으로 구성 된 총 4가지($2{\times}2$) 셀을 갖는 요인 설계 실험을 진행하였고, 조작 방식과 피드백 방식의 조합에 따라 피 실험자가 느끼는 사용성, 만족도, 선호도, 적합도가 달라지는지 살펴보았다. 그 결과 가전제품을 음성 인식으로 조작 하는 것이 사용 용이성, 조작 만족도가 높았다. 하지만 버튼으로 조작 했을 때는 피드백 방식의 종류에 따라 사용 용이성, 조작 만족도가 달라지는 것으로 나타나, 조작 방식과 피드백 방식의 상호작용 효과가 검정되었다. 조작 방식, 피드백 방식의 조합이 가전에 적절한지에 대해서는 피드백 방식의 주효과가 검정되었다. 결론적으로 음성 인식으로 조작 할 때는 피드백이 소리(earcons)로 제시되는 것이 만족도가 높았으나 이는 통계적으로 검정 되는 정도는 아니었으며, 버튼을 조작 할 때는 피드백이 음성 안내로 제시되는 것이 만족도가 높았으며 이는 통계적으로 검정 되었다. 또한 가전에 어떠한 조작 방법이나 피드백 방법이 적절한지에 대해서는 피드백 방법이 주로 영향을 미치는 것으로 나타났다.

대화 패턴 연구를 통한 스마트TV 음성 상호작용 모델의 탐구 (Examination of a Voice Interaction Model for Smart TV through Conversation Patterns)

  • 최진해
    • 한국콘텐츠학회논문지
    • /
    • 제17권2호
    • /
    • pp.96-104
    • /
    • 2017
  • 최근의 스마트 기기들은 사용자의 의도와 사용 맥락을 반영하는 지능형 에이전트의 형태로 발전하고 있으며, 기능을 더 쉽고 편리하게 활용할 수 있는 사용자 경험 설계가 경쟁력의 핵심이 되고 있다. 본 연구는 인간중심의 내추럴 인터랙션이 최적의 스마트TV 경험에 필수적이라는 전제하에 TV에 특화된 음성 인터랙션 방식을 탐구하고자 하였다. 사용자가 자연스러운 행태로 TV를 조작하는 모델을 구축하기 위하여 스마트TV의 주요 기능을 지능형 에이전트에 명령하도록 하였고 대화 패턴을 수집하였다. 수집된 문장은 CfA 모델에 대입하여 기능 실행을 위한 반응 별로 분류하였다. 분류된 5가지 대화 패턴은 스마트TV가 실행하는 기능 특성에 따라 '기능 실행'과 '정보 검색'으로 나눌 수 있었다. 사용자와 TV간의 음성 상호작용에서 모호한 요청의 경우 재확인을 위한 CfC1이 발생하고, 복합 의도나 조건부 요청에 대한 대응이 필요한 경우는 CfC2가 발생한다는 부분도 확인하였다. 본 연구의 결론은 스마트TV에서의 음성 UI 설계에서 Simple Request Type이 가장 효율적 모델이라는 점과 대화형 인터랙션은 가능한 사용자의 모호한 요청을 구체화하기 위한 단계에서만 활용되는 것이 적합하다는 것이다.

A research on man-robot cooperative interaction system

  • Ishii, Masaru
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 1992년도 한국자동제어학술회의논문집(국제학술편); KOEX, Seoul; 19-21 Oct. 1992
    • /
    • pp.555-557
    • /
    • 1992
  • Recently, realization of an intelligent cooperative interaction system between a man and robot systems is required. In this paper, HyperCard with a voice control is used for above system because of its easy handling and excellent human interfaces. Clicking buttons in the HyperCard by a mouse device or a voice command means controlling each joint of a robot system. Robot teaching operation of grasping a bin and pouring liquid in it into a cup is carried out. This robot teaching method using HyperCard provides a foundation for realizing a user friendly cooperative interaction system.

  • PDF

동굴관광용 고층수직이동 승강기의 긴급 음성구동 제어 (Voice Recognition Sensor Driven Elevator for High-rise Vertical Shift)

  • 최병섭;강태현;윤여훈;장훈규;소대화
    • 동굴
    • /
    • 제88호
    • /
    • pp.1-7
    • /
    • 2008
  • Recently, it is one of very interest technology of Human Computer Interaction(HCI). Nowadays, it is easy to find out that, for example, inside SF movies people has talking to computer. However, there are difference between CPU language and ours. So, we focus on connecting to CPU. For 30 years many scientists experienced in that technology. But it is really difficult. Our project goal is making that CPU could understand human voice. First of all the signal through a voice sensor will move to BCD (binary code). That elevator helps out people who wants to move up and down. This product's point is related with people's safety. Using a PWM for motor control by ATmega16, we choose a DC motor to drive it because of making a regular speed elevator. Furthermore, using a voice identification module the elevator driven by voice sensor could operate well up and down perfectly from 1st to 10th floor by PWM control with ATmega16. And, it will be clearly useful for high-rise vertical shift with voice recognition sensor driven.

음성 에이전트에서의 쇼핑 경험에 대한 사용자 경험 연구: 화면 유무와 제품관여도, 대화방식의 차이를 중심으로 (A Study on the UX of Shopping Experience in Conversational Agents: Focus on the Difference between the Presence of a Screen, Product Involvement, and Conversation Style)

  • 이화영;김동환
    • 한국멀티미디어학회논문지
    • /
    • 제25권8호
    • /
    • pp.1156-1166
    • /
    • 2022
  • In this study, we examined voice shopping interaction in which consumers can be involved in the decision-making process. Sixteen kinds of voice shopping interaction were designed with differences in the existence of screen/product involvement/conversation style. Their effects on trust, cognitive load, satisfaction, and continuous intention to use were evaluated through a survey experiment. The main effect of conversation style was significant, and it was found that the more deeply involved users have higher trust. The interaction effect between conversation style and product involvement was also significant. Low involvement product buyers had the most positive user experience from the conversation style that included 'Ask for preference,' while high involvement product buyers had the most positive user experience from the conversation style that included both 'Ask for preference' and 'Question and Answer.' The main effect and interaction effect of the existence of screen was not significant. The results indicate that a positive user experience can be obtained when users are deeply involved in consumer decision-making, especially in purchasing high-involvement products.