• 제목/요약/키워드: Voice User Interface

검색결과 146건 처리시간 0.027초

디스플레이 탑재형 음성 인터페이스를 통한 음성쇼핑 서비스 휴리스틱 개발 (The Development of Heuristics for Voice Shopping Service through Voice Interface with Display)

  • 권현정;이지연
    • 정보관리학회지
    • /
    • 제39권2호
    • /
    • pp.1-33
    • /
    • 2022
  • 음성을 통해 상품을 구매하는 음성쇼핑 서비스는 미래에 본격적으로 상용화될 것으로 예상된다. 본 연구에서는 음성쇼핑이 세계적으로 일상이 될 미래를 대비하여 디스플레이 탑재형 음성 인터페이스를 활용한 음성쇼핑 서비스 휴리스틱을 개발하였다. 첫째, 이론적 접근으로 '시각 인터페이스', '음성 인터페이스', '쇼핑 서비스'의 설계 원칙을 주제로 한 논문 50건을 읽고 문헌조사를 실시하여 총 29개의 설계 원칙 초안을 제작하였다. 둘째, 실증적 접근으로 소비자 의사결정과정에 따른 쇼핑 경험 및 쇼핑 맥락에서의 정보추구행위에 관한 포커스 그룹 인터뷰를 진행하여 문헌 연구에서 미흡했던 분야인 이용자 경험 측면을 보완한 휴리스틱 초안을 작성하였다. 셋째, 델파이 조사를 통해 위의 두 단계를 거쳐 개발된 휴리스틱 초안에 대하여 20명의 UX, 서비스기획, 인공지능 개발, 쇼핑 분야 전문가들에게 전문가 평가를 해줄 것을 요청하였다. 3회에 걸친 델파이 조사를 통해 최종 휴리스틱을 제안하였다.

VoiceXML VUI Browser 설계/구현 (Design and Implementation of VoiceXML VUI Browser)

  • 장민석;예상후
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2002년도 추계종합학술대회
    • /
    • pp.788-791
    • /
    • 2002
  • 현재의 웹 환경은 HTML로 구성이 되어있으며 이로 인해 하이퍼링크를 따라가기 위해 마우스 클릭을 통해 작업하는 GUI 환경이 주를 이룬다. 하지만 이러한 방법은 인간이 가장 손쉽게 사용하는 음성과 비교해 볼 때 상당히 불편한 축에 속한다. 본 논문에서는 이를 해결하기 위해 현재 무르익은 음성인식/합성 기술과 전화기를 통해 정보를 제공하고자 하는 XML의 파생언어인 VoiceXML을 이용하여, 현재의 HTML주축인 GUI 웹 환경을 VoiceXML을 이용하여 VUI(Voice User Interface) 환경으로 전환해 주는 VoiceXML VUI Browser를 설계/구현하였다.

  • PDF

음성 인터페이스와의 상호작용에서 AI 음성이 성별에 따른 사용자의 감성 만족도에 미치는 영향 (Moderating Effects of User Gender and AI Voice on the Emotional Satisfaction of Users When Interacting with a Voice User Interface)

  • 신종규;강준모;박영진;김상호
    • 감성과학
    • /
    • 제25권3호
    • /
    • pp.127-134
    • /
    • 2022
  • 본 연구의 목적은 음성 인터페이스(Voice User Interface, VUI)를 이루는 설계변수 중 사용자에게 긍정적인 감성을 유발하는 설계변수를 확인하는 것이다. 특히, 사용자의 성별과 설계변수의 조절 효과를 분석하여 VUI와 상호작용하는 동안 사용자가 만족할 수 있는 적절한 설계변수 수준을 찾아보고자 하였다. 선행연구를 통해 VUI에 사용되는 음성설계변수 중에서 사용자의 감성 만족도에 영향을 미칠 수 있는 설계변수 6가지를 도출하였다. 설계변수는 수준을 조절할 수 있도록 Wizard of OZ를 활용하여 VUI 시스템을 구현하였고, 6가지 설계변수의 수준을 조합하여 사용자와 음성으로 대화를 할 수 있도록 구성하였다. 실험에 참여한 사용자는 총 80명으로, 남/여 성비를 고려하여 각 40명씩 모집하였다. 사용자는 VUI와 주어진 임무에 대한 정답을 알아내기 위해 자연스러운 대화를 진행하며, 그동안의 얼굴표정 변화에 대한 이미지 데이터를 수집 및 표정 분석 소프트웨어를 통해 Valence 점수로 변환하였다. Valence 데이터를 기반으로 빈도 및 카이제곱 분석을 통해 확인한 결과, 사용자의 성별과 AI gender간의 조절효과가 유의한 것으로 나타났다. 이 결과는 VUI를 설계할 때 사용자의 성별 차이를 고려하는 것이 좋다는 것을 의미한다. 결론적으로, 남성 사용자의 경우 성인/남성/높은 톤의 음성, 여성 사용자의 경우 성인/여성/중간톤의 음성이 향후 만족스러운 인터랙션 구현을 위한 VUI 설계에 주요한 가이드라인인 것을 확인하였다. 본 연구의 결과를 통해 향후 다양한 인적 요소를 고려하여 UX 관점에서 인간-AI 상호작용을 보다 섬세하게 분석할 수 있을 것이며, 표정을 통한 실시간 감성 측정을 위한 기초연구로 활용될 수 있을 것이다.

Interactive Adaptation of Fuzzy Neural Networks in Voice-Controlled Systems

  • Pulasinghe, Koliya;Watanabe, Keigo;Izumi, Kiyotaka;Kiguchi, Kazuo
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2002년도 ICCAS
    • /
    • pp.42.3-42
    • /
    • 2002
  • Fuzzy Neural Network (FNN) is a compulsory element in a voice-controlled machine due to its inherent capability of interpreting imprecise natural language commands. To control such a machine, user's perception of imprecise words is very important because the words' meaning is highly subjective. This paper presents a voice based controller centered on an adaptable FNN to capture the user's perception of imprecise words. Conversational interface of the machine facilitates the learning through interaction. The system consists of a dialog manager (DM), the conversational interface, a Knowledge base, which absorbs user's perception and acts as a replica of human understanding of imprecise words,...

  • PDF

중증언어장애자를 위한 음성 출력 임베디드 시스템을 기반으로 한 최적의 사용자 인터페이스 구현 (Implementation of Optimal User Interface based on the Voice Output Embedded System for People with Profound Communication Disorder)

  • 유병혁;이상훈;서희돈
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2006년도 하계종합학술대회
    • /
    • pp.885-886
    • /
    • 2006
  • The purpose of this study is to develop the optimal system(AAC device), which helps a person with a profound communication disorder to communicate with other people. Therefore, this system includes the user interface enhancement that is the user adaptation mode algorithm. The symbol is made with a text and an icon which is converted into Korean. The message contiol operates scanning and adjusts rate control of row-column scanning and linear scanning. This embedded system includes voice input/output and voice recording as well suggested method that could apply optimal device access algorithm from clinical environment. Therefore, we are experting that even the current system itself will be able to improve the life quality of people who need to communicate with the help of devices.

  • PDF

차내 경험의 디지털 트랜스포메이션과 오디오 기반 인터페이스의 동향 및 시사점 (Trends and Implications of Digital Transformation in Vehicle Experience and Audio User Interface)

  • 김기현;권성근
    • 한국멀티미디어학회논문지
    • /
    • 제25권2호
    • /
    • pp.166-175
    • /
    • 2022
  • Digital transformation is driving so many changes in daily life and industry. The automobile industry is in a similar situation. In some cases, element techniques in areas called metabuses are also being adopted, such as 3D animated digital cockpit, around view, and voice AI, etc. Through the growth of the mobile market, the norm of human-computer interaction (HCI) has been evolving from keyboard-mouse interaction to touch screen. The core area was the graphical user interface (GUI), and recently, the audio user interface (AUI) has partially replaced the GUI. Since it is easy to access and intuitive to the user, it is quickly becoming a common area of the in-vehicle experience (IVE), especially. The benefits of a AUI are freeing the driver's eyes and hands, using fewer screens, lower interaction costs, more emotional and personal, effective for people with low vision. Nevertheless, when and where to apply a GUI or AUI are actually different approaches because some information is easier to process as we see it. In other cases, there is potential that AUI is more suitable. This is a study on a proposal to actively apply a AUI in the near future based on the context of various scenes occurring to improve IVE.

가전제품의 VUI 가이드라인에 대한 연구 (A Study on Voice User Interface for Domestic Appliance)

  • 채행석;홍지영;이주환;전명훈;김민선;허우범;안정희;한광희
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2007년도 학술대회 2부
    • /
    • pp.185-192
    • /
    • 2007
  • 음성 사용자 인터페이스(Voice User Interface, 이하 VUI) 는 음성을 매개로 일어나는 인간과 기계 간 인터페이스를 뜻한다. 음성 인식율의 향상과 음성 재생 장치의 발달에 힘입어 최근 들어 휴대폰과 카 네비게이션 시스템에 주로 적용되고 있다. 최근 이러한 경향은 A/V 시스템 등 가전제품(Domestic Appliance) 에도 확대되고 있는데 본 연구에서는 사용자와 필수적이고 빈번한 상호작용이 일어나는 백색 가전을 대상으로 사용자를 만족시키는 음성 인터페이스의 주요 속성 중 음성 생성(Speech Generation)과 관련된 음성 표현을 중점 연구하였다. 연구방법으로 먼저 주부들이 느끼는 가전에서의 문제점과 VUI 로서 해결가능성에 대하여 F.G.I. 를 통하여 조사하여 주요 이슈를 도출하고, 대표적 백색 가전인 에어컨, 세탁기, 김치냉장고, 냉장고, 식기세척기, 오븐레인지 등 6개 제품에 대하여 음성의 물리적 특성, 내용적 특성, 기능에 따른 배치에 대하여 조건에 따라 다양한 프로토타입을 제작한 후 실제 환경과 유사한 실험실 상황에서 사용자의 선호도, 적합도 및 수행을 측정하였다. 연구 결과 각 이슈에 따라 가전제품에 적합한 VUI 가이드라인 특성을 찾아내었다.

  • PDF

제품 트리거로서 행동인식의 사용자 경험 디자인 연구 - 제품디자인을 중심으로 - (Study on User Experience design in Gesture Interaction as a Product Trigger - Focusing on Product Design -)

  • 민새얀;이캐시연주
    • 디지털융복합연구
    • /
    • 제17권5호
    • /
    • pp.379-384
    • /
    • 2019
  • 본 연구는 최근 급증하는 음성 인터랙션의 기능적 면모에서 사용자가 우선으로 측정하는 경험과 문제점을 파악하고 새롭게 나타날 행동인식 인터랙션의 문법에 적합한지 그 발전 가능성을 탐구하는 데 목적이 있다. 연구방법으로 문헌 연구를 통해 그동안 제품에 사용되던 제품 인터페이스의 이론적 고찰 과정을 거친 후 음성인식을 제품의 트리거로서 사용해 본 20-30대 사용자를 대상으로 심층 인터뷰를 진행하여 사용자 경험 측면에서 이용 경험과 개선 방안에 대해 정리하였다. 그 결과, 정확성 신뢰도 하락으로 인해 음성인식 인터랙션의 선호도가 감소하고 있다는 점과 물리적 거리 배제성이라는 기능적 측면에 알맞은 인터페이스가 필요하다는 결론을 도출해 낼 수 있었다. 이 연구는 제품 트리거 인터페이스에 관한 연구로, 문제를 발견하고 이에 대해 개선 방안을 제시했다는 점에 의의가 있다. 하지만 구체적인 방안을 설계하지 못했다는 데에 한계가 있다. 이 연구를 기점으로 음성인식 인터랙션의 개선 방안을 보완하고, 행동인식 인터랙션과 관련된 후속연구가 이루어져 제품디자인 인터페이스 개선에 도움이 되기를 바란다.

음성기반 멀티모달 사용자 인터페이스의 사용성 평가 방법론 (Usability Test Guidelines for Speech-Oriented Multimodal User Interface)

  • 홍기형
    • 대한음성학회지:말소리
    • /
    • 제67호
    • /
    • pp.103-120
    • /
    • 2008
  • Basic components for multimodal interface, such as speech recognition, speech synthesis, gesture recognition, and multimodal fusion, have their own technological limitations. For example, the accuracy of speech recognition decreases for large vocabulary and in noisy environments. In spite of those technological limitations, there are lots of applications in which speech-oriented multimodal user interfaces are very helpful to users. However, in order to expand application areas for speech-oriented multimodal interfaces, we have to develop the interfaces focused on usability. In this paper, we introduce usability and user-centered design methodology in general. There has been much work for evaluating spoken dialogue systems. We give a summary for PARADISE (PARAdigm for Dialogue System Evaluation) and PROMISE (PROcedure for Multimodal Interactive System Evaluation) that are the generalized evaluation frameworks for voice and multimodal user interfaces. Then, we present usability components for speech-oriented multimodal user interfaces and usability testing guidelines that can be used in a user-centered multimodal interface design process.

  • PDF

차량용 음성대화 인터페이스의 Barge-in 기능이 주행 경험에 미치는 효과 연구 - 내비게이션 및 음악서비스 중심으로 - (The Effect of Barge-in Function of In-Vehicle Voice Conversational Interface on Driving Experience - Focus on Car Navigation and Music Services -)

  • 김택수;김지현;최준호
    • 디자인융복합연구
    • /
    • 제17권1호
    • /
    • pp.17-28
    • /
    • 2018
  • 운전 중 주행목적 외에 기기를 손으로 조작하는 행동은 사고위험을 높이는 주된 요인이며, 이를 보완할 수 있는 차량용 음성대화 인터페이스의 디자인이 최근 활발히 연구되고 있다. 이 연구는 차량용 음성대화 인터페이스의 Barge-in 기능의 사용이 사용자 경험에 미치는 영향을 확인하고자 하였다. 실험참가자를 대상으로 모의 주행을 하면서 내비게이션 조작과 음악재생 맥락으로 나누어 두 가지 태스크를 수행하도록 하도록 하였다. 각 참가자의 태스크 수행 후 기능 사용자 경험 측정을 위한 설문조사를 실시하였으며, 사용자 경험 요인으로 유용성, 사용성, 만족도, 감성을 측정하였다. 그 결과 대부분의 경험 요인에서 Barge-in 기능을 사용할 경우가 더 낫다고 평가되었다. 내비게이션 조작에서는 사용성 차원, 음악재생에서는 사용성, 감성 차원에서 유의미한 차이가 나타나 Barge-in 기능이 실제 사용자의 사용성과 감성 차원의 긍정적인 효과가 있음을 알 수 있었다.