• 제목/요약/키워드: Voice User Interface

검색결과 146건 처리시간 0.031초

Usability Analysis and Improvement Plan for Intelligent Speakers in the 4th Industrial Revolution Environment

  • Seong-Hoon Lee;Dong-Woo Lee
    • International journal of advanced smart convergence
    • /
    • 제12권4호
    • /
    • pp.119-125
    • /
    • 2023
  • Smart home in the 4th industrial revolution environment is where all devices in the home are connected to each other to provide the optimal living environment desired by the user. Artificial intelligence speakers are being used as a way to manage and control all devices used in this environment. The function of an artificial intelligence speaker ranges from simple music playback to serving as an interface that controls and manages all devices in a smart home space. In this study, we investigated and analyzed the usability of artificial intelligence speakers based on the current status of domestic and overseas markets and the survey contents of two organizations (Korea Consumer Agency and Korea Information and Communication Policy Institute (KISDI)). In addition, we investigated and analyzed the usability of artificial intelligence speakers. Based on the results of responses from users from two related organizations, major problems were derived, and major improvement measures, such as discovering new functions and improving voice recognition performance, were also described.

AI 기술 기반 지능형 시니어 도우미 음성인식 시스템 (An AI Technology-based Intelligent Senior Assistant Voice Recognition System)

  • 홍필두
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2019년도 춘계학술대회
    • /
    • pp.355-357
    • /
    • 2019
  • 고령화 사회로 진입하고 있는 지금, 시니어 세대에게는 새로운 디바이스나 IoT기술에 대한 사용자 접점은 매우 불편하다. 이를 개선하기 위하여 우리는 AI 기술 기반 지능형 시니어 도우미 음성인식 시스템을 제안한다. 제안 시스템은 Cloud platform기반 API를 구현하여 머신러닝 처리 활용을 위한 데이터를 축적하며, 치매진단, 치매예방활동을 위한 콘텐츠를 제공하며,시니어 세대를 위한 챗봇 콘텐츠를 제공한다. 우리가 제안한 개념모델을 이용한 서비스를 API로 제공함으로서 시니어 세대에 대한 IoT기반 등 새로운 디바이스의 접근성 및 편리성을 증대하는 계기가 될 것으로 기대한다.

  • PDF

시각장애인용 길안내 서비스 시스템에 대한 연구 (A Study of Pedestrian Navigation Service System for Visual Disabilities)

  • 장영건;차주현
    • 재활복지공학회논문지
    • /
    • 제11권4호
    • /
    • pp.315-321
    • /
    • 2017
  • 이 연구는 시각장애인을 위한 길안내 서비스 시스템의 설계와 구현에 관한 연구이다. 시각장애인을 고려한 사용자 인터페이스로써 음성인식을 통한 스마트폰을 입력도구로 사용하였고, 출력도구는 방향 및 음성안내를 하면서도 주변 환경음을 인식할 수 있는 골전도 헤드셋을 사용하였다. 개발된 시스템은 기존의 길안내용 스마트폰 앱과 달리 보행해야할 방향 정보를 착용한 헤드셋의 좌우 스테레오 음의 크기로 전달하며, 갈림길이나 휘어진 길에 대한 음성안내는 수 미터 전에 안내하여 시각장애인의 보행 속도에 적합하게 안내가 이루어지며, 역방향 보행이나 경로이탈을 즉시 경고하는 장점이 있다. 방향센서로 진행방향에 대한 동적 정밀도가 1.5도인 모션 트랙커를 사용하여 안정적이고 신뢰성 있는 방향 정보를 취득할 수 있었다. GPS의 위치오차를 극복하기 위하여 위치오차에 견고한 경로계획 알고리즘을 제안하였다. 구현된 시스템을 실험한 결과 실험 경로에서 평균 방향각 오차가 6.82도(표준 편차 5.98)로 비교적 안정하게 방향을 유도하여 목적지에 도달하였다.

웹 브라우징을 위한 음성 인터페이스 설계 및 구현 (Design & Implementation of Voice-Interface for Web-Browsing)

  • 이승호;육상조;권영미;이극
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 1998년도 춘계학술발표논문집
    • /
    • pp.106-109
    • /
    • 1998
  • WWW은 무한한 확장 가능성을 지닌 HTTP(Hyper-Text Transfer Protocol)와 편리한 웹 브라우져를 통해 질적, 양적 성장 계속해 왔으며 특히 GUI(Graphic User Interface) 환경에서 동작하는 웹 브라우져는 WWW이 수많은 이용자를 확보하는데 일익을 담당했다. 본 논문에서는 이 웹 브라우져에 음성인식 기술을 접목하여 WWW의 이용자가 자신의 음성으로 편리하게 웹 브라우징을 할 수 있도록 하는 음성 인터페이스를 설계, 구현 한다. 본 음성 인터페이스는 계속적으로 입력되는 음성 정보 중 화자의 발성음을 추출하여 음성 인식기에 전달하는 음성 입력기와 화자의 발성을 인식하는 음성 인식기 그리고 인식결과를 웹 브라우져에게 처리 하도록 하는 결과 처리기로 구성되어 있다.

  • PDF

중국어 학습을 위한 스마트폰 기능성 어플리케이션 설계 및 프로토타입 구현 (Design and Prototype Implementation of a Smartphone Functional Application for Learning Chinese Language)

  • 맹수연;이은령
    • 디지털콘텐츠학회 논문지
    • /
    • 제17권4호
    • /
    • pp.265-272
    • /
    • 2016
  • 중국어 학습에 대한 사회적 관심과 시장이 확대되고 스마트폰 어플리케이션을 기반으로 한 스마트러닝이 교육의 새로운 패러다임으로 자리 잡으면서 중국어 교육을 위한 어플리케이션의 연구와 개발도 활발해지고 있다. 본 논문에서는 스마트폰의 멀티미디어 구현 특성과 사용자 인터렉션 기능을 활용하여 기초적인 중국어 한자를 학습할 수 있는 '중국어 교육용 기능성 어플리케이션'을 설계하고 프로토타입을 구현하여 제시하였다. 중국어 한자 표현, 발음 청취, 음성 녹음 및 비교 청취, 관련 내용 학습, 테스트 등의 기능을 간편한 사용자 인터페이스로 구현하였다. 향후 연구에서는 중국어 회화에 적용될 수 있는 사용자 인터페이스와 학습자 개인별 평가 지수 등을 통해 추가적인 도구 없이도 효과적인 학습이 가능한 프로토타입을 개발할 것이다.

전사텍스트를 이용한 반자동 레이블링 구현 (Implement of Semi-automatic Labeling Using Transcripts Text)

  • 원동진;장문수;강선미
    • 한국지능시스템학회논문지
    • /
    • 제25권6호
    • /
    • pp.585-591
    • /
    • 2015
  • 구어 연구를 위한 전사 과정에서 문자로 표현된 발화를 녹음 음성에 연결해주는 작업을 레이블링이라고 한다. 기존 레이블링 도구들은 대부분 수동으로 작업이 이루어진다. 제안하는 반자동 레이블링은 자동화 모듈과 수동 조정 모듈로 구성된다. 자동화 모듈은 G.Saha 알고리즘을 활용하여 음성구간을 추출하고, 기구축된 발화텍스트의 발화 수와 발화의 길이 정보를 이용하여 발화구간을 예측한다. 본 논문에서는 기존 수동 도구의 정확성을 유지하기 위하여 자동 레이블링된 발화구간을 보정하기 위한 수동 조정 사용자 인터페이스를 제공한다. 제안하는 반자동 레이블링 알고리즘으로 구현한 도구는 기존 수동 레이블링 도구와 비교하여 작업 속도가 평균 27% 향상되었다.

스마트 스피커와 요리하기: 음성기반 레시피 제공 서비스의 사용자 경험 (Cooking with a smart speaker: User experience of cooking with a voice-only recipe service)

  • 정구민;정혜선
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제27권5호
    • /
    • pp.13-23
    • /
    • 2021
  • 음성 기반 컴퓨팅 기술과 서비스의 수준이 높아지면서, 이러한 음성 기반 기술을 활용할 분야도 넓어지고 있다. 그 중 스마트 스피커의 보급이 증가하면서 다양한 음성기반 서비스가 출시되고 있고, 1인 가구 및 요리 방송이 증가하면서 스마트 스피커를 사용한 레시피 서비스 제공이 시작되었다. 전통적으로 레시피 서비스는 시각적인 정보제시를 주로 사용하였으나, 사용자의 경험 증진을 위해서는 음성만으로도 동일한 정보를 적절하게 제공해야 한다. 스마트 스피커가 가진 장점은 '핸즈프리'가 가능하다는 것인데, 이는 요리 상황에서 효율적으로 쓰일 수 있으며, 시각을 사용하지 못하는 사용자에게 도움이 될 수 있다. 본 연구에서는 음성 기반 레시피 서비스가 사용자의 요리 활동을 얼마나 효과적으로 지원하는지 살펴보았다. 현장연구로 요리 숙련도별로 새로운 레시피를 조리하도록 하였고, 소리내어 생각하기(think-aloud), 관찰 및 인터뷰를 실시했다. 그 결과 음성 기반 레시피 서비스는 사용자의 손을 자유롭게 하여 조리 활동을 중단하지 않으면서 레시피를 확인할 수 있도록 하였으나, 조리지시가 한꺼번에 주어져서 사용자가 기억 부담을 하는 것이 관찰되었다. 시각적인 정보의 부재는 심각한 단점으로 작용하지는 않았으나, 조리의 효율성과 완성도에 영향을 주었다. 본 연구의 결과는 HCI의 발전과 음성을 사용한 레시피 서비스 사용자 경험 연구에 참고 될 수 있을 것으로 기대된다.

몰입형 가상환경에서 가상 보조 에이전트의 인터페이스 응용 (Interface Application of a Virtual Assistant Agent in an Immersive Virtual Environment)

  • 나기리;김진모
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제30권1호
    • /
    • pp.1-10
    • /
    • 2024
  • 본 연구는 혼합현실과 가상현실을 포함하는 몰입형 가상환경에서 OpenAI의 ChatGPT를 활용한 가상 보조 에이전트의 인터페이스 응용에 관한 새로운 방법을 제안한다. 제안하는 응용 방법은 사용자의 질의에 응답하는 정보 에이전트와 사용자의 요구에 맞춰 가상 객체, 환경 등을 제어하는 제어 에이전트로 구성된다. 이를 위해, Unity 3D 엔진, OpenAI, 그리고 가상현실과 혼합현실 사용자 참여를 위한 패키지 및 개발 도구를 통합하는 개발환경을 설정한다. 그리고 음성 입력으로부터 질문 쿼리에서 답변 쿼리, 또는 제어 요구 쿼리에서 제어 스크립트로 생성으로 연결되는 작업 흐름을 설정한다. 이를 기반으로 혼합현실, 가상현실 체험 환경을 직접 제작하고 에이전트의 성능 확인을 위한 실험을 정보 에이전트의 반응 시간, 제어 에이전트의 정확도로 나누어 진행하였다. 결과적으로 제안하는 인터페이스 응용을 통해 사용자 친화적이고 단순하고 반복적인 작업에서의 효율을 높이는데 유용할 수 있음을 확인하였다. 우리는 새롭게 제안하는 인터페이스를 통해 몰입형 가상환경에서 인터페이스로의 응용에 관한 새로운 방향성을 제시하고 발견된 문제점과 현재까지의 한계점을 분명히 밝힌다.

텔레매틱스 단말기에서 사용가능한 Haptic 디바이스 개발 동향 (A Recent Development of Haptic Devices for Temematics Control Units)

  • 마진석;김홍남
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2004년도 학술대회 논문집 정보 및 제어부문
    • /
    • pp.406-409
    • /
    • 2004
  • Recently, many auto makers and OEM are now developing various telematics control units(TCU). TCU has an embedded OS and many user-friendly services inherently and frequently the driver operates the TCU on driving a car. Although the TCU has some accident resistive functions, secondhand accidental problem arose. Current Korean domestic TCUs have some interfaces such as push-button, touch screen, voice recognition and etc. But, because of operational complexity, technical limitation, it has not sufficient user-friendly interface. In this paper, to overcome this problem, haptic devices are considered. We present haptic devices and applications on the basis of that of U.S. Immersion co. and also BMW's iDrive technology.

  • PDF

Design and Implementation of Procedural Self-Instructional Contents and Application on Smart Glasses

  • Yoon, Hyoseok;Kim, Seong Beom;Kim, Nahyun
    • Journal of Multimedia Information System
    • /
    • 제8권4호
    • /
    • pp.243-250
    • /
    • 2021
  • Instructional contents are used to demonstrate a technical process to teach and walkthrough certain procedures to carry out a task. This type of informational content is widely used for teaching and lectures in form of tutorial videos and training videos. Since there are questions and uncertainties for what could be the killer application for the novel wearables, we propose a self-instruction training application on a smart glass to utilize already-available instruction videos as well as public open data in creative ways. We design and implement a prototype application to help users train by wearing smart glasses specifically designed for two concrete and hand-constrained use cases where the user's hands need to be free to operate. To increase the efficiency and feasibility of the self-instruction training, we contribute to the development of a wearable killer application by integrating a voice-based user interface using speech recognizer, public open data APIs, and timestamp-based procedural content navigation structure into our proof-of-concept application.