• 제목/요약/키워드: Voice User Interface

검색결과 146건 처리시간 0.03초

차량 안전 모니터링 및 사고 예방을 위한 친사용자 환경의 첨단 무선 스마트 시스템 (An Advanced User-friendly Wireless Smart System for Vehicle Safety Monitoring and Accident Prevention)

  • 오세빈;정연호;김종진
    • 한국정보통신학회논문지
    • /
    • 제16권9호
    • /
    • pp.1898-1905
    • /
    • 2012
  • 본 연구에서는 안드로이드 기기와 차량에서 발생하는 안전을 위한 제반정보를 수집, 전송시켜주는 MCU (Micro-control Unit)를 기반으로 개발한 융합형 차량용 스마트 기기인 OSD (On-board Smart Device)를 제안한다. OSD는 RRA (Record, Report & Alarm)의 핵심 기능을 제공하는 안전 및 편의지향 스마트 시스템으로 주행 중 모니터링 데이터의 저장 기능 (Recording as a blackbox), 사고 발생 후 사고 및 긴급 구조의 자동신고 기능 (Report on Accident & Rescue) 및 안전 예방 기능으로 차량의 상태를 알려주는 (Alarm for Status of Vehicle) 경고 시스템을 갖추고 있다. 또한 운전자가 기기를 편리하게 제어하기 위한 음성인식 인터페이스를 도입해 운전자의 안전 운행을 도모하였으며 차량의 정보를 Database 서버에 업로드하여 보다 쉽고 편리하게 정보에 접근할 수 있도록 설계하였다. 따라서 본 연구에서 개발한 OSD는 상대적으로 단순 기능만 제공하는 기존의 차량용 안전 기기와 달리, 친사용자 환경에서 종합적으로 차량안전 데이터 무선전송 뿐만 아니라 영상 그리고 음성인식 기술을 함께 적용한 스마트 기기로서 향후 차량 안전 및 사고예방을 위한 필수 차량 무선 스마트 시스템이 될 것으로 예상된다.

음성인식 기반 인터렉티브 미디어아트의 연구 - 소리-시각 인터렉티브 설치미술 "Water Music" 을 중심으로-

  • 이명학;강성일;김봉화;김규정
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 1부
    • /
    • pp.354-359
    • /
    • 2008
  • 소리-시각 인터랙티브 설치미술인 "Water Music" 은 관객의 음성에 따라서 변하는 물결의 파동을 표현한다. 음정인식 기반 인터페이스 기술을 이용하여 벽면에 비디오 프로젝션 된 시각적 물결이미지로 나타난다. 물결이미지는 동양화의 붓으로 그린 물결과 작은 원형의 입자들을 생성하여 표현된 영상으로 구성된다. 관객은 입김을 불어 넣거나 소리를 냄으로써 화면에서 연속적으로 생성되는 컴퓨터 프로그램 기반 물결의 움직임과 상호 반응할 수 있다. 이러한 공생적인 소리 시각 환경은 관객에게 생각으로 그리고 신체적으로 환영적 공간을 경험하도록 한다. 본 설치작업에서 관객과 상호 반응 할 수 있는 움직이는 물결을 생성하기 위하여 적용된 주요 프로그램은 Visual C++ and DirectX SDK이며, 풀 프레임 3D 렌더링 기술과 파티클 시스템이 사용되었다.

  • PDF

자바 RMI를 이용한 브라우저 통합에 의한 멀티-모달 브라우징 시스템에 관한 연구 (A Study on the Multi-Modal Browsing System by Integration of Browsers Using lava RMI)

  • 장준식;윤재석;김국보
    • 인터넷정보학회논문지
    • /
    • 제6권1호
    • /
    • pp.95-103
    • /
    • 2005
  • 최근 단일 정보기기 시스템에서 다양한 채널을 동시에 접근할 수 있도록 하는 멀티-모달 시스템에 관한 연구가 많이 진행되고 있다. 이와 같은 멀티-모달 시스템은 정보 제공 및 e-비즈니스 어플리케이션에 유비쿼터스적인 접근이 가능하게 하며 HCI(Human-computer Interaction)의 실현 가능성을 높일 수 있다. 향후 더욱 발달되고 안정화 된 멀티-모달 브라우징 시스템을 구현할 수 있다면 사용자는 hands-free, eyes-fee의 환경에서 정보기기와의 상호작용을 최대화할 수 있을 것이다. 본 연구에서는 표준 입출력 모드(키보드, 마우스, 디스플레이)를 지원하는 웹 브라우저와 음성인식 및 음성합성을 지원하는 보이스 브라우저를 통합하는 멀티-모달 브라우징 시스템의 구조를 제시하였고, 이러한 시스템의 예로 영영 사전 검색 어플리케이션을 구현하였다.

  • PDF

감성 상호작용을 갖는 교육용 휴머노이드 로봇 D2 개발 (Design and implement of the Educational Humanoid Robot D2 for Emotional Interaction System)

  • 김도우;정기철;박원성
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2007년도 제38회 하계학술대회
    • /
    • pp.1777-1778
    • /
    • 2007
  • In this paper, We design and implement a humanoid robot, With Educational purpose, which can collaborate and communicate with human. We present an affective human-robot communication system for a humanoid robot, D2, which we designed to communicate with a human through dialogue. D2 communicates with humans by understanding and expressing emotion using facial expressions, voice, gestures and posture. Interaction between a human and a robot is made possible through our affective communication framework. The framework enables a robot to catch the emotional status of the user and to respond appropriately. As a result, the robot can engage in a natural dialogue with a human. According to the aim to be interacted with a human for voice, gestures and posture, the developed Educational humanoid robot consists of upper body, two arms, wheeled mobile platform and control hardware including vision and speech capability and various control boards such as motion control boards, signal processing board proceeding several types of sensors. Using the Educational humanoid robot D2, we have presented the successful demonstrations which consist of manipulation task with two arms, tracking objects using the vision system, and communication with human by the emotional interface, the synthesized speeches, and the recognition of speech commands.

  • PDF

다중 사용자 자율 주행 운전 환경에서 사회적 지위에 따른 에이전트의 제어권이 사용자 경험 요소에 미치는 영향 (Understanding how agent control based on social status affects user experience factors in multi-user autonomous driving environments)

  • 김지연;하주혜;오창훈
    • 문화기술의 융합
    • /
    • 제9권1호
    • /
    • pp.735-745
    • /
    • 2023
  • 본 연구는 자율주행차량의 다중 사용자 환경에서 사회적 지위에 따른 에이전트의 제어권이 차량 소유주의 경험에 어떠한 영향을 미치는지 확인한다. 본 연구의 사용자 조사에서 참가자들은 사회적 지위가 높은 동승자 명령 수행 여부와 과제 중심적 시나리오(주행 상황, 비주행 상황)를 결합한 4가지를 시청한 후 이에 대한 유용성과 통제감을 설문 평가하였다. 그 결과, 유용성의 모든 항목(편리성, 효과성, 효율성)은 주행중 상황과 동승자 명령의 비이행에서 반대 조건에 비해 더 높은 평가를 받았다. 사후 인터뷰 결과, 참가자들은 에이전트가 사회적 지위를 고려하는 것보다 목적 달성을 효과적으로 하였을 때 더욱 긍정적으로 평가하는 것으로 나타났으며, 에이전트에 대한 통제권은 차량 소유주가 가지고 있어야 한다는 의견이 지배적이었다. 이 연구 결과는 향후 자율주행 상황에서 에이전트와 운전자 및 동승자 간의 인터랙션 방식의 디자인을 위한 가이드라인이 될 수 있다는 점에서 의의가 있다.

텔레메틱스 단말기 내의 오디오/비디오 명령처리를 위한 임베디드용 음성인식 시스템의 구현 (Implementation of Embedded Speech Recognition System for Supporting Voice Commander to Control an Audio and a Video on Telematics Terminals)

  • 권오일;이흥규
    • 대한전자공학회논문지TC
    • /
    • 제42권11호
    • /
    • pp.93-100
    • /
    • 2005
  • 본 논문에서는 차량 내에서 음성인식 인터페이스를 이용한 오비오, 비디오와 같은 응용서비스 처리를 위해 임베디드형 음성인식 시스템을 구현한다. 임베디드형 음성인식 시스템은 DSP 보드로 제작 포팅된다. 이는 음성 인식률이 마이크, 음성 코덱 등의 H/W의 영향을 받기 때문이다. 또한 차량 내 잡음을 효율적으로 제거하기 위한 최적의 환경을 구축하고, 이에 따른 테스트 환경을 최적화한다. 본 논문에서 제안된 시스템은 차량 내에서의 신뢰적인 음성인식을 위해 잡음제거 및 특징보상 기술을 적용하고 임베디드 환경에서의 속도 및 성능 향상을 위한 문맥 종속 믹스쳐 공유 음향 모델링을 적용한다. 성능평가는 일반 실험실 환경에서의 인식률과 실제 차량 내에서의 실차 테스트를 통해 검증되었다.

항해안전을 위한 AIS와 ECDIS 기반의 문자통신시스템 개발에 관한 연구 (A Study on the Development of Text Communication System based on AIS and ECDIS for Safe Navigation)

  • 안영중;강석용;이윤석
    • 해양환경안전학회지
    • /
    • 제21권4호
    • /
    • pp.403-408
    • /
    • 2015
  • 해상에서 발생하는 선박 간 음성통신의 문제점을 보완하기 위한 방법으로, 언어적 오류와 VHF 사용제한 및 잡음 등에 영향을 받지 않는 텍스트 기반의 통신시스템을 AIS의 통신기능과 ECDIS의 화면전시 및 입력기능을 연계하는 방법에 착안하여 설계하였다. 개발된 문자통신시스템은 메시지를 이용해 정확한 의사전달이 가능하며, 사용자 편의성 향상을 위한 다양한 UI들을 소프트웨어를 통해 구현하였다. 하드웨어의 추가적인 설치와 개조 없이 구현되고, Message Banner Interface를 이용해 통신문장을 키보드 입력 없이 선택만으로 송신할 수 있으며, 자체 메시지 코딩과 디코딩을 통해 처리속도를 향상시키는 장점을 가진다. 문자통신시스템의 실선적용은 사용자의 언어적 한계와 인식오류를 감소시킬 수 있고, 다양한 VHF 음성통신의 문제를 해결할 수 있는 가장 실용적인 대안으로 판단된다. 또한 해상교통량이 많은 수역에서의 VHF 통신량 감소와 텍스트 기반의 정확한 의사전달과 협력동작 요청으로 선박 간 충돌사고 예방에 도움이 될 것이다.

가상현실 기반의 인공지능 영어회화 시스템 (English Conversation System Using Artificial Intelligent of based on Virtual Reality)

  • 천은영
    • 한국융합학회논문지
    • /
    • 제10권11호
    • /
    • pp.55-61
    • /
    • 2019
  • 외국어 교육을 실현하기 위하여 기존의 다양한 교육 매체들이 제공되고 있지만, 교구 및 매체프로그램에 대한 비용이 많이 들고 실시간 대응력이 떨어지는 단점이 존재한다. 이 논문에서는 VR과 음성인식을 기반으로 한 인공지능 유형의 영어회화 시스템을 제안한다. 시스템 구축을 위해 Google CardBoard VR과 Google Speech API를 이용하며 가상현실 환경 제공 및 대화를 위한 인공지능 알고리즘을 개발하였다. 제안하는 음성인식 서버시스템에서는 사용자가 발화한 문장을 단어 단위로 분리해 데이터베이스에 저장된 데이터 단어들과 비교하여 확률적으로 가장 높은 것을 답으로 제공할 수 있으며 사용자들이 가상현실의 인물과 적절한 대화 및 응답이 가능하다. 대화가 제공되는 기능은 상황별 대화와 주제에 독립적이며, AI 비서와 나눈 대화 내용을 사용자 시스템에서 실시간 확인이 가능하도록 구현하였고 실험을 통하여 음성인식에 대한 응답비율을 확인하였다. 이 논문에서 제안하는 가상현실과 음성인식 기능을 접목한 시스템을 통하여 4차 산업혁명에 관련한 가상교육 콘텐츠 서비스 확장에 이바지할 것을 기대한다.

유비쿼터스 컴퓨팅을 위한 사용자 친화적 지능형 공간 구현 (Implementation of User-friendly Intelligent Space for Ubiquitous Computing)

  • 최종무;백창우;구자경;최용석;조성제
    • 정보처리학회논문지D
    • /
    • 제11D권2호
    • /
    • pp.443-452
    • /
    • 2004
  • 본 논문에서는 유비쿼터스 컴퓨팅을 위한 지능형 공간 제어 시스템을 제안한다. 이 시스템은 전등, TV, 오디오, 전자 열쇠 등을 제어하는 일종의 홈/사무실 자동 제어 시스템으로 기존의 시스템에 비해 다음의 4가지 특징을 갖는다. 첫째, 사용자는 언제 어디서나 이 시스템을 사용할 수 있다. 구체적으로 제안된 시스템은 웹 서버의 기능을 제공하고 있으며 따라서 사용자는 인터넷에 유무선으로 연결된 어떠한 컴퓨터의 브라우저로도 접근할 수 있으며, 또한 휴대폰으로 접근할 수도 있다. 둘째, 이 시스템은 음성 인식 기능을 지원한다. 따라서 기존의 컴퓨터 인터페이스에 익숙하지 않은 사용자들도 보다 인간 중심적인 음성 인터페이스를 통해 시스템을 제어할 수 있다. 셋째, 시스템은 사용자의 요청에 반응하는 수동적인 서비스뿐만 아니라, 사용자 행동의 규칙성을 기반으로 미래를 예측하고 이에 따라 적극적인 서비스도 제공한다. 넷째, 이 시스템은 최근 내장형 기술을 적용하여 구현되었다. 제안된 시스템의 하드웨어는 206MHz로 동작하는 StrongARM CPU, 32MB SDRAM, 16MB 플래시 메모리, 그리고 가전제품의 전원 공급을 제어하는 릴레이 박스(Relay box) 등으로 구성된다. 이러한 하드웨어 플랫폼 상에 내장형 리눅스가 동작하고 있으며, 음성 인식 도구, 내장형 시스템을 위한 웹 서버, 릴레이 박스를 구동하는 GPIO driver 등의 소프트웨어 컴포넌트들이 유기적으로 협력하여 지능형 공간을 제공한다.

멀티미디어 인터페이스 기술을 이용한 유아 대상의 체감형 게임 설계 : 신체 놀이 활동 중심 (Interactive Game Designed for Early Child using Multimedia Interface : Physical Activities)

  • 원혜민;이경미
    • 한국콘텐츠학회논문지
    • /
    • 제11권3호
    • /
    • pp.116-127
    • /
    • 2011
  • 본 논문에서는 유아를 위한 체감형 게임 개발에 필요한 요소로 콘텐츠, 디자인, 음향, 동작인식, 음성인식 기술을 제안하였다. 유아용 체감형 게임은 유아의 감성에 맞춘 교육적 요구가 반영된 콘텐츠와 밝고 친근감 있으면서 사용이 편리한 디자인 요소들이 반영되어야 하고 유아가 친숙하고도 쉽게 게임을 할 수 있게 유도할 수 있는 배경음악과 설명 대사가 사용되는 것이 좋다. 만약 동작 인식과 음성인식 시스템을 유아용 체감형 게임에 사용할 경우 게임 사용자의 연령에 맞는 동작 데이터와 음성 데이터를 사용해 인식률을 높여야 한다. 특히, 본 논문에서는 피부색과 유아 신체 모델을 사용하여 유아의 얼굴과 손을 인식한 후 그 위치를 고려하여 유아의 동작을 인식하였고 유아의 음성 데이터를 수집해 신경망을 이용한 음성인식 기술을 게임에 적용해 신체 놀이 중심 활동의 줄넘기 게임인 '신나게 폴짝'을 개발하였다.