• 제목/요약/키워드: Voice Recognition Interface

검색결과 100건 처리시간 0.025초

스마트카의 인터페이스를 위한 경험 디자인 가이드라인 (Experience Design Guideline for Smart Car Interface)

  • 유훈식;주다영
    • 디자인융복합연구
    • /
    • 제15권1호
    • /
    • pp.135-150
    • /
    • 2016
  • 통신 기술의 발달, 지능형교통체계(ITS: Intelligent Transport Systems)의 확산으로 자동차는 단순한 기계장치에서 종합편의 기능을 가진 제2의 생활 공간으로 변모하고 있으며, 이를 위한 인터페이스로써의 역할을 하는 플랫폼으로 진화하고 있다. 탑승자들에게 다양한 정보를 제공하는 인터페이스 영역이 확장됨에 따라 스마트카 기반의 사용자 경험(UX: User Experience) 연구에 대한 중요성이 높아지고 있다. 이 연구는 스마트카의 사용자 경험 요소에 대한 가이드라인을 제안하는데 목적을 두고 있다. 연구의 수행을 위해 기존 연구를 기반으로 스마트카의 사용자 경험 요소를 기능(function), 상호작용(interaction), 표면(surface)으로 정의하였으며, UX/UI 전문가들의 논의를 통해 각 요소 별로 8개의 대표 기술, 14개의 대표 기능, 8개의 유리창의 위치를 정의하였다. 이 후 100명의 운전자를 대상으로 정의된 스마트카 사용자 경험 요소들에 대한 우선순위를 설문조사 방식으로 분석하였다. 분석을 통해 사용자들은 차량에 주요 기술을 적용함에 있어서 안전, 주행, 감성의 순으로, 조작 방식에 있어서는 음성인식, 터치, 제스처, 물리적 버튼, 아이트레킹의 순으로, 디스플레이 위치에 대해서는 운전석을 중심으로 전방에서 후방으로 높은 우선순위를 가지고 있는 것을 알 수 있었다. 성별에 따른 분석에 있어서는 2개의 기능 외에는 큰 차이를 보이지 않아 남성과 여성에 대한 가이드가 공통되게 적용될 수 있음을 알 수 있었다.

시청자 선택 기반의 EPG 형상의 동적 구현을 위한 EPG형상 제작 방법과 구조 (An EPG Configuration Constructing Method and Structure for Dynamically Implementing Viewer Chosen EPG Configurations)

  • 고광일
    • 융합보안논문지
    • /
    • 제11권4호
    • /
    • pp.51-58
    • /
    • 2011
  • 디지털 기술의 발달로 TV 방송은 데이터 방송 서비스를 지원하는 디지털TV로의 변혁기를 맞고 있는데 비록 데이터 방송 서비스가 기존 아날로그TV에 비해 게임, 주식거래, 날씨정보 등의 풍요한 시청 경험을 제공하지만 기존 방송 시청행태를 복잡하게 변화시켜 디지털TV 조작에 어려움을 느끼는 시청자들을 생산하고 있다. 이 에, 대표적 데이터 방송 서비스인 EPG의 사용성 향상을 위해서 검색 또는 예약과 같은 기능의 사용성 향상, 동작인식과 음성인식 등의 기술 적용, 사용자 인터페이스 사용성의 평가 방법 고안, 그리고 지능적 에이전트 기술의 접목 등과 같은 연구가 진행되고 있는데 아직 시청자들의 다양한 개인적 요인 - IT 서비스에 대한 친숙도, 적응도 등을 고려한 EPG 사용성 향상 방법에 대해서는 연구가 진행되지 않고 있다. 이 에, 본 논문은 방송 네트워크가 시청자들의 개인적 요인에 따라 EPG 형상들을 설계하고 시청자가 선택한 EPG 형상을 수신 단말기에 동적으로 구현하는 방법을 제안한다.

스마트 디바이스 기반 수업분석 프로그램 설계 및 구현 -한국어 특성 반영과 교사활용도 증진을 위한 UI설계를 적용하여- (Design and Implementation of Smart Device Application for Instructional Analysis)

  • 강두봉;정주훈;김영환
    • 컴퓨터교육학회논문지
    • /
    • 제18권4호
    • /
    • pp.31-40
    • /
    • 2015
  • 본 연구의 목적은 수업 개선을 위한 수업분석 프로그램을 스마트 디바이스 기반의 어플리케이션으로 설계 및 구현한 데 있다. 이를 위해 사용자 인터페이스(UI)를 간소화하고, 서술어가 뒤에 나오는 한국어 특성을 감안하였으며, 입체적 분석을 위해 Flanders의 '언어상호작용 분석법', Tuckman의 '수업분위기 분석법', Mcgraw의 '과업집중 분석법'의 3가지 방법을 통한 분석이 가능하게 설계하였다. 본 연구는 선행 연구들과 달리 위 3가지 특징을 적용하여 교사들이 손쉽게 스스로 자신의 수업을 분석할 수 있는 앱을 개발했다는데 의의가 있으며, 일선 교사들은 다른 교사의 도움이나 전문적 지식 없이도 수업을 분석하고 피드백 할 수 있어 자발적 수업개선에 도움이 될 수 있을 것이다. 향후, 최근의 수업 환경에 맞는 수업분석 기법 및 음성인식 시스템 등의 연구와 연계하여 수업분석 원리의 정립과 관련 어플리케이션의 개발에 기초가 될 수 있을 것이다.

지능형 빌딩을 위한 디지털 통합 전관 방송 시스템 개발 (Development of Integrated Public Address System for Intelligent Building)

  • 김정숙;송치원
    • 한국지능시스템학회논문지
    • /
    • 제21권2호
    • /
    • pp.212-217
    • /
    • 2011
  • 본 논문에서는 미래 지능형 빌딩 시스템에서 요구되는 다양한 상황을 인지할 수 있는 지능형 디지털 통합 전관 방송 시스템을 개발하였다. 화재와 재난과 같은 응급 상황이 발생할 때 울리는 경보음을 인식할 수 있으며, 실내 온도와 습도 및 환경 오염도와 같은 다양한 센서 출력을 전달 받아 지능적으로 상황에 맞는 대처 방안을 필요한 곳에 개별적으로 방송할 수 있는 지능형 디지털 통합 전관 방송 시스템을 개발하였다. 외부 입력, 마이크, CD와 MP3 및 라디오 기능 등을 일체형으로 통합하고 소형화한 디지털 전관 방송 시스템을 개발하고 있으며, 시스템이 중앙 집중 제어가 가능하도록 운용 MICOM을 개발하였다. 중앙 집중 제어를 수행하기 위해 운용 MICOM은 제어 계층, 처리 계층 및 사용자 인터페이스 계층인 3계층으로 구성된다.

초음파 도플러 신호를 이용한 음성 합성 (Speech synthesis using acoustic Doppler signal)

  • 이기승
    • 한국음향학회지
    • /
    • 제35권2호
    • /
    • pp.134-142
    • /
    • 2016
  • 본 논문에서는 40 kHz 초음파 신호를 입 주변에 쏘고, 되돌아오는 초음파 신호를 이용해 음성신호를 합성하는 방법을 소개하고 성능을 평가하였다. 발성하고 있는 입주변에 초음파를 방사하게 되면, 입술, 턱, 뺨 등의 움직임으로 인한 변위로 도플러 현상이 발생하고, 이에 따라 반사 신호에는 본래의 주파수 성분과는 다른 도플러 주파수가 관찰되는데, 본 논문에서는 이러한 도플러 주파수를 이용하여 음성 파라메터를 추정하도록 하였다. 음성합성에 앞서서 초음파 도플러 신호와 음성 신호 간의 상관관계를 각 주파수 별로 분석하였으며, 이로부터 초음파 도플러 신호를 이용한 음성 신호의 합성 가능성을 살펴보았다. 변환에는 초음파 도플러의 정적, 동적 특성을 함께 반영한 특징 변수를 사용하였으며 결합-혼합 가우시안 기법을 이용하여 음성 파라메터로 변환하였다. 5명의 피 실험자를 이용한 음성 합성 실험에서 필터뱅크 에너지 값을 초음파신호의 특징변수로, LPC(Linear Predictive Coefficient) 켑스트럼 계수를 음성 변수로 사용하는 경우 가장 우수한 변환 성능을 나타내었다. 음성신호에서 추출한 여기신호를 이용하여 합성음을 생성하고, 이를 청취하였을 때 72.2 %의 평균 인식율이 얻어짐을 확인할 수 있었다.

머신 러닝과 Microservice 기반 디지털 미러 시스템 (Digital Mirror System with Machine Learning and Microservices)

  • 송명호;김수동
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권9호
    • /
    • pp.267-280
    • /
    • 2020
  • 거울은 일반적으로 아말감으로 코팅된 물리적 반사 표면으로 거울 앞의 상을 선명하게 반사한다. 이것은 언제 어디서나 사용이 가능하며 사용자의 얼굴이나 외모를 확인하기 위한 필수적인 도구이다. 현대 소프트웨어 기술의 출현으로 사람들은 실시간 처리, Microservice 및 머신 러닝이 적용된 편의성과 지능성을 통해 거울 반사 기능을 향상시킬 수 있다. 본 논문에서는 거울로써 실시간 반영과 동시에 사용자 맞춤 정보 조회, 공공 정보 조회, 외모를 통한 나이와 감정 탐지 등의 기능을 가진 디지털 거울 시스템 개발을 제안한다. 더불어, 본 시스템은 터치 기반, 음성 인식 기반, 제스처 기반의 Multi-Modal 사용자 인터페이스를 제공한다. 본 논문에서는 이 시스템에 대한 디자인을 제시하고 현재 기술을 이용하여 실시간 거울 반영과 동시에 유용한 정보 제공 및 지능형 머신 러닝 기술을 제공하는 구현 방법을 제안한다.

사물인터넷 환경에서 지능형 스피커의 활용성 분석 (Analysis of the utility of intelligent speakers in the Internet of Things environment)

  • 이성훈;이동우
    • 사물인터넷융복합논문지
    • /
    • 제8권3호
    • /
    • pp.41-46
    • /
    • 2022
  • 사물인터넷환경에서의 스마트 홈은 가정안에서의 모든 기기들이 서로 연결되어 사용자에 최적의 생활환경을 제공함을 목표로 한다. 이러한 스마트 홈 환경에서 모든 기기들을 관리, 제어할 수 있는 방법으로 인공지능 스피커가 사용되고 있다. 기존의 스피커 기능이 단순한 음악재생에서 스마트 홈 공간에 존재하는 모든 기기들을 제어, 관리하는 인터페이스의 역할로 전환되고 있는 것이다. 본 연구에서는 인공지능 스피커의 선두 주자인 미국 및 국내의 시장 현황 및 활용성 분석 내용을 다루었다. 주요 대상 기업으로는 미국의 아마존, 구글, 애플등을 비롯하여 국내의 kakao, SKT, KT등을 대상으로 하였다. 또한 인공지능 스피커에 대한 국내 사용자들의 반응 결과를 토대로 주요 문제점에 대한 도출 및 개선 방안등에 대해 기술하였다.

인공지능 컨트롤러를 이용한 전기 시퀀스 제어 안전 모듈 회로 개발 (Development of Electrical Sequence Control Safety Module Circuit Using Artificial Intelligence Controller)

  • 김홍용
    • 한국재난정보학회 논문집
    • /
    • 제18권4호
    • /
    • pp.699-705
    • /
    • 2022
  • 연구목적: 시퀀스제어는 제조, 유통, 건설, 의료 산업분야의 자동화 등에 응용되어 널리 사용하고 있다. 4차산업의 발전으로 제어분야에 인공지능 융합 기술이 산업에 중요한 요소가 되어가고 있다. 특히 기존 시스템에 마이크로프로세서와 인공지능이 융합된 설비의 안전성과 혁신성을 평가하고 신뢰성 높은 장비개발이 요구되고 있어 교육목적의 장비를 개발하여 해당분야의 발전을 견인하고자 한다. 연구방법: 자체 개발한 일체형 인공지능 컨트롤러 모듈은 기존의 시퀀스 및 PLC제어 회로에 인공지능 능력을 융합한 장비이다. 본 장비의 성능평가항목으로 동작, 음성, 문자, 색상 등의 인식 능력과 회로의 안정성, 신뢰성을 평가하였다. 결론: 시퀀스 및 PLC 회로를 설계 후 융합된 일체형 인공지능 컨트롤러 모듈의 성능평가항목이 모두 만족하였고 회로의 안전성과 신뢰성에 문제가 없는 것으로 나타났다.

대화형 에이전트의 오류 상황에서 사회적 전략 적용: 사전 양해와 사과를 이용한 사례 연구 (Applying Social Strategies for Breakdown Situations of Conversational Agents: A Case Study using Forewarning and Apology)

  • 이유미;박선정;석현정
    • 감성과학
    • /
    • 제21권1호
    • /
    • pp.59-70
    • /
    • 2018
  • 음성인식 기술의 비약적 발전으로 최근 몇 년 사이 대화형 에이전트는 스마트폰, 인공지능 스피커 등을 통해 널리 보급되었다. 음성인식 기술의 인식의 정확도는 인간의 수준까지 발전하였으나, 여전히 말의 의미나 의도를 파악하는 것과 긴 대화를 이해하는 것 등에는 한계를 보이고 있다. 이에 따라 사용자는 대화형 에이전트를 사용함에 있어 다양한 오류 상황들을 경험하고 있으며 이는 사용자 경험에 부정적인 영향을 미칠 수 있다. 또한, 목소리를 주 인터페이스로 하는 인공지능 스피커의 경우, 대화형 에이전트의 기능 및 한계에 대한 피드백의 부족은 지속적 사용을 저해하는 요소로 꼽히고 있다. 따라서 사용자가 대화형 에이전트의 기능 및 한계를 보다 잘 이해하고 오류 상황에서 부정적인 감정을 완화할 수 있는 방안에 대한 연구에 대한 필요성이 높으나, 아직 관련 연구는 미비한 실정이다. 이에 본 연구에서는 사회적 전략 중 '사전 양해'와 '사과'를 대화형 에이전트에 적용하고 이러한 전략이 사용자가 에이전트에 대해 느끼는 인식에 어떠한 영향을 미치는지 조사하였다. 이를 위해 사전 양해와 사과 여부를 나누어 사용자가 대화형 에이전트와 대화하는 데모 영상을 제작하였고, 실험참가자들에게 영상을 보여준 뒤 느끼는 호감도와 신뢰도를 설문을 통해 평가하도록 하였다. 총 104명의 응답을 분석한 결과, 문헌조사를 토대로 한 우리의 예상과는 상반되는 결과를 얻었다. 사전 양해는 오히려 사용자에게 부정적인 인상을 주었으며, 특히 에이전트에 대한 신뢰도에 부정적인 영향을 주었다. 또한 오류 상황에서의 사과는 사용자가 느끼는 호감도나 신뢰도에는 유의미한 영향을 미치지 않았다. 심층인터뷰를 통해 원인을 파악한 결과, 실험참가자들은 인공지능 스피커를 사람과 같은 인격체보다는 단순한 기계에 가깝다고 인식했기 때문에 인간관계에 작용하는 사회적 전략이 영향력을 발휘하지 못한 것으로 해석된다. 이러한 결과는 사용자가 에이전트를 얼마나 기계, 혹은 사람에 가깝게 인식하는지에 따라 오류 상황에 대한 에이전트의 대처 방식 또한 달라져야 함을 보여준다.

고객 맞춤형 서비스를 위한 관객 행동 기반 감정예측모형 (The Audience Behavior-based Emotion Prediction Model for Personalized Service)

  • 유은정;안현철;김재경
    • 지능정보연구
    • /
    • 제19권2호
    • /
    • pp.73-85
    • /
    • 2013
  • 정보기술의 비약적 발전에 힘입어, 오늘날 기업들은 지금까지 축적한 고객 데이터를 기반으로 맞춤형 서비스를 제공하는 것에 많은 관심을 가지고 있다. 고객에게 소구하는 맞춤형 서비스를 효과적으로 제공하기 위해서는 우선 그 고객이 처한 상태나 상황을 정확하게 인지하는 것이 중요하다. 특히, 고객에게 서비스가 전달되는 이른바 진실의 순간에 해당 고객의 감정 상태를 정확히 인지할 수 있다면, 기업은 더 양질의 맞춤형 서비스를 제공할 수 있을 것이다. 이와 관련하여 사람의 얼굴과 행동을 이용하여 사람의 감정을 판단하고 개인화 서비스를 제공하기 위한 연구가 활발하게 이루어지고 있다. 얼굴 표정을 통해 사람의 감정을 판단하는 연구는 좀 더 미세하고 확실한 변화를 통해 정확하게 감정을 판단할 수 있지만, 장비와 환경의 제약으로 실제 환경에서 다수의 관객을 대상으로 사용하기에는 다소 어려움이 있다. 이에 본 연구에서는 Plutchik의 감정 분류 체계를 기반으로 사람들의 행동을 통해 감정을 추론해내는 모형을 개발하는 것을 목표로 한다. 본 연구는 콘텐츠에 의해 유발된 사람들의 감정적인 변화를 사람들의 행동 변화를 통해 판단하고 예측하는 모형을 개발하고, 4가지 감정 별 행동 특징을 추출하여 각 감정에 따라 최적화된 예측 모형을 구축하는 것을 목표로 한다. 모형 구축을 위해 사람들에게 적절한 감정 자극영상을 제공하고 그 신체 반응을 수집하였으며, 사람들의 신체 영역을 나누었다. 특히, 모션캡쳐 분야에서 널리 쓰이는 차영상 기법을 적용하여 사람들의 제스쳐를 추출 및 보정하였다. 이후 전처리 과정을 통해 데이터의 타임프레임 셋을 20, 30, 40 프레임의 3가지로 설정하고, 데이터를 학습용, 테스트용, 검증용으로 구분하여 인공신경망 모형을 통해 학습시키고 성과를 평가하였다. 다수의 일반인들을 대상으로 수집된 데이터를 이용하여 제안 모형을 구축하고 평가한 결과, 프레임셋에 따라 예측 성과가 변화함을 알 수 있었다. 감정 별 최적 예측 성과를 보이는 프레임을 확인할 수 있었는데, 이는 감정에 따라 감정의 표출 시간이 다르기 때문인 것으로 판단된다. 이는 행동에 기반한 제안된 감정예측모형이 감정에 따라 효과적으로 감정을 예측할 수 있으며, 실제 서비스 환경에서 사용할 수 있는 효과적인 알고리즘이 될 수 있을 것으로 기대할 수 있다.