• 제목/요약/키워드: 음성 상호작용

검색결과 209건 처리시간 0.023초

TRACE : 상호작용 음성인식 Neural Network모델

  • 김명원
    • 정보와 통신
    • /
    • 제7권3호
    • /
    • pp.16-26
    • /
    • 1990
  • 본 논문은 음성인식을 위한 neural network의 하나인 TRACE model에 대하여 기술한다. TRACE model은 HEARSAY 음성이해 system의 blackboard 구조와 유사한 trace 구조를 사용하여 정보처리 unit들간의 자극성 내지 억제성 연결에 의한 상호작용의 결과로서 음성을 인식한다. TRACE model은 특징층, 음소층 그리고 단어층의 3층으로 구성되며 층간의 unit들이 상호작용할 뿐 아니라 동일층의 unit들이 상호경쟁함으로써 음성인식에 있어서의 context 효과, segmentation 및 잡음 등의 문제를 해결할 수 있다.

  • PDF

소프트웨어 로봇을 위한 인간-로봇 상호작용

  • 곽근창;지수영;조영조
    • 전자공학회지
    • /
    • 제33권3호
    • /
    • pp.49-55
    • /
    • 2006
  • 인간과 로봇의 자연스러운 상호작용을 위하여 영상과 음성을 기반으로 한 인간-로봇 상호작용 (HRI: Human Robot Interaction) 기술들을 소개한다. URC개념의 서버/클라이언트 구조를 갖는 소프트웨어 로봇에 수행 가능한 얼굴 인식 및 검증, 준 생체정보(semi biometrics)를 이용한 사용자 인식, 제스처인식, 화자인식 및 검증, 대화체 음성인식 기술들에 대하여 살펴본다. 이러한 인간-로봇 상호작용 기술들은 초고속 인터넷과 같은 IT 인프라를 이용하는 URC(Ubiquitous Robotic Companion) 기반의 지능형 서비스 로봇을 위한 핵심기술로서 사용되어진다.

  • PDF

가상 휴먼 상호작용 저작 툴킷 (Authoring Toolkit for Interaction with a Virtual Human)

  • 정진호;조동식
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 춘계학술발표대회
    • /
    • pp.564-566
    • /
    • 2021
  • 최근 가상 휴먼은 국방, 의료, 교육, 엔터테인먼트 등 다양한 분야에서 널리 활용되고 있다. 가상 휴먼을 이용한 상호작용은 사용자가 현실 세계의 실제 친구와 대화하는 것처럼 자연스럽게 소통하는 방식으로 운용이 되고, 이를 위해서는 사용자의 음성, 동작, 감정 등 다양한 입력을 기반으로 반응하는 가상 휴먼 출력 등 상호작용 매핑 관계를 제작하여야 한다. 하지만, 기존 가상 휴먼 상호작용 방법은 미리 정해진 패턴을 수작업인 프로그래밍을 통해 제작하여 개발 기간이 오래 걸리고, 수정이 용이하지 못한 단점이 있다. 본 논문에서는 가상 휴먼 상호작용을 위해 음성, 동작, 감정 등 사용자의 멀티모달 입력과 가상 휴먼 반응에 대한 저작을 수행하는 툴킷을 제시한다. 본 논문에서 제시한 저작도구를 통해 쉽고 빠르게 사용자와 가상 휴먼 상호작용 표현을 생성할 수 있다.

디지털 소외계층을 위한 지능형 IoT 애플리케이션의 공개 API 기반 대화형 음성 상호작용 기법 (Open API-based Conversational Voice Interaction Scheme for Intelligent IoT Applications for the Digital Underprivileged)

  • 장준혁
    • 스마트미디어저널
    • /
    • 제11권10호
    • /
    • pp.22-29
    • /
    • 2022
  • 음성 상호작용은 스마트 기기의 활용에 능숙하지 못한 디지털 소외계층을 대상으로 하는 애플리케이션에서 특히 효과적이다. 그러나 공개 API를 기반으로 한 애플리케이션들은 기존의 터치스크린 중심의 UI와 제공되는 API의 한계로 인해 음성 신호를 짧고 단편적인 입출력에만 활용하고 있다. 본 논문에서는 사용자와 지능형 모바일/IoT 애플리케이션의 대화형 음성 상호작용 모델을 설계하고, 편집 거리(Levenshtein distance) 기반 키워드 탐지 기법을 제안한다. 제안 모델 및 기법은 안드로이드 환경에서 구현되었으며, 편집 거리 기반 키워드 탐지 기법은 음성인식을 통해 부정확하게 인식된 키워드에 대해 기존 기법보다 높은 인식률을 보였다.

지능형 서비스 로봇을 위한 인간-로봇 상호작용 기술

  • 유범재
    • 기계저널
    • /
    • 제44권4호
    • /
    • pp.63-68
    • /
    • 2004
  • 이 글에서는 로봇에 사용할 수 있는 상호작용 기술들이 아직 초기연구 단계에 머무르고 있어 기존의 얼굴인식과 음성인식 기술동향에 대해 간략하게 소개하고 미국 CMU의 Human-Computer Interaction Institute(HCII)에서 진행 중인 ACT-R(Adaptive Character of Thought)' 프로젝트를 통해 보다 자연스러운 인간-로봇 상호작용의 개념을 소개해한다.

  • PDF

VR 회의 어플리케이션의 사용자의 몰입도 증가를 위한 상호작용 구현 (Implementation of interaction to increase user immersion in VR conferencing applications)

  • 유도진;김수지;강예진;김휘준;박은지;이채희;장유진;정민혁;김상균
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.117-119
    • /
    • 2021
  • 본 논문에서는 VR 기반 원격 회의 어플리케이션에서 높은 사용자의 몰입도를 제공하기 위한 상호작용 기능들을 제안한다. 우선, 향기 효과를 구성하여 감각 효과 제공을 통한 상호작용 방법을 제안한다. 다음으로 이모티콘과 아바타의 애니메이션을 통해 다양한 감정적 상호작용을 제안한다. 마지막으로 다수 사용자의 원활한 음성 커뮤니케이션을 위한 테이블 별 음성 채널 분리를 기능을 제안한다. 본 어플리케이션은 Oculus Quest 2 기기를 통하여 VR 환경에서 구현되었다.

  • PDF

자동 적응 기반 메타버스 가상 휴먼 상호작용 기법 (Automatic Adaptation Based Metaverse Virtual Human Interaction)

  • 정진호;조동식
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권2호
    • /
    • pp.101-106
    • /
    • 2022
  • 최근 가상 휴먼은 국방, 의료, 산업, 유통, 문화, 엔터테인먼트 등 다양한 서비스 분야에서 교육, 훈련 정보 가이드, 홍보 전시 등 널리 활용되고 있다. 또한, 가상 휴먼을 통해 원격지에 접속한 사용자와 상호작용하기 위한 메타버스 서비스가 급속히 확대 적용될 것으로 전망하고 있다. 메타버스 환경 안에서 가상 휴먼(혹은 아바타)을 이용한 상호작용은 참여자가 현실 세계의 실제 친구와 대화하는 것처럼 자연스럽게 소통하는 방식으로 운용이 되고, 이를 위해서는 사용자의 음성, 동작, 감정 등 다양한 입력을 기반으로 반응하는 가상 휴먼 상호작용 매핑 관계를 제작하여야 한다. 또한, 현실 세계의 변화에 동작하는 가상 휴먼의 경우 현실의 환경에 기반한 상호작용 동작이 되도록 지원하여야 한다. 하지만, 기존 가상 휴먼 상호작용 방법은 미리 정해진 반응형 패턴을 제작하기 위해 수작업으로 동작 결과를 프로그래밍하여 구현되었다. 이러한 방법은 개발 기간이 상대적으로 많이 소요되고, 상호작용 수정이 쉽게 변경하지 못하는 단점이 있다. 또한, 실제 주변 환경의 영향에 의해 반응적으로 동작하는 상호작용을 지원하기가 어렵다고 할 수 있다. 본 논문에서는 가상 휴먼의 직관적인 상호작용을 위해 음성, 동작, 감정 등 사용자의 멀티모달 입력과 주변 환경에 대한 반응하는 가상 휴먼 제작 방법을 제시한다. 이를 위한 가상 휴먼 상호작용 저작도구를 통해 쉽고 빠르게 사용자와 반응하는 가상 휴먼의 표현을 생성하고, 가상 휴먼이 자동 적응 기반으로 사용자 입력 및 주변 환경에 변화에 동작할 수 있도록 하였다.

감성적 인간 로봇 상호작용을 위한 음성감정 인식 (Speech emotion recognition for affective human robot interaction)

  • 장광동;권오욱
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 1부
    • /
    • pp.555-558
    • /
    • 2006
  • 감정을 포함하고 있는 음성은 청자로 하여금 화자의 심리상태를 파악할 수 있게 하는 요소 중에 하나이다. 음성신호에 포함되어 있는 감정을 인식하여 사람과 로봇과의 원활한 감성적 상호작용을 위하여 특징을 추출하고 감정을 분류한 방법을 제시한다. 음성신호로부터 음향정보 및 운율정보인 기본 특징들을 추출하고 이로부터 계산된 통계치를 갖는 특징벡터를 입력으로 support vector machine (SVM) 기반의 패턴분류기를 사용하여 6가지의 감정- 화남(angry), 지루함(bored), 기쁨(happy), 중립(neutral), 슬픔(sad) 그리고 놀람(surprised)으로 분류한다. SVM에 의한 인식실험을 한 경우 51.4%의 인식률을 보였고 사람의 판단에 의한 경우는 60.4%의 인식률을 보였다. 또한 화자가 판단한 감정 데이터베이스의 감정들을 다수의 청자가 판단한 감정 상태로 변경한 입력을 SVM에 의해서 감정을 분류한 결과가 51.2% 정확도로 감정인식하기 위해 사용한 기본 특징들이 유효함을 알 수 있다.

  • PDF

PRAAT 소프트웨어: 교사 목소리 분석을 위한 맞춤법 상호작용 도구 (PRAAT Software: A Spech Interaction Tool to Analyze Teacher Voices)

  • 엘라 키드
    • 융합정보논문지
    • /
    • 제9권9호
    • /
    • pp.158-165
    • /
    • 2019
  • 본 논문은 음성 소프트웨어 기술의 사용을 통해 영어의 내부 영역 내에서 음성 상호 작용의 영향을 검토한다. 기본주파수(F0)는 국적, 연령, 성별을 기준으로 원어민(연령 30-55세) 음성 효과를 분석해 얻었다. 이 연구에서 밝혀진 바에 따르면, 백인 영국 여성(33세)과 백인 미국인 남성(55세)이 가장 많은 대화형 연설을 했다는 것이다. 기여 요인은 학생들이 언어 습득 연구를 통해 다양한 언어 스타일을 경험한 것이다. 이 연구의 결과는 평균 이상의 연속적인 말이 학생의 참여와 상호작용에 가장 중요하다는 데 동의한 $Traunm{\ddot{u}}eller$ & Eriksson(1995) 및 이전 연구와 양립할 수 있다.

음성인식을 위한 화자적응 기술 동향

  • 김동국
    • 한국콘텐츠학회지
    • /
    • 제2권1호
    • /
    • pp.95-106
    • /
    • 2004
  • 음성인식(speech recognition) 기술이란 사람이 말하는 음성을 기계나 컴퓨터가 이를 분석하고, 인식하여 단어나 문장형태로 변환하여 기계와 인간이 상호작용을 할 수 있도록 관련 알고리즘을 개발 및 구현하는 기술이다. 최근 음성인식 기술이 대두되는 가장 큰 이유는 인간과 기계간의 통신을 원활하게 하는 편리한 휴먼인터페이스 기능이라 할 수 있다. (중략)