• Title/Summary/Keyword: 인공지능 대화시스템

Search Result 86, Processing Time 0.024 seconds

Conversational Agent as Web Virtual Representative using Artificial Intelligence Techniques (인공지능 기법을 이용한 웹 가상 도우미로서의 대화형 에이전트)

  • Kima, Kyoung-Min;Limb, Sung-Soo;Chob, Sung-Bae
    • Annual Conference on Human and Language Technology
    • /
    • 2003.10d
    • /
    • pp.201-207
    • /
    • 2003
  • 인터넷의 사용이 보편화됨에 따라 인터넷을 통한 정보 제공 서비스가 확대되고 있다. 이에 따라 빠르게 변화하는 사용자의 요구를 만족시킴과 동시에 편리하고 유용한 서비스를 제공하기 위하여 사용자와 자연스럽게 의사소통할 수 있는 대화형 에이전트의 연구가 활발히 진행되고 있다. 더불어 시스템의 효율적인 설계 또한 중요한 문제가 아닐 수 없다. 본 논문에서는 패턴매칭 기법과 베이지안 네트워크를 이용해 사용자 질의에 대한 적절한 답변을 생성하고, 스크립트 인터페이스를 통한 자동 스크립트 설계로 보다 효율적인 시스템 구축 방안을 제안해 보고자 한다. 실제 의류 사이트를 위한 안내 도우미 에이전트를 구현해 봄으로써 그 기능성을 평가해 본다.

  • PDF

Emotion-based Real-time Facial Expression Matching Dialogue System for Virtual Human (감정에 기반한 가상인간의 대화 및 표정 실시간 생성 시스템 구현)

  • Kim, Kirak;Yeon, Heeyeon;Eun, Taeyoung;Jung, Moonryul
    • Journal of the Korea Computer Graphics Society
    • /
    • v.28 no.3
    • /
    • pp.23-29
    • /
    • 2022
  • Virtual humans are implemented with dedicated modeling tools like Unity 3D Engine in virtual space (virtual reality, mixed reality, metaverse, etc.). Various human modeling tools have been introduced to implement virtual human-like appearance, voice, expression, and behavior similar to real people, and virtual humans implemented via these tools can communicate with users to some extent. However, most of the virtual humans so far have stayed unimodal using only text or speech. As AI technologies advance, the outdated machine-centered dialogue system is now changing to a human-centered, natural multi-modal system. By using several pre-trained networks, we implemented an emotion-based multi-modal dialogue system, which generates human-like utterances and displays appropriate facial expressions in real-time.

Implementation of Scenario-based AI Voice Chatbot System for Museum Guidance (박물관 안내를 위한 시나리오 기반의 AI 음성 챗봇 시스템 구현)

  • Sun-Woo Jung;Eun-Sung Choi;Seon-Gyu An;Young-Jin Kang;Seok-Chan Jeong
    • The Journal of Bigdata
    • /
    • v.7 no.2
    • /
    • pp.91-102
    • /
    • 2022
  • As artificial intelligence develops, AI chatbot systems are actively taking place. For example, in public institutions, the use of chatbots is expanding to work assistance and professional knowledge services in civil complaints and administration, and private companies are using chatbots for interactive customer response services. In this study, we propose a scenario-based AI voice chatbot system to reduce museum operating costs and provide interactive guidance services to visitors. The implemented voice chatbot system consists of a watcher object that detects the user's voice by monitoring a specific directory in real-time, and an event handler object that outputs AI's response voice by performing inference by model sequentially when a voice file is created. And Including a function to prevent duplication using thread and a deque, GPU operations are not duplicated during inference in a single GPU environment.

A Korean menu-ordering sentence text-to-speech system using conformer-based FastSpeech2 (콘포머 기반 FastSpeech2를 이용한 한국어 음식 주문 문장 음성합성기)

  • Choi, Yerin;Jang, JaeHoo;Koo, Myoung-Wan
    • The Journal of the Acoustical Society of Korea
    • /
    • v.41 no.3
    • /
    • pp.359-366
    • /
    • 2022
  • In this paper, we present the Korean menu-ordering Sentence Text-to-Speech (TTS) system using conformer-based FastSpeech2. Conformer is the convolution-augmented transformer, which was originally proposed in Speech Recognition. Combining two different structures, the Conformer extracts better local and global features. It comprises two half Feed Forward module at the front and the end, sandwiching the Multi-Head Self-Attention module and Convolution module. We introduce the Conformer in Korean TTS, as we know it works well in Korean Speech Recognition. For comparison between transformer-based TTS model and Conformer-based one, we train FastSpeech2 and Conformer-based FastSpeech2. We collected a phoneme-balanced data set and used this for training our models. This corpus comprises not only general conversation, but also menu-ordering conversation consisting mainly of loanwords. This data set is the solution to the current Korean TTS model's degradation in loanwords. As a result of generating a synthesized sound using ParallelWave Gan, the Conformer-based FastSpeech2 achieved superior performance of MOS 4.04. We confirm that the model performance improved when the same structure was changed from transformer to Conformer in the Korean TTS.

Development of an interactive smart cooking service system using behavior and voice recognition (행동 및 음성인식 기술을 이용한 대화형 스마트 쿠킹 서비스 시스템 개발)

  • Moon, Yu-Gyeong;Kim, Ga-Yeon;Kim, Yoo-Ha;Park, Min-Ji;Seo, Min-Hyuk;Nah, Jeong-Eun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.11a
    • /
    • pp.1128-1131
    • /
    • 2021
  • COVID-19로 인한 홈 쿠킹 시장 수요 증가로 사람들은 더 편리한 요리 보조 시스템을 필요로 하고 있다. 기존 요리 시스템은 휴대폰, 책을 통해 레시피를 일방적으로 제공하기 때문에 사용자가 요리과정을 중단하고 반복적으로 열람해야 한다는 한계점을 가진다. '대화형 스마트 쿠킹 서비스' 시스템은 요리 과정 전반에서 필요한 내용을 사용자와 상호작용하며 적절하게 인지하고 알려주는 인공지능 시스템이다. Google의 MediaPipe를 사용해 사용자의 관절을 인식하고 모델을 학습시켜 사용자의 요리 동작을 인식하도록 설계했으며, dialogflow를 이용한 챗봇 기능을 통해 필요한 재료, 다음 단계 등의 내용을 실시간으로 제시한다. 또한 실시간 행동 인식으로 요리과정 중 화재, 베임 사고 등의 위험 상황을 감지하여 사용자에게 정보를 전달해줌으로써 사고를 예방한다. 음성인식을 통해 시스템과 사용자 간의 쌍방향적 소통을 가능하게 했고, 음성으로 화면을 제어함으로써 요리과정에서의 불필요한 디스플레이 터치를 방지해 위생적인 요리 환경을 제공한다.

Usability Improvement Process of Chatbot System Using FMEA and FTA (FMEA 와 FTA 를 활용한 챗봇 시스템의 사용성 개선 프로세스)

  • Lee, Yeonjae;Song, Jaewoo;Han, Hyuksoo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.11a
    • /
    • pp.1097-1100
    • /
    • 2020
  • 챗봇(Chatbot)은 자연어처리기술 등 인공지능 기술을 기반으로 한 사용자 친화적인 대화 방식 인터페이스를 제공하는 장점이 있어, 금융, 상담, 주문 등 다양한 산업 분야에서 적용되고 있다. 그러나, 챗봇의 응답이 사용자의 정신 모형과 불일치하는 경우, 다음 대화를 이어가는데 어려움을 야기하게 된다. 그러므로, 챗봇의 사용성을 확보하기 위해서는 응답 오류의 제거 또는 완화가 필수적이다. 기존의 챗봇의 사용성 개선과 관련된 연구들은 설문조사와 인터뷰 등 사용성 평가를 통해 상위 수준의 개선 방향만을 제안하고 있다. 따라서, 챗봇 개발 시, 실무자들이 응답 오류의 문제점을 분석하고, 이를 해결하기 위한 구체적인 개선 방안을 제시하는 데 한계가 있었다. 본 논문에서는 FMEA(Failure Modes and Effects Analysis) 기법을 활용해, 응답 오류의 치명도를 파악하고, 치명적인 오류들에 대해서는 FTA(Fault Tree Analysis) 기법을 기반으로 원인 분석을 실시하여 구체적으로 문제를 해결하기 위한 프로세스를 제안한다. 본 프로세스의 효용성을 검증하기 위해 주문 도메인의 챗봇에 적용해 보았다.

Real-time Background Music System for Immersive Dialogue in Metaverse based on Dialogue Emotion (메타버스 대화의 몰입감 증진을 위한 대화 감정 기반 실시간 배경음악 시스템 구현)

  • Kirak Kim;Sangah Lee;Nahyeon Kim;Moonryul Jung
    • Journal of the Korea Computer Graphics Society
    • /
    • v.29 no.4
    • /
    • pp.1-6
    • /
    • 2023
  • To enhance immersive experiences for metaverse environements, background music is often used. However, the background music is mostly pre-matched and repeated which might occur a distractive experience to users as it does not align well with rapidly changing user-interactive contents. Thus, we implemented a system to provide a more immersive metaverse conversation experience by 1) developing a regression neural network that extracts emotions from an utterance using KEMDy20, the Korean multimodal emotion dataset 2) selecting music corresponding to the extracted emotions from an utterance by the DEAM dataset where music is tagged with arousal-valence levels 3) combining it with a virtual space where users can have a real-time conversation with avatars.

An Emotion-based Fashion Design Aid System using Interactivity (상호작용성을 이용한 감성기반 의상디자인 지원 시스템)

  • Kim, Hui-Su;Jo, Seong-Bae
    • Journal of KIISE:Software and Applications
    • /
    • v.27 no.9
    • /
    • pp.942-951
    • /
    • 2000
  • 일반적으로 컴퓨터를 이용한 디자인 지원 시스템은 다지이너의 행동과 같은 데이터를 통계적으로 분석하여 일련의 디자인 행위를 추출해 내는 인공지능의 접근 방식을 사용하여 왔다. 그러나 이는 많은 양의 수집된 데이터를 기반한 방법이기 때문에 계속해서 변화하는 유행에 대처할 수 없을 뿐만 아니라 개인의 취향을 반영하기도 어렵다. 이같은 문제점을 해결하기 위해 이 논문에서는 대화형 유전자 알고리즘(Interactive Genetic Algorithm : IGA)을 이용하여 명시적으로 표현하기 어려운 취향을 적절히 반영하는 디자인 지원 시스템을 제안한다. IGA는 상호작용에서 얻어지는 사용자의 평가를 적합도 함수로 사용하는 유전자 알고리즘의 하나로, 일반적인 적합도 함수를 결정하기 어려운 디자인이나 예술 등의 문제 해결에 사용될 수 있다. 한편, 몇 개의 부분적인 곡선으로 의상의 디자인을 표현하였던 기존의 방법들과는 달리 전체 디자인을 목과 몸통, 팔과 소매, 치마와 허리선의 세 가지 부분 디자인으로 나누어 표현함으로써 좀더 현실적인 여성복을 디자인할 수 있었다. 시스템의 인터페이스를 보완하기 위해 OpenGL을 이용한 3차원 모델이 사용되었으며, 사용자들을 대상으로 한 실험 결과 제안한 의상 디자인 지원 시스템이 효과적임을 알 수 있었다.

  • PDF

멀티미디어 사용자 인터페이스 기술

  • 오승준
    • The Magazine of the IEIE
    • /
    • v.22 no.4
    • /
    • pp.51-63
    • /
    • 1995
  • 멀티미디어 사용자 인터페이스는 사용자의 동작을 통한 입력, 사용자에 대한 시스템의 응답, 사용자와 시스템 사이의 대화를 관리하고 운영하는 환경이다. 최근에 신호처리 기술, 인식 기술, 소프트웨어 기술, 인공지능 기술을 기반으로한 MMUI에 관한 연구활동이 많은 관심을 끌고 있다. 사용자가 시스템에 정보를 보다 자연스럽고 다양하게 제공하고 시스템으로부터 필요한 정보를 다양한 형태로 효율적으로 제공하기 위한 MMUI를 설계하기 위하여 분야의 경계선을 넘어 상호 동조하는 연구팀을 구성하여 활발히 진행되고 있다. MMUI개발자는 비디오나 오디오 입출력을 고려해야 하므로 이러한 매체들을 통합하는 문제와 시간에 따라 변하는 시스템을 위한 모델링을 하는 문제들을 대면하게 된다. MMUI개발자들이 대면하는 대표적인 문제는 매체 병합, 모델과 메타포(metaphor) 사용, 네비게이션(navigation),입출력 다루기, 동기화, 새로운 매체 개발이다. 그러므로 본 고에서는 멀티미디어 제품 및 서비스를 위한 MMUI기술과 그 연구방향을 살펴본다.

  • PDF

Novel Intent Category Discovery using Contrastive Learning (대조학습을 활용한 새로운 의도 카테고리 발견)

  • Seungyeon Seo;Gary Geunbae Lee
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.107-112
    • /
    • 2023
  • 라벨 데이터 수집의 어려움에 따라 라벨이 없는 데이터로 학습하는 준지도학습, 비지도학습에 대한 연구가 활발하게 진행되고 있다. 본 논문에서는 그의 일환으로 Novel Intent Category Discovery(NICD) 문제를 제안하고 NICD 연구의 베이스라인이 될 모델을 소개한다. NICD 문제는 라벨이 있는 데이터와 라벨이 없는 데이터의 클래스 셋이 겹치지 않는다는 점에서 기존 준지도학습의 문제들과 차이가 있다. 제안 모델은 RoBERTa를 기반으로 두 개의 분류기를 추가하여 구성되며 라벨이 있는 데이터셋과 라벨이 없는 데이터셋에서 각각 다른 분류기를 사용하여 라벨을 예측한다. 학습방법은 2단계로 먼저 라벨이 있는 데이터셋으로 요인표현을 학습한다. 두 번째 단계에서는 교차 엔트로피, 이항교차 엔트로피, 평균제곱오차, 지도 대조 손실함수를 NICD 문제에 맞게 변형하여 학습에 사용한다. 논문에서 제안된 모델은 라벨이 없는 데이터셋에 대해 이미지 최고성능 모델보다 24.74 더 높은 정확도를 기록했다.

  • PDF