• Title/Summary/Keyword: 사용자 발화

Search Result 131, Processing Time 0.039 seconds

Proposal for the Dataset Structure for Developing Emotionally Intelligent Chatbots with Integrated Counseling Strategies (상담 전략을 통합한 정서 교감형 챗봇 개발을 위한 데이터셋 구조 제안)

  • Dong-Hyok Shin;Jae Hee Yang;Jin Yea Jang;Saim Shin
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.179-184
    • /
    • 2023
  • 본 연구는 우울감을 느끼거나 대화 상대 부재로 어려움을 겪는 사용자와 정서 교감형 시스템간의 대화로 구성된 한국어 데이터 셋을 구축하고 이때 시스템이 사용할 수 있는 효과적인 응대 전략을 제안하는데 목적이 있다. 데이터셋은 사용자와 시스템 간의 대화 쌍을 기본 단위로 하며, 사용자의 7가지 기본 감정(행복, 슬픔, 공포, 놀람, 분노, 혐오, 중립)과 시스템의 4가지 응대 전략(명료화, 공감적 응대, 제안, 페르소나)에 따라 주석이 된다. 이 중, 공감적 응대 전략은 10가지 독특한 반응 유형(수용적 경청, 후행 발화 요청, 승인/동의, 비승인/재고 요청, 놀람, 격려, 느낌 표시, 상대 발화 반복, 인사, 의견 제시) 및 4가지 후행 발화 요청 유형(무엇, 왜, 어떻게, 그밖에)을 포함하는 구조로 구체화되었다. 이러한 주석은 시스템이 사용자의 다양한 감정을 식별하고 적절한 공감 수준을 나타내는 응답을 생성하는 데 있어 연구적인 의의가 있으며, 필요시 사용자가 부정적 감정을 극복할 수 있는 활동을 제안하는 데 도움을 줄 수 있다는 점에서 실제적인 의의가 있다.

  • PDF

OK-KGD:Open-domain Korean Knowledge Grounded Dialogue Dataset (OK-KGD:오픈 도메인 한국어 지식 기반 대화 데이터셋 구축)

  • Seona Moon;San Kim;Jinyea Jang;Minyoung Jeung;Saim Shin
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.342-345
    • /
    • 2023
  • 최근 자연어처리 연구 중 오픈 도메인 지식 기반 대화는 많은 관심을 받고 있다. 연구를 위해서는 오픈 도메인 환경을 갖추고 적절한 지식을 사용한 대화 데이터셋이 필요하다. 지금까지 오픈 도메인 환경을 갖춘 한국어 지식 기반 대화 데이터셋은 존재하지 않아 한국어가 아닌 데이터셋을 한국어로 기계번역하여 연구에 사용하였다. 이를 사용할 경우 두 가지 단점이 존재한다. 먼저 사용된 지식이 한국 문화에 익숙하지 않아 한국인이 쉽게 알 수 없는 대화 내용이 담겨있다. 그리고 번역체가 남아있어 대화가 자연스럽지 않다. 그래서 본 논문에서는 자연스러운 대화체와 대화 내용을 담기 위해 새로운 오픈 도메인 한국어 지식 기반 대화 데이터셋을 구축하였다. 오픈 도메인 환경 구축을 위해 위키백과와 나무위키의 지식을 사용하였고 사용자와 시스템의 발화로 이루어진 1,773개의 대화 세트를 구축하였다. 시스템 발화는 크게 지식을 사용한 발화, 사용자 질문에 대한 답을 주지 못한 발화, 그리고 지식이 포함되지 않은 발화 3가지로 구성된다. 이렇게 구축한 데이터셋을 통해 KE-T5와 Long-KE-T5를 사용하여 간단한 실험을 진행하였다.

  • PDF

Utterance Error Correction of Playing Music on Smart Speaker (스마트 스피커에서의 음악 재생 발화 오류 교정)

  • Lee, Daniel;Ko, Byeong-il;Kim, Eung-gyun
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.482-486
    • /
    • 2018
  • 본 논문에서는 스마트 스피커 환경에서 음악 재생 발화의 오류를 교정하는 음악 재생 발화 교정 모델을 제안한다. 음악 재생 발화에서 발생하는 다양한 오류 유형을 살펴보고, 음악 재생 발화 교정 모델에 대해 소개한다. 해당 모델은 후보 생성 모델과 교정 판별 모델로 이루어져 있다. 후보 생성 모델은 정답 후보들을 생성하고, 교정 판별 모델은 Random Forest를 사용하여 교정 여부를 판별한다. 제안하는 방법으로 음악 재생 발화에서 실제 사용자 만족도를 높일 수 있었다.

  • PDF

Identifying users' intentions using neural networks in a schedule management domain (일정관리 영역에서 신경망을 이용한 사용자 의도파악)

  • Lee, Hyun-Jung;Seo, Jung-Yun
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2006.06a
    • /
    • pp.87-90
    • /
    • 2006
  • 목적 지향 대화에서, 사용자의 의도는 화행(speech acts)과 개념열(concept sequences)로 나타낼 수 있다. 화행은 대화의 영역과는 상관없이 표현되는 정보이고, 개념열은 영역과 깊은 관련을 지닌 정보이다. 대화시스템에서 화행과 개념열로 구성되는 사용자의 의도를 정확히 파악하는 것은 시스템이 사용자의 발화에 정확히 응대하는 데에 매우 중요하다. 본 논문에서는 일정관리 영역에서의 대화를 대상으로 화행과 개념열을 분류하고 신경망을 사용하여 이들을 분석한다. 화행과 개념열로 구성되는 의도 분석에 사용하는 자질은 크게 문맥 자질과 문장 자질로 분류되며, 문장자질은 카이제곱 통계량을 사용하여 사용자의 의도 분석에 효과적인 자질만을 선택하여 사용하고 문맥자질로는 이전 발화에 대한 정보를 활용한다. 신경망을 사용하여 사용자 의도 분석을 수행한 결과 성능이 우수함을 알 수 있었다.

  • PDF

The design of Plan based dialogue system in Task execution domain (작업수행영역에서 계획에 기반한 대화 시스템의 설계)

  • 오종건;서정연
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.450-452
    • /
    • 2000
  • 대화 시스템이란 자연어를 이용하여 인간과 정보를 교환하거나 업무를 수행하는 프로그램이다. 자연언어는 인간이 사용할 수 있는 쉽고 효율적인 인터페이스이기 때문에 이를 이용한 대화 시스템의 필요성이 증대되고 있다. 본 논문에서는 지금까지 주로 인식에 초점이 맞추어져 연구되어 왔던 계획 기반 대화 모델을 이용하여 발화하여 생성하는 시스템을 설계하고자 한다. 본 논문에서 설계하고자 하는 대화 시스템은 사용자의 질의에 응답할 뿐 아니라 자신의 행위를 능동적으로 수행할 수 있는 협조적 대화 시스템이다. 또한 대화의 효율성을 고려하여 사용자가 필요로 하는 정보를 능동적으로 제공하는 시스템이다. 대화의 효율성을 고려한 발화를 위해 본 논문에서는 새로운 시스템의 행위를 정의하여 실제 가능한 대화 예를 보이고자 한다.

  • PDF

Information Extractive Dialog State Tracking for Consulting (상담 대화를 위한 사용자 정보 추출 대화 상태 추적 시스템)

  • Jang, Yunjeong;Lee, Geunbae
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.625-628
    • /
    • 2021
  • 정보 추출이 가능한 대화 상태 추적(Information-Extractive Dialog State Tracking)은 상담 목적에 맞는 대화를 시스템이 유도하여 사용자로 부터 정보를 추출할 수 있도록 대화 상태를 추적하는 연구로써, 사용자에게 적합한 상담이 이루어지도록 하기 위해 제안되었다. 이 논문에서는 상담 대화에서는 내담자의 발화는 상담자에 의해 유도되는 점을 착안하여 시스템이 대화를 주도하는 모델을 제안한다. 시스템 액션과 사용자 발화를 이용해 슬롯, 밸류로 구성된 대화 상태를 추적하고 이를 대화 정책에 반영하여 이어질 대화를 주도한다. 추적한 대화 상태와 기존 대화 상태를 비교하여 대화 시스템의 성능을 보인다.

  • PDF

KoDialoGPT2 : Modeling Chit-Chat Dialog in Korean (KoDialoGPT2 : 한국어 일상 대화 생성 모델)

  • Oh, Dongsuk;Park, Sungjin;Lee, Hanna;Jang, Yoonna;Lim, Heuiseok
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.457-460
    • /
    • 2021
  • 대화 시스템은 인공지능과 사람이 자연어로 의사 소통을 하는 시스템으로 크게 목적 지향 대화와 일상대화 시스템으로 연구되고 있다. 목적 지향 대화 시스템의 경우 날씨 확인, 호텔 및 항공권 예약, 일정 관리 등의 사용자가 생활에 필요한 도메인들로 이루어져 있으며 각 도메인 별로 목적에 따른 시나리오들이 존재한다. 이러한 대화는 사용자에게 명확한 발화을 제공할 수 있으나 자연스러움은 떨어진다. 일상 대화의 경우 다양한 도메인이 존재하며, 시나리오가 존재하지 않기 때문에 사용자에게 자연스러운 발화를 제공할 수 있다. 또한 일상 대화의 경우 검색 기반이나 생성 기반으로 시스템이 개발되고 있다. 검색 기반의 경우 발화 쌍에 대한 데이터베이스가 필요하지만, 생성 기반의 경우 이러한 데이터베이스가 없이 모델의 Language Modeling (LM)으로 부터 생성된 발화에 의존한다. 따라서 모델의 성능에 따라 발화의 품질이 달라진다. 최근에는 사전학습 모델이 자연어처리 작업에서 높은 성능을 보이고 있으며, 일상 대화 도메인에서도 역시 높은 성능을 보이고 있다. 일상 대화에서 가장 높은 성능을 보이고 있는 사전학습 모델은 Auto Regressive 기반 생성모델이고, 한국어에서는 대표적으로 KoGPT2가 존재한다. 그러나, KoGPT2의 경우 문어체 데이터만 학습되어 있기 때문에 대화체에서는 낮은 성능을 보이고 있다. 본 논문에서는 대화체에서 높은 성능을 보이는 한국어 기반 KoDialoGPT2를 개발하였고, 기존의 KoGPT2보다 높은 성능을 보였다.

  • PDF

Developing a New Algorithm for Conversational Agent to Detect Recognition Error and Neologism Meaning: Utilizing Korean Syllable-based Word Similarity (대화형 에이전트 인식오류 및 신조어 탐지를 위한 알고리즘 개발: 한글 음절 분리 기반의 단어 유사도 활용)

  • Jung-Won Lee;Il Im
    • Journal of Intelligence and Information Systems
    • /
    • v.29 no.3
    • /
    • pp.267-286
    • /
    • 2023
  • The conversational agents such as AI speakers utilize voice conversation for human-computer interaction. Voice recognition errors often occur in conversational situations. Recognition errors in user utterance records can be categorized into two types. The first type is misrecognition errors, where the agent fails to recognize the user's speech entirely. The second type is misinterpretation errors, where the user's speech is recognized and services are provided, but the interpretation differs from the user's intention. Among these, misinterpretation errors require separate error detection as they are recorded as successful service interactions. In this study, various text separation methods were applied to detect misinterpretation. For each of these text separation methods, the similarity of consecutive speech pairs using word embedding and document embedding techniques, which convert words and documents into vectors. This approach goes beyond simple word-based similarity calculation to explore a new method for detecting misinterpretation errors. The research method involved utilizing real user utterance records to train and develop a detection model by applying patterns of misinterpretation error causes. The results revealed that the most significant analysis result was obtained through initial consonant extraction for detecting misinterpretation errors caused by the use of unregistered neologisms. Through comparison with other separation methods, different error types could be observed. This study has two main implications. First, for misinterpretation errors that are difficult to detect due to lack of recognition, the study proposed diverse text separation methods and found a novel method that improved performance remarkably. Second, if this is applied to conversational agents or voice recognition services requiring neologism detection, patterns of errors occurring from the voice recognition stage can be specified. The study proposed and verified that even if not categorized as errors, services can be provided according to user-desired results.

Guidance of Web Document Structure and Voice Firing Rate Control in the Voice Web Browser (음성 웹브라우저에서의 문서구조안내 및 발화속도제어)

  • 조철환;최훈일;연제용;장영건
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04a
    • /
    • pp.415-417
    • /
    • 2002
  • 본 논문은 HTML을 분석하여 추출된 내용을 트리로 표현하여 문서구조안내에 이용하고, 웹 문서의 내용의 숙독 필요성에 따라 실시간으로 음성 발화속도를 제어할 수 있는 음성 웹 브라우저의 설계와 구현에 관한 것이다. 이 시스템의 특징은 웹 브라우저 상에 태그로 표현된 모든 요소를 추출하고, 이러한 정보를 트리로 표현하고 음성인식으로 정보를 선택하도록 하고, 선택한 정보의 이도와 필요성에 따라 사용자가 실시간 발화속도제어를 통하여 정보를 쉽게 알 수 있도록 했다. 이 방식은 문서의 내용에 따른 구조를 쉽게 인식하여 사용자가 빠른 시간 내에 필요한 정보를 수집할 수 있고, 문서가 발음되는 것을 청취하여 문서의 필요성을 인식하고, 숙독 필요성에 따라 실시간으로 낭독 속도를 제어할 수 있는 장점이 있다.

  • PDF

연극 배우의 음성 관리 및 음성 사용에 관한 연구

  • 조성미;정옥란
    • Proceedings of the KSLP Conference
    • /
    • 2003.11a
    • /
    • pp.137-137
    • /
    • 2003
  • 본 연구는 직업적 음성 사용자인 연극 배우의 음성 관리, 극중 인물 특징을 표현하기 위한 요소 중 음성이 차지하는 비중과 적합한 발성 및 발화 방법에 대하여 살펴보았다. 본 연구에는 대구광역시 소재 K극예술연구회의 연극 배우 9명이 참여하였다. 연극 배우의 음성 관리 및 극중 인물의 특성을 표현하기 위한 발성 및 발화 방법에 대한 설문지를 작성하여 조사하였다. 여러 가지 인물에 적합한 발성법으로 '산책' 문단을 발화하도록 한 뒤, 대상자들에게 각 인물에 대한 발성 방법을 설문지에 기록하도록 하였다. 대상자들이 발화한 음성 샘플을 음향학적, 지각적 측면에서 평가하여 대상자들이 기술한 발성 및 발화 방범과의 상관을 살펴보았다. 음성 샘플은 Windows용 Praat(4.1.7)으로 수집 및 분석하였다. (중략)

  • PDF