• Title/Summary/Keyword: 대화시스템

Search Result 1,019, Processing Time 0.032 seconds

Memory Attention-based Breakdown Detection for Natural Conversation in Dialogue System (대화 시스템에서의 자연스러운 대화를 위한 Memory Attention기반 Breakdown Detection)

  • Lee, Seolhwa;Park, Kinam;Lim, Heuiseok
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.31-34
    • /
    • 2018
  • 대화 시스템에서 사람과 기계와의 모든 발화에서 발생하는 상황들을 모두 규칙화할 수 없기 때문에 자연스러운 대화가 단절되는 breakdown 현상이 빈번하게 일어날 수 있다. 이런 현상이 발생하는 이유는 다음과 같다. 첫째, 대화에서는 다양한 도메인이 등장하기 때문에 시스템이 커버할 수 있는 리소스가 부족하며, 둘째, 대화 데이터에서 학습을 위한 annotation되어 있는 많은 양의 코퍼스를 보유하기에는 한계가 있으며, 모델에 모든 대화 흐름의 히스토리를 반영하기 어렵다. 이런 한계점이 존재함에도 breakdown detection은 자연스러운 대화 시스템을 위해서는 필수적인 기능이다. 본 논문은 이런 이슈들을 해소하기 위해서 memory attention기반의 새로운 모델을 제안하였다. 제안한 모델은 대화내에 발화에 대해 memory attention을 이용하여 과거 히스토리가 반영되기 때문에 자연스러운 대화흐름을 잘 detection할 수 있으며, 기존 모델과의 성능비교에서 state-of-the art 결과를 도출하였다.

  • PDF

Developing a dialog system based on a meaning base for intel1igent traffic information serivce (지능형 교통정보 서비스를 위한 의미베이스 기반 대화시스템의 개발)

  • Oh, Young-Jin;Chang, Moon-Soo;Kang, Sun-Mee
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2005.11a
    • /
    • pp.253-256
    • /
    • 2005
  • 언어는 단순히 인간의 의사소통의 수단이 될 뿐만 아니라 사고, 추론, 판단 등의 지적활동의 도구로서 활용된다. 컴퓨터에서는 인간의 언어를 사용하여 인간과 유사한 지적활동을 실현하고 자 하는 연구로 일상언어 컴퓨팅(everyday language computing)이 있다. 본 논문에서는 일상언어 컴퓨팅을 실현하는 한 예로 교통정보 서비스를 위한 대화시스템을 제안한다. 제안하는 시스템은 시스테믹 기능문법(Systemic Functional Grammar: SFG)을 기반으로 사용자의 발화를 3개의 메타기능을 통하여 의미를 분석하고, 메타기능으로 표현된 의미로부터 시스템의 발화를 생성한다 기존 교통정보 서비스는 DB의 질의검색과 일률적인 정보제공이 일반적인 것에 비해, 제안하는 대화시스템은 대화의 의미 속에 포함된 사용자의 의도 및 의미를 분석함으로써 보다 적절한 정보를 제공하여 사용자의 서비스만족도를 향상 시키는 교통정보서비스를 가능하게 한다. 또한, 웹과 연동되는 VXML(Voice Extend Makeup Language)을 대화시스템에 적용함으로서 실용적인 인터페이스를 실행하였다.

  • PDF

Development of a Dialogue System Model for Korean Restaurant Reservation with End-to-End Learning Method Combining Domain Specific Knowledge (도메인 특정 지식을 결합한 End-to-End Learning 방식의 한국어 식당 예약 대화 시스템 모델 개발)

  • Lee, Dong-Yub;Kim, Gyeong-Min;Lim, Heui-Seok
    • 한국어정보학회:학술대회논문집
    • /
    • 2017.10a
    • /
    • pp.111-115
    • /
    • 2017
  • 목적 지향적 대화 시스템(Goal-oriented dialogue system)은 텍스트나 음성을 통해 특정한 목적을 수행할 수 있는 시스템이다. 최근 RNN(recurrent neural networks)을 기반으로 대화 데이터를 end-to-end learning 방식으로 학습하여 대화 시스템을 구축하는데에 활용한 연구가 있다. End-to-end 방식의 학습은 도메인에 대한 지식 없이 학습 데이터 자체만으로 대화 시스템 구축을 위한 학습이 가능하다는 장점이 있지만 도메인 지식을 학습하기 위해서는 많은 양의 데이터가 필요하다는 단점이 존재한다. 이에 본 논문에서는 도메인 특정 지식을 결합하여 end-to-end learning 방식의 학습이 가능한 Hybrid Code Network 구조를 기반으로 한국어로 구성된 식당 예약에 관련한 대화 데이터셋을 이용하여 식당 예약을 목적으로하는 대화 시스템을 구축하는 방법을 제안한다. 실험 결과 본 시스템은 응답 별 정확도 95%와 대화 별 정확도 63%의 성능을 나타냈다.

  • PDF

Korean Dialogue System for Car Information Service (차량 정보 서비스용 한국어 대화 시스템)

  • Choi, Sung-Kwon;Kwon, Oh-Woog;Huang, Jin-Xia;Roh, Yoon-Hyung;Lee, Ki-Young;Kim, Young-Gil
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.05a
    • /
    • pp.281-284
    • /
    • 2013
  • 한국전자통신연구원(ETRI)에서는 2010 년부터 2015 년까지 5 년간에 걸쳐 모바일 플랫폼 기반 대화모델이 적용된 자연어 음성인터페이스 기술을 개발하고 있다. 2010 년에는 대화 시스템의 전반적인 모습을 설계하였고, 2011 년에는 대상 도메인으로 도시 관광용 영어 대화 시스템을, 2012 년에는 대상 도메인으로 차량공조, 응급조치 등과 같은 차량 정보 서비스용 한국어 대화 시스템을 개발하였다. 본 논문에서는 2012 년에 개발한 차량 정보 서비스용 한국어 대화 시스템을 기술하는 것을 목표로 한다. 차량 정보 서비스용 한국어 대화 시스템의 성능 평가는 운전 경험이 있는 평가자 20 명에 의해 이루어졌다. 평가자는 웹 평가 도구에 원격으로 접속하여 주어진 40 개의 차량 정보 관련 대화 미션을 태스크로 하여 차량 정보 서비스용 대화 시스템과 대화를 하였다. 평가는 태스크 성공률과 대화턴 성공률로 나누어 측정되었으며 태스크 성공률은 87.8%, 대화턴 성공률은 86.7%였다.

Audio-Visual Scene Aware Dialogue System Utilizing Action From Vision and Language Features (이미지-텍스트 자질을 이용한 행동 포착 비디오 기반 대화시스템)

  • Jungwoo Lim;Yoonna Jang;Junyoung Son;Seungyoon Lee;Kinam Park;Heuiseok Lim
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.253-257
    • /
    • 2023
  • 최근 다양한 대화 시스템이 스마트폰 어시스턴트, 자동 차 내비게이션, 음성 제어 스피커, 인간 중심 로봇 등의 실세계 인간-기계 인터페이스에 적용되고 있다. 하지만 대부분의 대화 시스템은 텍스트 기반으로 작동해 다중 모달리티 입력을 처리할 수 없다. 이 문제를 해결하기 위해서는 비디오와 같은 다중 모달리티 장면 인식을 통합한 대화 시스템이 필요하다. 기존의 비디오 기반 대화 시스템은 주로 시각, 이미지, 오디오 등의 다양한 자질을 합성하거나 사전 학습을 통해 이미지와 텍스트를 잘 정렬하는 데에만 집중하여 중요한 행동 단서와 소리 단서를 놓치고 있다는 한계가 존재한다. 본 논문은 이미지-텍스트 정렬의 사전학습 임베딩과 행동 단서, 소리 단서를 활용해 비디오 기반 대화 시스템을 개선한다. 제안한 모델은 텍스트와 이미지, 그리고 오디오 임베딩을 인코딩하고, 이를 바탕으로 관련 프레임과 행동 단서를 추출하여 발화를 생성하는 과정을 거친다. AVSD 데이터셋에서의 실험 결과, 제안한 모델이 기존의 모델보다 높은 성능을 보였으며, 대표적인 이미지-텍스트 자질들을 비디오 기반 대화시스템에서 비교 분석하였다.

  • PDF

Mixed Reality Dialog Agent for Real-World Control (현실 세계를 제어하는 혼합 현실 대화 시스템)

  • Kim, DaHye;Park, KyuHwon;Jeong, Young-Seob
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.60-63
    • /
    • 2019
  • 사용자와 자연어 음성을 통해 상호작용하는 대화 시스템이 주목받고 있다. 음성 뿐 아니라, 화면을 통해 사용자와 상호작용하는 기능을 제공하는 대화 시스템들이 소개되고 있으며, 최근에는 혼합 현실 환경에서 대화 에이전트가 실제 공간에 존재하는 서비스가 소개되기도 하였다. 본 연구에서는 혼합 현실 환경의 대화 시스템이 현실 세계에 영향을 미칠 수 있는 시스템을 설계하였다. 제안하는 시스템은 서버가 클라이언트와 통신하여 필요 시 적절한 장치를 제어하도록 설계되었다. 본 연구 시스템의 실현가능성을 입증하기 위해 라즈베리파이를 제어할 장치로 사용하였으며, 화면에 보이는 대화 에이전트에게 음성으로 명령하여 전등, 에어컨 등을 제어하는 것이 가능함을 확인하였다.

  • PDF

Study on Method Constructing Dialog Act Tagged Corpus for Dialog System in Car (차량용 대화 시스템을 위한 Dialog Act 태깅 코퍼스 구축 방법 연구)

  • Choi, Sung-Kwon;Kwon, Oh-Woog;Kim, Young-Gil
    • Annual Conference on Human and Language Technology
    • /
    • 2012.10a
    • /
    • pp.181-184
    • /
    • 2012
  • 본 논문에서는 한국전자통신연구원 언어처리연구팀에서 개발하고 있는 차량용 대화 시스템을 위한 Dialog Act 태깅 코퍼스 구축 방법에 대해 기술하는 것을 목표로 한다. 차량용 태깅 코퍼스 구축 방법은 크게 차량용 대화 코퍼스 수집과 수집된 대화 코퍼스에 Dialog Act를 반자동으로 태깅하는 방법으로 나눌 수 있다. 차량용 대화 코퍼스 수집은 1) 대화플랜 맵 구축, 2) 표준대화 구축, 3) 자유대화 구축, 4) 사용자 발화에 패러프래징 발화 구축의 순으로 구축되었다. Dialog Act 태깅은 수집된 대화코퍼스로부터 슬롯 후보를 추출하여 슬롯 체계를 구축한 후 반자동 슬롯 태깅을 실시하고, 슬롯 태깅 결과와 Dialog Act Type을 조합하여 Dialog Act 태깅 코퍼스를 구축하였다. 이렇게 구축된 Dialog Act 태깅 코퍼스는 차량 공조시스템(에어컨, 히터 등) 및 차량 응급 조치 정보 서비스와 같은 차량용 대화 시스템에 적용 중에 있다.

  • PDF

Speech Act Flow in Natural Language Dialogues (제한 영역 대화에 나타난 화행 흐름에 관한 연구)

  • 송도규;차건회;박재득
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.168-170
    • /
    • 1998
  • 본 논문에서는 화행처리를 기반으로 한 중고자동차 매매 영역 대화시스템[1] 구축 과정에서 참조한 대화 시나리오에 나타난 화행의 흐름을 살펴보고자 한다. 자연언어 특히 대화에 나타나는 발화들은 어떤 행위를 구성하는 경향이 강하고 이 행위들은 각 발화의 언표내적 행위로 결정되며 대화의 흐름은 이 언표내적 행위를 교환함으로써 이루어진다. 다라서 단일 발화들이 모여서 이루는 대화에는 화행의 흐름이 있기 마련이다. 우리는 본 논문에서 대화시스템의 효율적이 대화관리를 위해서 제한 영역 대화에 나타난 화행의 흐름을 올바로 분석하고 규명하여 대화를 자연스럽게 유도하도록 한다.

  • PDF

A Study on Automatic Expansion of Dialogue Examples Using Logs of a Dialogue System (대화시스템의 로그를 이용한 대화예제의 자동 확충에 관한 연구)

  • Hong, Gum-Won;Lee, Jeong-Hoon;Shin, Jung-Hwi;Lee, Do-Gil;Rim, Hae-Chang
    • 한국HCI학회:학술대회논문집
    • /
    • 2009.02a
    • /
    • pp.257-262
    • /
    • 2009
  • This paper studies an automatic expansion of dialogue examples using the logs of an example-based dialogue system. Conventional approaches to example-based dialogue system manually construct dialogue examples between humans and a Chatbot, which are labor intensive and time consuming. The proposed method automatically classifies natural utterance pairs and adds them into dialogue example database. Experimental results show that lexical, POS and modality features are useful for classifying natural utterance pairs, and prove that the dialogue examples can be automatically expanded using the logs of a dialogue system.

  • PDF

Multi Domain Dialog State Tracking using Domain State (도메인 상태를 이용한 다중 도메인 대화 상태 추적)

  • Jeon, Hyunmin;Lee, Geunbae
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.421-426
    • /
    • 2020
  • 다중 도메인 목적 지향 대화에서 기존 딥 러닝을 이용한 대화 상태 추적(Dialog state tracking)은 여러 턴 동안 누적된 사용자와 시스템 간 대화를 입력 받아 슬롯 밸류(Slot value)를 추출하는 모델들이 연구되었다. 하지만 이 모델들은 대화가 길어질수록 연산량이 증가한다. 이에 본 논문에서는 다중 도메인 대화에서 누적된 대화의 history 없이 슬롯 밸류를 추출하는 방법을 제안한다. 하지만, 단순하게 history를 제거하고 현재 턴의 발화만 입력 받는 방법은 문맥 정보의 손실로 이어진다. 따라서 본 논문에서는 도메인 상태(Domain state)를 도입하여 매 턴 마다 대화 상태와 함께 추적하는 모델을 제안한다. 도메인 상태를 같이 추적함으로써 현재 어떠한 도메인에 대하여 대화가 진행되고 있는지를 파악한다. 또한, 함축된 문맥 정보를 담고 있는 이전 턴의 대화 상태와 도메인 상태를 현재 턴의 발화와 같이 입력 받아 정보의 손실을 줄였다. 대표적인 데이터 셋인 MultiWOZ 2.0과 MultiWOZ 2.1에서 실험한 결과, 대화의 history를 사용하지 않고도 대화 상태 추적에 있어 좋은 성능을 보이는 것을 확인하였다. 또한, 시스템 응답과 과거 발화에 대한 의존성을 제거하여 end-to-end 대화 시스템으로의 확장이 좀 더 용이할 것으로 기대된다.

  • PDF