• 제목/요약/키워드: User utterance

검색결과 39건 처리시간 0.029초

대화 말뭉치 구축을 위한 반자동 의미표지 태깅 시스템 (A Semi-Automatic Semantic Mark Tagging System for Building Dialogue Corpus)

  • 박준혁;이성욱;임윤섭;최종석
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권5호
    • /
    • pp.213-222
    • /
    • 2019
  • 지능형 음성 대화 인터페이스 구현에 있어 핵심어의 의미표지는 사용자 의도 파악을 위한 중요한 요소이다. 대화시스템은 사용자 발화의 의도를 파악하기 위해 핵심어와 그 의미표지를 이용하여 발화의 의도를 결정한다. 하나의 핵심어는 여러 개의 의미표지를 가질 수 있는 중의성을 지닌다. 이러한 중의성을 지닌 핵심어를 사용자의 의도와 일치하는 의미표지로 결정하는 것은 단어 의미 분별 문제와 유사하다. 우리는 전사된 대화 말뭉치의 약 23%를 수동으로 의미를 부착하여 핵심어에 대한 의미표지 사전, 유의어 사전, 문맥벡터 사전을 먼저 구축한 후, 나머지 77% 대화 말뭉치에 존재하는 핵심어의 의미를 자동으로 부착한다. 중의성을 가진 핵심어는 문맥벡터 사전으로부터 문맥 벡터 유사도를 계산하여 의미를 결정한다. 핵심어가 미등록어인 경우에는 유의어 사전을 이용하여 가장 유사한 핵심어를 찾아 그 핵심어의 의미를 부착한다. 중의성을 가진 고빈도 핵심어 3개와 저빈도 핵심어 3개를 말뭉치에서 선정하여 제안 시스템의 성능을 평가하였다. 실험결과, 수동으로 구축한 말뭉치를 사용하였을 때 약 54.4%의 정확도를 얻었고, 반자동으로 확장한 말뭉치를 사용하였을 때 약 50.0%의 정확도를 얻었다.

Deep neural network-hidden Markov model 하이브리드 구조의 모델을 사용한 사용자 정의 기동어 인식 시스템에 관한 연구 (A study on user defined spoken wake-up word recognition system using deep neural network-hidden Markov model hybrid model)

  • 윤기무;김우일
    • 한국음향학회지
    • /
    • 제39권2호
    • /
    • pp.131-136
    • /
    • 2020
  • 음성 인식기를 대기모드에서 동작 모드로 전환하기 위해 발화하는 짧은 단어를 기동어(Wake Up Word, WUW)라고 하며, 음성 인식기를 실제로 사용하는 사용자가 지정한 기동어를 사용자 정의 기동어라고 한다. 본 논문에서는 이러한 사용자 정의 기동어를 인식하기 위해 기존의 Gaussian Mixture Model-Hidden Markov Model(GMM-HMM) 기반의 시스템, Linear Discriminant Analysis(LDA)를 적용한 LDA-GMM-HMM 기반의 시스템과, LDA-GMM-HMM 모델에서 GMM을 Deep Neural Network(DNN)로 대체한 LDA-DNN-HMM 기반의 시스템을 제작하고 각 시스템의 사용자 정의 기동어 인식 성능 및 비기동어 거절 성능을 비교한다. 또한 기동어 인식기의 체감 성능을 향상시키고자 각 모델에 threshold를 적용하여 기동어 인식 실패율을 약 10 % 수준으로 감소 시킨 후에 비기동어(non-WUW)의 거절 실패율을 비교 평가한다. Threshold 적용시에 LDA-DNN-HMM 기반의 시스템의 경우 기동어 인식 실패율 9.84 % 수준에서 비기동어 거절 실패율이 0.0058 %의 인식 성능을 나타내어 LDA-GMM-HMM 시스템 보다 약 4.82배 향상된 비기동어 거절 성능을 나타낸다. 이러한 결과는 본 논문에서 제작한 LDA-DNN-HMM 모델이 사용자 정의 기동어 인식 시스템을 구축하는데 효과적임을 입증한다.

Probabilistic Neural Network Based Learning from Fuzzy Voice Commands for Controlling a Robot

  • Jayawardena, Chandimal;Watanabe, Keigo;Izumi, Kiyotaka
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2004년도 ICCAS
    • /
    • pp.2011-2016
    • /
    • 2004
  • Study of human-robot communication is one of the most important research areas. Among various communication media, any useful law we find in voice communication in human-human interactions, is significant in human-robot interactions too. Control strategy of most of such systems available at present is on/off control. These robots activate a function if particular word or phrase associated with that function can be recognized in the user utterance. Recently, there have been some researches on controlling robots using information rich fuzzy commands such as "go little slowly". However, in those works, although the voice command interpretation has been considered, learning from such commands has not been treated. In this paper, learning from such information rich voice commands for controlling a robot is studied. New concepts of the coach-player model and the sub-coach are proposed and such concepts are also demonstrated for a PA-10 redundant manipulator.

  • PDF

담화 차원의 한국어 문법 교육을 위한 '-거든(요)'의 화용적 기능 분석 연구 (The Study of Pragmatic Functions of '-ketun(yo)' for Korean grammar teaching on a discourse level)

  • 한하림
    • 한국어교육
    • /
    • 제28권2호
    • /
    • pp.209-233
    • /
    • 2017
  • The purpose of this study is to analyze the pragmatic functions of '-ketun(yo)' expressed in the discourse associating with the context of communication based on the actual conversations of Korean native speakers. As discourse is closely related to the context, contextual factors surrounding the discourse should be actively considered in order to reveal the function of grammar expressed in the discourse. Also, there is need to consider the grammatical functions in terms of the linguistic user which is the subject of interaction in the discourse. Based on this necessity, in this study, we analyzed the pragmatic functions of '-ketun(yo).' As a result, '-ketun(yo)-' had a great influence on the formation and expansion of the shared context in communication contexts. The shared context is expanded through generative mutual knowledge and priori mutual knowledge. As a result of the conversation analysis, '-ketun(yo)-' was used at a high frequency in the expansion of generative mutual knowledge formation. In addition, '-ketun(yo)-' appeared to have a discourse cohesion function that binds topics with other topics. In the case that '-ketun(yo)-' is formed through priori mutual knowledge, '-ketun(yo)-' could be used as a sign to lead the union of the speaker and the listener. This study has significance in that it examines the pragmatic functions of '-ketun(yo)-' in relation to the context of communication based on actual utterance.

발화 의도 예측 및 슬롯 채우기 복합 처리를 위한 한국어 데이터셋 개발 (Development of Korean dataset for joint intent classification and slot filling)

  • 한승규;임희석
    • 한국융합학회논문지
    • /
    • 제12권1호
    • /
    • pp.57-63
    • /
    • 2021
  • 사람의 발화 내용을 이해하도록 하는 언어 인식 시스템은 주로 영어로 연구되어 왔다. 본 논문에서는 시스템과 사용자의 대화 내용을 수집한 말뭉치를 바탕으로 언어 인식 시스템을 훈련시키고 평가할 때 사용할 수 있는 한국어 데이터셋을 개발하고, 관련 통계를 제시한다. 본 데이터셋은 식당 예약이라는 고정된 주제 안에서 사용자의 발화 의도와 슬롯 채우기를 해야 하는 데이터셋이다. 본 데이터셋은 6857개의 한국어 문장으로 이루어져 있으며, 표기된 단어 슬롯의 종류는 총 7개이다. 본 데이터셋에서 표기된 발화의 종류는 총 5개이며, 문장의 발화 내용에 따라 최대 2개까지 동시에 기입되어 있다. 영어권에서 연구된 모델을 본 데이터셋에 적용시켜 본 결과, 발화 의도 추측 정확도는 조금 하락하였고, 슬롯 채우기 F1 점수는 크게 차이나는 모습을 보였다.

다중 테이블을 활용한 챗봇의 중복 응답 감소 연구 (A Study on Reducing Duplication Responses of Chatbot Based on Multiple Tables)

  • 권혁무;서영석
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권10호
    • /
    • pp.397-404
    • /
    • 2018
  • 현재 스마트폰에서는 사용자의 요구에 맞는 다양한 앱(App)들이 활용되고 있는데, 특히 많은 기업들에서 비즈니스 마케팅, 상업적인 홍보 등을 위해 모바일 메신저 형태의 대화형 시스템을 연구 개발하여 고객들에게 다양한 서비스를 제공하고 있다. 이러한 대화형 시스템을 우리는 '챗봇(Chatbot)'이라고 부른다. 이러한 챗봇의 경우 사용자와 대화시 중복 응답이 자주 발생할 수 있는데, 이러한 중복응답의 경우 특정 서비스에 대한 사용자의 흥미와 관심도를 떨어뜨린다. 따라서 본 논문에서는 이러한 챗봇 개발시 사용자로부터 입력된 발화(utterance)에 따른 챗봇의 중복 응답을 정의하고 이를 감소시킬 수 있는 기법을 제안한다. 이를 위해 데이터베이스 내 다중 테이블을 구축하고 테이블별로 사용자 입력에 따른 챗봇의 응답 조합을 구성하여 새로운 중복 회피 알고리즘을 통해 챗봇의 중복 응답을 감소시킬 수 있도록 한다. 이렇게 제안한 기법의 검증을 위해 자동화된 챗봇을 구현하였고, 본 연구에서 제시한 기법과 기존 응답 방식 연구를 분석해본 결과, 본 연구에서 제안한 기법을 통해 평균 70% 정도의 중복 감소 효과를 확인할 수 있었다.

대화시스템 미지원 도메인 검출에 관한 조사 (Survey on Out-Of-Domain Detection for Dialog Systems)

  • 정영섭;김영민
    • 융합정보논문지
    • /
    • 제9권9호
    • /
    • pp.1-12
    • /
    • 2019
  • 대화시스템은 인간과 컴퓨터 사이의 새로운 의사소통 수단으로 떠오르고 있다. 대화시스템은 인간의 음성을 입력으로 취하여, 적절한 음성 답변 또는 서비스를 제공하게 된다. 아마존 에코, 네이버 웨이브 등과 같은 대화시스템 제품들이 등장하고 있음에도 불구하고, 이 대화시스템들은 공통적으로 미지원 도메인을 제대로 처리하지 못한다는 문제점을 안고 있다. 이와 관련한 몇몇 연구들이 있었지만, 이 문제를 풀기 위한 더욱 많은 연구가 진행될 필요가 있다. 이 논문에서는, 미지원 도메인 검출과 관련한 기존 연구들에 대하여 3가지 관점, 즉 데이터, 자질, 방법에 대한 관점으로 요약한 정보를 제공한다. 데이터셋이 부족하다는 점으로 인해 타 연구분야에 비해 적은 연구가 수행되어왔으므로, 앞으로 가장 시급한 연구 주제는 대화시스템의 미지원 도메인 검출을 위한 공개용 데이터셋을 구축하고 배포하는 것이다.

가정용 로봇의 호출음 등록 및 인식 시스템 (A Name Recognition Based Call-and-Come Service for Home Robots)

  • 오유리;윤재삼;박지훈;김민아;김홍국;공동건;명현;방석원
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 1부
    • /
    • pp.360-365
    • /
    • 2008
  • 본 논문에서는 Call-and-Come 서비스를 제공하는 가정용 로봇의 호출음 등록 및 인식 시스템 구축하고, 음성 기반의 효율적인 로봇 호출음 등록 및 인식 알고리즘을 제안한다. 본 논문에서는 음성을 이용하여 로봇 호출음을 효율적으로 등록하기 위해 monophone 음향모델을 이용하여 탐색 범위를 줄이고, 줄어든 탐색 범위 내에서 triphone 음향모델을 이용하여 호출음을 등록을 한다. 또한, 잘못된 호출이 인식되는 것을 줄이기 위한 발화 검증에 필요한 피라미터를 구한다. 원거리 음성인식률을 향상시키기 위해서 근거리 음성에 최적화된 음향모델을 원거리 음성 데이터베이스로 적응시켰으며, 마이크로폰 배열을 이용하여 사용자의 위치를 추정한다. 제안한 시스템의 성능 측정을 위해 수행된 로봇 호출음에 대한 등록 및 인식 실험에서 98.3%의 음성 인식률을 얻었다.

  • PDF

M-러닝을 활용한 공손 영어 표현 학습에 대한 연구 (A Study on the Learning of Polite Expressions Using M-learning)

  • 김혜정
    • 비교문화연구
    • /
    • 제42권
    • /
    • pp.261-283
    • /
    • 2016
  • 본 연구의 목적은 모바일 애플리케이션을 활용하여 공손 영어 표현 학습의 가능성을 고찰하고자 하는 것이다. 의사소통 능력의 향상을 도모하기 위해서는 문법적, 담화 능력 외에도 사회 언어적 능력이 필요하다. 상대방이 누구인지, 어떠한 대화 상황에 직면했는지, 대화의 주제나 목적 등에 따라 사회적 가치에 맞는 적합한 표현을 구사할 줄 알아야 한다. 상대방의 지위나 나이가 화자보다 높거나 상대방과의 친밀도가 낮을 경우 한국인 화자는 공손한 표현을 구사하게 된다. 한국어는 언어 자체적으로 경어 체계를 지니고 있지만 영어는 이와 다르기 때문에 학습자들은 영어의 공손 표현을 학습할 필요가 있다. 이를 위해 공손 언어 학습에 학습자들이 교실에서 누구나 쉽게 사용할 수 있는 모바일을 접목시키고자 한다. 학습 교재로는 영국의 시대극 "다운튼 애비"(Downton Abbey)를 이용하였는데 이 드라마는 귀족들의 삶을 중심으로 다루었기 때문에 공손 표현을 학습하기에는 매우 적합하다. 모바일 활용을 통한 공손 영어 학습의 효율성과 모바일 애플리케이션의 활용 가능성을 고찰하기 위해 네이버 밴드를 활용한 실험반과 일반적인 팀별 활동을 중심으로 한 통제반을 설정하였다. 두 반의 공손 언어 학습 효과를 확인하기 위해 두 번의 평가가 시행되었고 개방형 설문조사가 실시되었다. 평가 결과 모바일 애플리케이션의 사용은 공손 영어 표현 학습에 긍정적인 효과가 있었으며 모바일이 수업 후 활동으로 사용하기에 효율적인 학습 도구인 것으로 나타났다. 개방형 설문 조사에서 학습자들은 공손 표현을 우아하거나 고급스러운 언어 형식으로 인지하거나 실용적 표현과 구분하는 경향이 있었다. 시대극을 이용하여 공손 언어를 교수할 경우 교수자들은 현대 영어와의 접목을 고려할 필요가 있겠다.