• 제목/요약/키워드: Conversational error

검색결과 16건 처리시간 0.022초

대화형 에이전트의 자기발화수정 전략이 사용자 경험에 미치는 영향 - 과업 중요도와 대화 오류 여부를 중심으로 (Effects of Conversational Agent's Self-Repair Strategy On User Experience - Focused on Task Criticality and Conversational Error)

  • 김환주;김정용;강현민
    • 디지털융복합연구
    • /
    • 제20권2호
    • /
    • pp.251-260
    • /
    • 2022
  • 기술의 발달과 스마트 스피커 보급의 증가에도, 스마트 스피커의 대화 오류로 사용자 만족도는 하락하고 있다. 이 연구는 스마트 스피커의 대화형 에이전트 맥락에서 '자기발화수정 전략'이 과업 중요도 수준과 대화 오류 여부에 따라 사용자 경험에 미치는 영향을 살펴보았다. 대화 오류에 따라 시나리오를 제작하고 과업 중요도 수준에 따라 집단을 나눠 실험을 진행해 신뢰, 지각된 유용성, 지각된 용이성, 수용의도를 측정하였다. 연구 결과, 에이전트의 자기발화수정 전략은 완전한 수행과 비교해 신뢰와 지각된 용이성에 부적 영향을 주며, 과업 중요도와의 상호작용을 통해 수용의도에 영향을 미치는 것을 발견하였다. 이 연구는 대화형 에이전트 연구에서 미흡했던 자기발화수정 전략의 효과를 실증적으로 알아보았고, 자기발화수정 전략의 수용과 관련된 사용자 경험 요인을 살펴보았다는 점에서 의의를 가진다.

대화형 에이전트 인식오류 및 신조어 탐지를 위한 알고리즘 개발: 한글 음절 분리 기반의 단어 유사도 활용 (Developing a New Algorithm for Conversational Agent to Detect Recognition Error and Neologism Meaning: Utilizing Korean Syllable-based Word Similarity)

  • 이정원;임일
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.267-286
    • /
    • 2023
  • 인공지능 스피커로 대표되는 대화형 에이전트는 사람-컴퓨터 간 대화형이기 때문에 대화 상황에서 오류가 발생하는 경우가 잦다. 에이전트 사용자의 발화 기록에서 인식오류는 사용자의 발화를 제대로 인식하지 못하는 미인식오류 유형과 발화를 인식하여 서비스를 제공하였으나 사용자가 의도한 바와 다르게 인식된 오인식오류 유형으로 나뉜다. 이 중 오인식오류의 경우, 서비스가 제공된 것으로 기록되기 때문에 이에 대한 오류 탐지가 별도로 필요하다. 본 연구에서는 텍스트 마이닝 기법 중에서도 단어와 문서를 벡터로 바꿔주는 단어 임베딩과 문서 임베딩을 이용하여 단순 사용된 단어 기반의 유사도 산출이 아닌 단어의 분리 방식을 다양하게 적용함으로써 연속 발화 쌍의 유사도를 기반으로 새로운 오인식오류 및 신조어 탐지 방법을 탐구하였다. 연구 방법으로는 실제 사용자 발화 기록을 활용하여 오인식오류의 패턴을 모델 학습 및 생성 시 적용하여 탐지 모델을 구현하였다. 그 결과, 오인식오류의 가장 큰 원인인 등록되지 않은 신조어 사용을 탐지할 수 있는 패턴 방식으로 다양한 단어 분리 방식 중 초성 추출 방식이 가장 좋은 결과를 보임을 확인하였다. 본 연구는 크게 두 개의 함의를 가진다. 첫째, 인식오류로 기록되지 않아 탐지가 어려운 오인식오류에 대하여 다양한 방식 별 비교를 통해 최적의 방식을 찾았다. 둘째, 이를 실제 신조어 탐지 적용이 필요한 대화형 에이전트나 음성 인식 서비스에 적용한다면 음성 인식 단계에서부터 발생하는 오류의 패턴도 구체화할 수 있으며, 오류로 분류되지 않더라도 사용자가 원하는 결과에 맞는 서비스가 제공될 수 있음을 보였다.

대화체 연속음성 인식을 위한 언어모델 적응 (Language Model Adaptation for Conversational Speech Recognition)

  • 박영희;정민화
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2003년도 5월 학술대회지
    • /
    • pp.83-86
    • /
    • 2003
  • This paper presents our style-based language model adaptation for Korean conversational speech recognition. Korean conversational speech is observed various characteristics of content and style such as filled pauses, word omission, and contraction as compared with the written text corpora. For style-based language model adaptation, we report two approaches. Our approaches focus on improving the estimation of domain-dependent n-gram models by relevance weighting out-of-domain text data, where style is represented by n-gram based tf*idf similarity. In addition to relevance weighting, we use disfluencies as predictor to the neighboring words. The best result reduces 6.5% word error rate absolutely and shows that n-gram based relevance weighting reflects style difference greatly and disfluencies are good predictor.

  • PDF

대화체 연속음성 인식을 위한 한국어 대화음성 특성 분석 (Analysis of Korean Spontaneous Speech Characteristics for Spoken Dialogue Recognition)

  • 박영희;정민화
    • 한국음향학회지
    • /
    • 제21권3호
    • /
    • pp.330-338
    • /
    • 2002
  • 대화체 연속음성은 자연스러운 발화로 낭독체 문장에 비해 잡음, 간투어와 같은 비문법적인 요소가 많고, 발음의 변이가 심하다. 이런 이유로 대화체 연속음성을 인식하기 위해서는 대화 현상을 분석하고 그 특징을 반영하여야 한다. 본 논문에서는 실제 대화음성에 빈번히 나타나는 대화 현상들을 분류하고 각 현상들을 모델링하여 대화체 연속음성 인식을 위한 기본 베이스라인을 구축하였다. 대화 현상을 묵음 구간과 잡음, 간투어, 반복/수정 발화의 디스풀루언시 (disfluencies), 표준전사와 다른 발음을 갖는 발음변이 현상으로 나누었다. 발음변이 현상은 다시 양성음의 음성음화, 음운축약/탈락현상, 패턴화된 발음변이, 발화오류로 세분화하였다. 대화체 음성인식을 위해서 빈번히 나타나는 묵음구간을 고려한 학습과 잡음, 간투어 처리를 위한 음향모델을 각각 추가하였다. 발음변이 현상에 대해서는 출현빈도수가 높은 것들만을 대상으로 발음사전에 다중 발음열을 추가하였다. 대화현상을 고려하지 않고 낭독체 스타일로 음성인식을 수행하였을 때 형태소 에러율 (MER: Morpheme Error Rate)은 31.65%였다. 이에 대한 형태소 에러율의 절대값 감소는 묵음 모델과 잡음 모델을 적용했을 때 2.08%, 간투어 모델을 적용했을 때 0.73%, 발음변이 현상을 반영했을때 0.92%였으며, 최종적으로 27.92%의 형태소 에러율을 얻었다. 본 연구는 대화체 연속음성 인식을 위한 기초 연구로 음향모델과 어휘모델, 언어모델 각각에 대한 베이스라인으로 삼고자 한다.

자발화에 나타난 형태소 유형에 따른 3-4세 아동의 치경마찰음 오류 (Alveolar Fricative Sound Errors by the Type of Morpheme in the Spontaneous Speech of 3- and 4-Year-Old Children)

  • 김수진;김정미;윤미선;장문수;차재은
    • 말소리와 음성과학
    • /
    • 제4권3호
    • /
    • pp.129-136
    • /
    • 2012
  • Korean alveolar fricatives are late-developing speech sounds. Most previous research on phonemes used individual words or pseudo words to produce sounds, but word-level phonological analysis does not always reflect a child's practical articulation ability. Also, there has been limited research on articulation development looking at speech production by grammatical morphemes despite its importance in Korean language. Therefore, this research examines the articulation development and phonological patterns of the /s/ phoneme in terms of morphological types produced in children's spontaneous conversational speech. The subjects were twenty-two typically developing 3- and 4-year-old Koreans. All children showed normal levels in three screening tests: hearing, vocabulary, and articulation. Spontaneous conversational samples were recorded at the children's homes. The results are as follows. The error rates decreased with increasing age in all morphological contexts. Also, error percentages within an age group were significantly lower in lexical morphemes than in grammatical morphemes. The stopping of fricative sounds was the main error pattern in all morphological contexts and reduced as age increased. This research shows that articulation performance can differ significantly by morphological contexts. The present study provides data that can be used to identify the difficult context for articulatory evaluation and therapy of alveolar fricative sounds.

최신 대화형 에이전트 기반 상용화 교육 플랫폼 오류 분석 (Error Analysis of Recent Conversational Agent-based Commercialization Education Platform)

  • 이승준;박찬준;서재형;임희석
    • 한국융합학회논문지
    • /
    • 제13권3호
    • /
    • pp.11-22
    • /
    • 2022
  • 최근 교육 분야에서 다양한 인공지능 기술을 활용한 연구와 개발이 이뤄지고 있다. 인공지능을 활용한 교육 중 특히 대화형 에이전트는 시간과 공간의 제약을 받지 않고 음성인식, 번역과 같은 다양한 인공지능 기술과 결합해 더 효과적인 언어 학습을 가능하게 한다. 본 논문은 상용화된 교육용 플랫폼 중 이용자 수가 많고 영어 학습을 위한 대화형 에이전트가 활용된 플랫폼에 대한 동향 분석을 진행하였다. 동향 분석을 통해 현재 상용화된 교육용 플랫폼의 대화형 에이전트는 여러 한계점과 문제점이 존재했다. 구체적인 문제점과 한계점 분석을 위해 사전 학습된 최신 대용량 대화 모델과 비교 실험을 진행하였고, 실험 방법으로 대화형 에이전트의 대답이 사람과 비슷한지를 평가하는 Sensibleness and Specificity Average (SSA) 휴먼 평가를 진행하였다. 실험 내용을 바탕으로, 효과적인 학습을 위해 개선방안으로 대용량 파라미터로 학습된 대화 모델, 교육 데이터, 정보 검색 기능의 필요성을 제안했다.

의인화된 챗봇의 자기노출과 감정표현이 사용자 경험에 미치는 영향 - 금융서비스에서의 대화 오류 상황을 중심으로 (Effect of Anthropomorphic Chatbot's Self-disclosure and Emotional Expression on User Experience - Focused on Conversational Error in Financial Service)

  • 김환주;김지연;최준호
    • 문화기술의 융합
    • /
    • 제8권4호
    • /
    • pp.445-455
    • /
    • 2022
  • 금융 서비스에서 적극적으로 활용되고 있는 챗봇은 대화 오류와 기계적인 답변으로 사용자 경험을 저해하고 있다. 이 연구는 의인화된 챗봇의 자기노출과 감정표현이 금융 서비스에서 대화 오류 시 사용자 경험에 미치는 효과를 살펴보았다. 일상적인 금융 서비스 문의 상황에서 자기노출 유형(긍정적 vs. 부정적)과 감정표현 수준(높은 수준의 자신감 vs. 낮은 수준의 자신감)별로 시나리오를 구성해 온라인 실험을 진행하였고, 신뢰, 곤혹도, 서비스 회복만족, 지속 사용의도를 측정하였다. 실험 결과, 의인화된 챗봇의 자기노출과 감정표현에서 신뢰, 곤혹도, 서비스 회복만족, 지속 사용의도에 대해 각각 주효과가 나타났고 신뢰와 곤혹도에서 상호작용 효과가 나타났다. 결론적으로 의인화된 챗봇이 긍정적 자기노출과 자신감 있는 감정표현을 할 때 상대적으로 신뢰가 높아지고 곤혹도가 낮아지는 것을 확인하였다.

다양한 음성을 이용한 자동화자식별 시스템 성능 확인에 관한 연구 (Variation of the Verification Error Rate of Automatic Speaker Recognition System With Voice Conditions)

  • 홍수기
    • 대한음성학회지:말소리
    • /
    • 제43호
    • /
    • pp.45-55
    • /
    • 2002
  • High reliability of automatic speaker recognition regardless of voice conditions is necessary for forensic application. Audio recordings in real cases are not consistent in voice conditions, such as duration, time interval of recording, given text or conversational speech, transmission channel, etc. In this study the variation of verification error rate of ASR system with the voice conditions was investigated. As a result in order to decrease both false rejection rate and false acception rate, the various voices should be used for training and the duration of train voices should be longer than the test voices.

  • PDF

UX-기반 메타버스 윤리적 AI 학습 모델 연구 (A Study on the UX-based Ethical AI-Learning Model for Metaverse)

  • 안성희
    • 방송공학회논문지
    • /
    • 제27권5호
    • /
    • pp.694-702
    • /
    • 2022
  • 본 논문은 메타버스 환경에서 대화형 AI가 어떻게 윤리적으로 진화될 수 있을지에 대한 솔루션을 UX(사용자경험) 관점으로 찾아보는 기술 전략 연구이다. 대화형 AI는 사람들과의 직접적인 인터랙션을 통해 사람들의 온·오프라인의 결정요소에 영향을 미치기 때문에 메타버스 AI 윤리가 필수적으로 반영되어야 한다. 대화형 AI의 머신러닝의 과정에는 사용자 개인의 경험데이터와 함께 문화적 코드들이 포함되고 고려되어야 사용자경험의 오류값을 줄일 수 있다. 이를 통해 초 개인화된 메타버스의 서비스가 사회적 가치를 고려하며 윤리적으로 진화할 수 있다. 위와 같은 가설을 기반으로 본 논문의 연구 결과로 메타버스 서비스 환경에서 컨택스트 기반의 대화형 AI를 위한 머신러닝(ML)과정에 사용자의 경험데이터를 추가한 선행적 관점의 개념 모델을 개발, 제안하였다.

말소리장애 아동의 단어와 자발화 문맥의 음운오류패턴 비교 (A comparison of phonological error patterns in the single word and spontaneous speech of children with speech sound disorders)

  • 박가연;김수진
    • 말소리와 음성과학
    • /
    • 제7권3호
    • /
    • pp.165-173
    • /
    • 2015
  • This study was aim to compare the phonological error patterns and PCC(Percentage of Correct Consonants) derived from the single word and spontaneous speech contexts of the speech sound disorders with unknown origin(SSD). The present study suggest that the development phonological error patterns and non-developmental error patterns of the target children, in according to speech context. The subjects were 15 children with SSD up to the age of 5 from 3 years of age. This research use 37 words of APAC(Assessment of Phonology & Articulation for Children) in the single word context and 100 eojeol in the spontaneous speech context. There was no difference of PCC between the single word and the spontaneous speech contexts. Significantly different developmental phonological error patterns between the single word and the spontaneous speech contexts were syllable deletion, word-medial onset deletion, liquid deletion, gliding, affrication, fricative other error, tensing, regressive assimilation. Significantly different non-developmental phonological error patterns were backing, addtion of phoneme, aspirating. The study showed that there was no difference of PCC between elicited single word and spontaneous conversational context. And there were some different phonological error patterns derived from the two contexts of the speech sound disorders. The more important interventions target is the error patterns of the spontaneous speech contexts for the immediate generalization and rising overall intelligibility.