• Title/Summary/Keyword: 對話

Search Result 3,158, Processing Time 0.033 seconds

Korean Pause Prediction Model based on Dialogue Context (대화 맥락에 기반한 한국어 휴지 예측 모델)

  • Joung Lee;Jeongho Na;Jeongbeom Jeong;Maengsik Choi;Chunghee Lee;Seung-Hoon Na
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.404-408
    • /
    • 2023
  • 음성 사용자 인터페이스(Voice User Interface)에 대한 수요가 증가함에 따라 음성 합성(Speech Synthesis) 시스템에서 자연스러운 음성 발화를 모방하기 위해 적절한 위치에 휴지를 삽입하는 것이 주된 과업으로 자리잡았다. 대화의 연속성을 고려했을 때, 자연스러운 음성 기반 인터페이스를 구성하기 위해서는 대화의 맥락을 이해하고 적절한 위치에 휴지를 삽입하는 것이 필수적이다. 이에 따라 본 연구는 대화 맥락에 기반하여 적절한 위치에 휴지를 삽입하는 Long-Input Transformer 기반 휴지 예측 모델을 제안하고 한국어 대화 데이터셋에서 검증한 결과를 보인다.

  • PDF

Utilizing LLM for Conversations with AI Character in Chat-enabled Games (챗 가능한 게임에서 AI 캐릭터와의 대화를 위한 LLM 활용)

  • Myoung-Jae Choi;Ji-Ho Shin;Se-Yeong Lee;Dong-Ju Jung;Byung-Jeong Lee
    • Annual Conference of KIPS
    • /
    • 2024.05a
    • /
    • pp.673-674
    • /
    • 2024
  • 본 연구에서는 게임에서 자연스런 대화를 통해 스토리 몰입을 제공하는 AI 캐릭터를 위한 LLM 활용을 소개한다. 사용자는 게임 속 AI 캐릭터와 대화하며 스토리를 이어간다. 게임 속에서 사용자는 정해진 대사를 선택할 수도 있고, AI 캐릭터와 대화할 때 직접 대사를 입력할 수도 있다. 대사를 입력하면 그에 맞는 AI 캐릭터의 답변이 제공되고, 앞으로의 스토리에도 영향을 미친다. 결론적으로 LLM 기반 AI 캐릭터와의 자연스러운 대화를 통해 게임의 몰입도와 접근성을 높이는 것이 본 연구의 목표이다.

Multi-Decoder Conversational Model for Generating Robust Response Based on Denoising Mechanism (강건한 응답 생성을 위한 디노이징 메커니즘 기반 다중 디코더 대화 모델)

  • Kim, Tae-Hyeong;Park, Seong-Bae;Park, Se-Young
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.141-146
    • /
    • 2018
  • 최근 대화 모델 학습에는 시퀀스-투-시퀀스 모델이 널리 활용되고 있다. 하지만 기본적인 시퀀스-투-시퀀스 모델로 학습한 대화 모델은 I don't know 문제와 사오정 문제를 내포한다. I don't know 문제는 입력 발화에 대해 안전하고 무미건조한 단편적인 대답을 많이 생성하는 문제이다. 사오정 문제는 입력 발화에 대해 적절한 응답을 생성했지만 입력 발화와 동일한 의미를 지니지만 어순, 어미 등의 변화가 있는 발화에는 적절한 응답을 생성하지 못하는 문제이다. 이전 연구에서 디노이징 메커니즘을 활용하여 각각의 문제를 완화하는 대화 모델들을 학습할 수 있음을 보였으나 하나의 모델에서 두 문제를 동시에 해결하지는 못하였다. 본 논문에서는 디노이징 메커니즘을 활용하여 각각의 문제에 강점을 지닌 디코더들을 학습하고 응답 생성 시 입력 발화에 따라 두 디코더를 적절하게 반영하여 언급한 문제 모두에 대해 강건한 응답을 생성할 수 있는 모델을 제안한다. 제안하는 방법의 우수성을 보이기 위해 9만 건의 한국어 대화 데이터로 실험을 수행하였다. 실험 결과 단일 문제를 해결하는 모델들과 비교하여 ROUGE F1 점수와 사람이 평가한 정성 평가에서 성능 향상을 보였다.

  • PDF

Character Identification on Multiparty Dialogues using Multimodal Features (멀티모달 자질을 활용한 다중 화자 대화 속 인물 식별)

  • Han, Kijong;Choi, Seong-Ho;Shin, Giyeon;Zhang, Byoung-Tak;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.215-219
    • /
    • 2018
  • 다중 화자 대화 속 인물 식별이란 여러 등장인물이 나오는 대본에서 '그녀', '아버지' 등 인물을 지칭하는 명사 또는 명사구가 실제 어떤 인물을 나타내는지 파악하는 문제이다. 대본 자연어 데이터만을 입력으로 하는 대화 속 인물 식별 문제는 드라마 대본에 대해서 데이터가 구축 되었고 이를 기반으로 여러 연구가 진행되었다. 그러나, 사람도 다중 화자 대화의 문장만 보고는 인물을 지칭하는 명사 또는 명사구가 실제 어떤 인물인지 파악하기 어려운 경우가 있다. 이에 본 논문에서는 발화가 되는 시점의 영상 장면 정보를 추가적으로 활용하여 인물 식별의 성능을 높이는 방법을 제시한다. 또한 기존 대화 속 인물 식별 연구들은 미리 정의된 인물을 대상으로 분류하는 형태로 접근해왔다. 이는 학습에 사용되지 않았던 인물이 나오는 임의의 다른 드라마 대본이나 대화 등에 바로 적용될 수 없다. 이에 본 논문에서는 영상 정보는 활용하되, 한번 학습하면 임의의 대본에 적용될 수 있도록 사전 인물 정보를 사용하지 않는 상호참조해결 기반의 인물 식별 방법도 제시한다.

  • PDF

The study of optimism through the dialogue in NPC (낙관주의 관점에서 본 NPC의 대화 내용 분석 -<메이플스토리>를 중심으로)

  • Hong, Hyun-Jo;Ryu, Seoung-Ho
    • Journal of Korea Game Society
    • /
    • v.20 no.4
    • /
    • pp.111-124
    • /
    • 2020
  • This paper analyzed the dialogue language of 'Maple Story' NPC from the perspective of learned optimism. Not only is NPC's language a key skill in artificial intelligence language, it also plays a big role in giving game users fun and desire to achieve. In this paper, as a result of analyzing the dialogue language of NPCs by utilizing the two key dimensions of NPC's learned optimistic explanation form: permanence and pervasiveness, the rate of characters' conversations using optimistic languages was 6%~7%. It was confirmed the important consideration in NPC artificial intelligence development.

A Out-of-vocabulary Processing Technology for the Spoken Language Understanding Module of a Dialogue Based Private Secretary Software (대화형 개인 비서 시스템의 언어 인식 모듈(SLU)을 위한 미등록어(OOV) 처리 기술)

  • Lee, ChangSu;Ko, YoungJoong
    • Annual Conference on Human and Language Technology
    • /
    • 2014.10a
    • /
    • pp.3-8
    • /
    • 2014
  • 대화형 개인 비서 시스템은 사람의 음성을 통해 인식된 음성 인식 결과를 분석하여 사용자에게 제공할 정보가 무엇인지 파악한 후, 정보가 포함되어 있는 앱(app)을 실행시켜 사용자가 원하는 정보를 제공하는 시스템이다. 이러한 대화형 개인 비서 시스템의 가장 중요한 모듈 중 하나는 음성 대화 인식 모듈(SLU: Spoken Language Understanding)이며, 발화의 "의미 분석"을 수행하는 모듈이다. 본 논문은 음성 인식결과가 잘못되어 의미 분석이 실패하는 것을 방지하기 위하여 음성 인식 결과에서 잘못 인식된 명사, 개체명 단어를 보정 시켜주는 미등록어(OOV:Out-of-vocabulary) 처리 모듈을 제안한다. 제안하는 미등록어 처리 모듈은 미등록어 탐색 모듈과 미등록어 변환 모듈로 구성되며, 미등록어 탐색 모듈을 통해 사용자의 발화에서 미등록어를 분류하고, 미등록어 변환 모듈을 통해 미등록어를 사전에 존재하는 유사한 단어로 변환하는 방법을 제안한다. 제안한 방법을 적용하였을 때의 실험 결과, 전체 미등록어 중 최대 52.5%가 올바르게 수정되었으며, 음성 인식 결과를 그대로 사용했을 경우 "원본 문장"과 문장 단위 67.6%의 일치율을 보인 것에 반해 미등록어 처리 모듈을 적용했을 때 17.4% 개선된 최대 85%의 문장 단위 일치율을 보였다.

  • PDF

Interactive Broadcasting System based on MPEG-4 (MPEG-4 기반 대화형 방송 시스템)

  • 안상우;조용주;신기선;최진수;김진웅
    • Journal of Broadcast Engineering
    • /
    • v.7 no.1
    • /
    • pp.28-36
    • /
    • 2002
  • In this paper. we propose an interactive broadcasting system based on MPEG-4 to provide Interactive services in digital TV broadcast. The proposed system is designed to support various functionalities such as authoringof MPEG-4. encapsulation of MPEG-4 Into MPEG-2 TS (Transport Stream) protocol, synchronization of MPEG-4 with MPEG-2 program. demultiplexing of MPEG-4 from MPEG-2 TS. decoding/rendering of MPEG-4 and interactivity through IP network on ATSC (Advanced Television Systems Committee) platform. The interactive broadcasting system based on MPEG-4 Is used to provide interactive functionality In full for user. and it has a particular advantage of substitution for the ATSC or DVB platform. as well.

The Corpus-based Dialogue System Using a Dialogue Transition Network and a Similarity Measure Method (유사도 계산과 대화 전이 네트워크를 이용한 말뭉치 기반 대화 시스템)

  • Kang, Sangwoo;Park, Hongmin;Ko, Youngjoong;Seo, Jungyun
    • Annual Conference on Human and Language Technology
    • /
    • 2008.10a
    • /
    • pp.162-166
    • /
    • 2008
  • 본 연구는 말뭉치로부터 추출된 정보를 사용하여 대화 시스템에 필요한 과정들을 통합 처리하는 시스템을 제안한다. 기존 연구는 영역 확장 시 대화 시스템의 각 과정들을 위해 많은 노력이 필요하였지만, 제안하는 방법은 말뭉치를 사용하여 각 과정들을 통합적으로 업데이트함으로서 이 문제를 해결하고자 한다. 사용자 입력문장과 말뭉치의 각 문장들 간의 유사도 계산을 통하여 의미적으로 가장 유사한 말뭉치 문장의 정보를 이용하고, 시스템 응답에 필요한 정보를 선택한다. 또한, 문맥에 관련된 정보를 자동으로 추출하여 대화 관리를 위한 대화 전이 네트워크(network)를 생성한다. 따라서, 제안 시스템은 말뭉치의 추가 및 수정만으로 새로운 영역 확장과 관리에 용이한 구조를 갖는다. 실험으로 관찰한 제안된 시스템의 성능은 유사도 계산 만족도 약 77%, 시스템 응답의 적절성 약 84%로 충분히 작업 수행이 가능한 점수를 보여주었다.

  • PDF

The Effects of Clarification Training in Barrier Game on Conversational Breakdowns and Repair Strategies of Children with ASD (장벽게임을 사용한 명료화 중재가 자폐범주성장애 아동의 대화단절 및 발화수정 전략에 미치는 효과)

  • Yoo, Ju-Hyun;Hong, Gyung-Hun
    • The Journal of the Korea Contents Association
    • /
    • v.18 no.6
    • /
    • pp.374-384
    • /
    • 2018
  • This study examined the effects of clarification training on conversational breakdowns and repair strategies of 3 school aged children with ASD. Clarification training provided to the participants during playing the barrier games. The results found that the occurrence of conversational breakdown was decreased in terms of overall and types. The occurrence and appropriateness rates of repair strategies were increased among all participants. Based on the results, 'clarification training' used in this study can be an effective method to train children with ASD for appropriate repair strategies in conversation.

A Design of Dialogue Interface System Based on Statistical Approach (통계에 기반한 다영영 대화형 도우미 시스템의 설계)

  • Jeong, Hyoung-Il;Kim, Dong-Hyun;Jang, Hyo-Jun;Kim, Hark-Soo;Seo, Jung-Yun
    • Annual Conference on Human and Language Technology
    • /
    • 2006.10e
    • /
    • pp.262-267
    • /
    • 2006
  • 대화 인터페이스 시스템(dialogue interface system)은 인간과 컴퓨터의 상호작용을 위한 도구로서 자연언어(natural language)를 사용하여 정보를 공유하거나 특정 업무를 수행하는 프로그램이다. 대화 인터페이스 시스템에 대한 기존의 연구들은 영역 의존적인 스크립트나 계획 추론을 위한 계획 지식을 이용해 왔다. 스크립트 모델(script model)은 제한적인 실용시스템 개발을 위해 주로 연구되었고 계획에 기반한 모델은 대화의 원리를 이해하는 분야에서 주로 연구되어 왔다. 그러나 기존의 모델들은 시스템 확장이 매우 어려우며 예측하지 못한 사용자 발화에 대하여 대응이 어렵기 때문에 매우 제한적인 영역이나 정해진 형태의 대화만을 처리할 수 있다. 본 논문에서는 이런 단점들을 보완하기 위하여 통계에 기반한 다 영역(multi-domain) 대화 모델을 제안한다. 제안된 시스템은 각 작업들에 대하여 해당 작업에 적합한 영역 모델(domain model)을 잘 알려진 프레임 구조를 따르면서 사용자 의도 파악과 시스템 의도 생성에 통계적 방법을 사용한다. 이러한 하이브리드 형태의 구조 덕분에 제안된 시스템은 영역 확장성과 이식성이 뛰어나다는 장점을 가진다.

  • PDF