• 제목/요약/키워드: 발화 생성

검색결과 139건 처리시간 0.026초

언어 모델 기반 페르소나 대화 모델 (Personalized Chit-chat Based on Language Models)

  • 장윤나;오동석;임정우;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.491-494
    • /
    • 2020
  • 최근 언어 모델(Language model)의 기술이 발전함에 따라, 자연어처리 분야의 많은 연구들이 좋은 성능을 내고 있다. 정해진 주제 없이 인간과 잡담을 나눌 수 있는 오픈 도메인 대화 시스템(Open-domain dialogue system) 분야에서 역시 이전보다 더 자연스러운 발화를 생성할 수 있게 되었다. 언어 모델의 발전은 응답 선택(Response selection) 분야에서도 모델이 맥락에 알맞은 답변을 선택하도록 하는 데 기여를 했다. 하지만, 대화 모델이 답변을 생성할 때 일관성 없는 답변을 만들거나, 구체적이지 않고 일반적인 답변만을 하는 문제가 대두되었다. 이를 해결하기 위하여 화자의 개인화된 정보에 기반한 대화인 페르소나(Persona) 대화 데이터 및 태스크가 연구되고 있다. 페르소나 대화 태스크에서는 화자마다 주어진 페르소나가 있고, 대화를 할 때 주어진 페르소나와 일관성이 있는 답변을 선택하거나 생성해야 한다. 이에 우리는 대용량의 코퍼스(Corpus)에 사전 학습(Pre-trained) 된 언어 모델을 활용하여 더 적절한 답변을 선택하는 페르소나 대화 시스템에 대하여 논의한다. 언어 모델 중 자기 회귀(Auto-regressive) 방식으로 모델링을 하는 GPT-2, DialoGPT와 오토인코더(Auto-encoder)를 이용한 BERT, 두 모델이 결합되어 있는 구조인 BART가 실험에 활용되었다. 이와 같이 본 논문에서는 여러 종류의 언어 모델을 페르소나 대화 태스크에 대해 비교 실험을 진행했고, 그 결과 Hits@1 점수에서 BERT가 가장 우수한 성능을 보이는 것을 확인할 수 있었다.

  • PDF

대화체 문장 번역을 위한 토큰기반 변환중심 한일 기계번역 (A Token Based Transfer Driven Koran -Japanese Machine Translation for Translating the Spoken Sentences)

  • 양승원
    • 한국산업정보학회논문지
    • /
    • 제4권4호
    • /
    • pp.40-46
    • /
    • 1999
  • 본 논문에서는 음성언어 자동 통역시스템의 일부 모듈로 구현한 한일 기계번역 시스템을 소개하였다. 이 번역시스템은 예제중심 기계번역(EBMT)에 기초를 둔 변환중심 기계번역(TDMT) 방법을 기반으로 구현하였다. 본 시스템에서는 토큰(TOKEN)이라는 새로운 번역단위를 정의하여 사용하였다. 토큰단위의 번역방법을 사용함으로써 한국어 문장의 매우 비 정형적인 점을 해결하고 번역의 질을 높일 수 있다. 본 시스템의 구문분석 단계에서는 대역어를 선정하기에 적합한 정도까지의 의존트리를 생성하는 간이파싱만을 함으로써 필요없는 노력을 경감시켰다. 대역어 사전은 한국전자통신 연구원이 수집한 음성 데이터베이스로부터 추출한 말뭉치를 사용해 구성하였다. 구현한 시스템은 여행 계획영역에서 수집된 600 발화 안의 문장을 대상으로 시험하였는데 제한된 환경에서 87%, 아무런 제약이 없는 환경에서는 71%의 성공률을 보였다.

  • PDF

그레마스 기호학적 접근을 통한 애니메이선 캐릭터 분석 -장편 애니메이션 "슈렉" 을 중심으로- (A Study of 'Greimas' Semiological Approach in Animation Character)

  • 임운주
    • 한국콘텐츠학회논문지
    • /
    • 제9권5호
    • /
    • pp.99-106
    • /
    • 2009
  • 본 연구는 애니메이션 작품 <슈렉>의 캐릭터를 그레마스 기호학적 이론을 바탕으로 분석하였다. 애니메이션은 하나의 내러티브 속에서 나타나는 캐릭터간의 행위들로 이루어진다. 이러한 캐릭터의 행위들은 캐릭터 가치체계와 의미를 나타낸다. 겉으로 드러나지 않은 잠재적 가치가 발화되는 과정에서 서열적인 가치체계가 생성되고, 캐릭터의 사고 및 행동이 다른 캐릭터들과 다양한 관계의 망을 형성함으로써 의미를 확장해 나간다. 이러한 관점에서 캐릭터의 행위 구조에서 나타난 캐릭터의 체계와 의미를 그레마스 행위소 모델과, 기호학적 4각형 모델을 통해 애니메이션 캐릭터에서 나타난 체계적 특징들과 상호관계의 망 속에서 나타난 의미구조를 분석하고자 하였다.

레이블 전파를 통한 감정사전 제작 (Developing a Korean sentiment lexicon through label propagation)

  • 박호민;천민아;남궁영;최민석;윤호;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.91-94
    • /
    • 2018
  • 감정분석은 텍스트에서 나타난 저자 혹은 발화자의 태도, 의견 등과 같은 주관적인 정보를 추출하는 기술이며, 여론 분석, 시장 동향 분석 등 다양한 분야에 두루 사용된다. 감정분석 방법은 사전 기반 방법, 기계학습 기반 방법 등이 있다. 본 논문은 사전 기반 감정분석에 필요한 한국어 감정사전 자동 구축 방법을 제안한다. 본 논문은 영어 감정사전으로부터 한국어 감정사전을 자동으로 구축하는 방법이며, 크게 세 단계로 구성된다. 첫 번째는 영한 병렬말뭉치를 이용한 영한사전을 구축하는 단계이고, 두 번째는 영한사전을 통한 이중언어 그래프를 생성하는 단계이며, 세 번째는 영어 단어의 감정값을 한국어 단어의 감정값으로 전파하는 단계이다. 본 논문에서는 제안된 방법의 유효성을 보이기 위해 사전 기반 한국어 감정분석 시스템을 구축하여 평가하였으며, 그 결과 제안된 방법이 합리적인 방법임을 확인할 수 있었으며 향후 연구를 통해 개선한다면 질 좋은 한국어 감정사전을 효과적인 방법으로 구축할 수 있을 것이다.

  • PDF

통계에 기반한 다영영 대화형 도우미 시스템의 설계 (A Design of Dialogue Interface System Based on Statistical Approach)

  • 정형일;김동현;장효준;김학수;서정연
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2006년도 제18회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.262-267
    • /
    • 2006
  • 대화 인터페이스 시스템(dialogue interface system)은 인간과 컴퓨터의 상호작용을 위한 도구로서 자연언어(natural language)를 사용하여 정보를 공유하거나 특정 업무를 수행하는 프로그램이다. 대화 인터페이스 시스템에 대한 기존의 연구들은 영역 의존적인 스크립트나 계획 추론을 위한 계획 지식을 이용해 왔다. 스크립트 모델(script model)은 제한적인 실용시스템 개발을 위해 주로 연구되었고 계획에 기반한 모델은 대화의 원리를 이해하는 분야에서 주로 연구되어 왔다. 그러나 기존의 모델들은 시스템 확장이 매우 어려우며 예측하지 못한 사용자 발화에 대하여 대응이 어렵기 때문에 매우 제한적인 영역이나 정해진 형태의 대화만을 처리할 수 있다. 본 논문에서는 이런 단점들을 보완하기 위하여 통계에 기반한 다 영역(multi-domain) 대화 모델을 제안한다. 제안된 시스템은 각 작업들에 대하여 해당 작업에 적합한 영역 모델(domain model)을 잘 알려진 프레임 구조를 따르면서 사용자 의도 파악과 시스템 의도 생성에 통계적 방법을 사용한다. 이러한 하이브리드 형태의 구조 덕분에 제안된 시스템은 영역 확장성과 이식성이 뛰어나다는 장점을 가진다.

  • PDF

Bernard Tschumi의 초기 작품을 중심으로 본 움직임 연구 (A Study on the Movement focused on Bernard Tschumi's Early Works)

  • 서정연
    • 한국실내디자인학회논문집
    • /
    • 제18권1호
    • /
    • pp.27-34
    • /
    • 2009
  • Architect Bernard Tschumi had explored a new architectural conception through his own notional devices such as space, event and movement during 1970s. But, among these notions, the concept of movement was ambiguous and difficult to adopt it for architectural design strategy. Because the movements in everyday's behaviour or in dancing art are significantly different from architectural thought. However he had succeeded in coining the creative notion of movement as almost real body's and of living flesh. He invented an acute methodology and bold interpretation for his early experimental works. So, this paper tried to understand and analyse his concept of movement focused on his early works. The results of this paper's discussion are as follows; First, Tschumi's movement concept Is dynamic one operated by desire and can violate space in physical level as well as metaphysical level. Next, the movement performs the role of generator which deforms space or even generate it. Third, his movement can be readable only when you go down and bring it in practice. Also it Is unblocked potentiality, undetermined sequential material and unfinished practice. Fourth, when Tschumi's movement could be thought as walking, this walking movement makes up a story through rhetorical speech acts that are presented by turns and detours.

효과적인 인간-로봇 상호작용을 위한 딥러닝 기반 로봇 비전 자연어 설명문 생성 및 발화 기술 (Robot Vision to Audio Description Based on Deep Learning for Effective Human-Robot Interaction)

  • 박동건;강경민;배진우;한지형
    • 로봇학회논문지
    • /
    • 제14권1호
    • /
    • pp.22-30
    • /
    • 2019
  • For effective human-robot interaction, robots need to understand the current situation context well, but also the robots need to transfer its understanding to the human participant in efficient way. The most convenient way to deliver robot's understanding to the human participant is that the robot expresses its understanding using voice and natural language. Recently, the artificial intelligence for video understanding and natural language process has been developed very rapidly especially based on deep learning. Thus, this paper proposes robot vision to audio description method using deep learning. The applied deep learning model is a pipeline of two deep learning models for generating natural language sentence from robot vision and generating voice from the generated natural language sentence. Also, we conduct the real robot experiment to show the effectiveness of our method in human-robot interaction.

이미지-텍스트 자질을 이용한 행동 포착 비디오 기반 대화시스템 (Audio-Visual Scene Aware Dialogue System Utilizing Action From Vision and Language Features)

  • 임정우;장윤나;손준영;이승윤;박기남;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.253-257
    • /
    • 2023
  • 최근 다양한 대화 시스템이 스마트폰 어시스턴트, 자동 차 내비게이션, 음성 제어 스피커, 인간 중심 로봇 등의 실세계 인간-기계 인터페이스에 적용되고 있다. 하지만 대부분의 대화 시스템은 텍스트 기반으로 작동해 다중 모달리티 입력을 처리할 수 없다. 이 문제를 해결하기 위해서는 비디오와 같은 다중 모달리티 장면 인식을 통합한 대화 시스템이 필요하다. 기존의 비디오 기반 대화 시스템은 주로 시각, 이미지, 오디오 등의 다양한 자질을 합성하거나 사전 학습을 통해 이미지와 텍스트를 잘 정렬하는 데에만 집중하여 중요한 행동 단서와 소리 단서를 놓치고 있다는 한계가 존재한다. 본 논문은 이미지-텍스트 정렬의 사전학습 임베딩과 행동 단서, 소리 단서를 활용해 비디오 기반 대화 시스템을 개선한다. 제안한 모델은 텍스트와 이미지, 그리고 오디오 임베딩을 인코딩하고, 이를 바탕으로 관련 프레임과 행동 단서를 추출하여 발화를 생성하는 과정을 거친다. AVSD 데이터셋에서의 실험 결과, 제안한 모델이 기존의 모델보다 높은 성능을 보였으며, 대표적인 이미지-텍스트 자질들을 비디오 기반 대화시스템에서 비교 분석하였다.

  • PDF

챗봇의 효과적 정서적 지지를 위한 한국어 대화 감정 강도 예측 모델 개발 (On the Predictive Model for Emotion Intensity Improving the Efficacy of Emotionally Supportive Chat)

  • 정세림;노유진;오은석;김아연;홍혜진;이지항
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.656-659
    • /
    • 2023
  • 정서적 지원 대화를 위한 챗봇 개발 시, 사용자의 챗봇에 대한 사용성 및 대화 적절성을 높이기 위해서는 사용자 감정에 적합한 지원 콘텐츠를 제공하는 것이 중요하다. 이를 위해, 본 논문은 사용자 입력 텍스트의 감정 강도 예측 모델을 제안하고, 사용자 발화 맞춤형 정서적 지원 대화에 적용하고자 한다. 먼저 입력된 한국어 문장에서 키워드를 추출한 뒤, 이를 각성도 (arousal)과 긍정부 정도(valence) 공간에 투영하여 키워드가 내포하는 각성도-긍정부정도에 가장 근접한 감정을 예측하였다. 뿐만 아니라, 입력된 전체 문장에 대한 감정 강도를 추가로 예측하여, 핵심 감정 강도 - 문맥상 감정강도를 모두 추출하였다. 이러한 통섭적 감정 강도 지수들은 사용자 감정에 따른 최적 지원 전략 선택 및 최적 대화 콘텐츠 생성에 공헌할 것으로 기대한다.

퍼지제어 셀을 이용한 퍼지논리제어기의 조직적인 설계방법 (Systematic Design Method of Fuzzy Logic Controllers by Using Fuzzy Control Cell)

  • 남세규;김종식;유완석
    • 대한기계학회논문집
    • /
    • 제16권7호
    • /
    • pp.1234-1243
    • /
    • 1992
  • 본 연구에서는 국부적인 퍼지제어 셀(fuzzy control cell:cell)을 도입하여 계산량 감소를 달성하고, 추론과정을 선형근사화한 조직적인 설계를 통하여 선형제어 이론을 FLC의 실용적인 면에 접목하고자 한다. 이를 위하여, 확률밀도함수 형태의 멤버쉽함수(membership function)와 선형화된 제어공간이 얻어지도록 전반적인 제어방 책을 결정한 다음, 주어진 상태에 가장 지배적(dominant)인 규칙을 갖는 몇 개의 대표 점을 찾아서 그 점들로 구성된 퍼지제어 셀을 생성하고, 퍼지연산을 생성된 셀에서만 수행하여 알고리즘과 계산을 단순화시킨다. 평가기준을 공평함에 두어서 조건부연결 어 'AND'에 T-norm인 대수곱을 적용하여 적합도를 취하고, 규칙들의 작용이 병렬발화 라는 관점으로 규칙연결어 'ALSO'는 'AND'의 공액인 'OR'에 해당되는 대수합연산 대신 에 확률측도와 유사한 산술평균을 적용하여 퍼지추론을 한다. 그리고, 각각의 제어 규칙에 대하여 퍼지추론한 결과와 그것의 평균중심을 곱하여 통합한 후, 무게중심법으 로 역퍼지화하여 일반화된 제어값을 얻는다. 이 값을 PID제어기를 이용하여 구현한 디지틀 보상기를 통과시켜 시스템에 한 제어를 얻는 조직적인 방법을 제안한다.