• 제목/요약/키워드: 멀티턴 대화

검색결과 6건 처리시간 0.021초

DBERT: 멀티턴 문맥의 특징을 고려한 대조 학습 기반의 임베딩 모델링 (DBERT: Embedding Model Based on Contrastive Learning Considering the Characteristics of Multi-turn Context )

  • 박상민;이재윤;김재은
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.272-274
    • /
    • 2022
  • 최근에는 사람과 기계가 자유롭게 대화를 주고받을 수 있는 자유 주제 대화 시스템(Open-domain Dialogue System)이 다양한 서비스에 활용되고 있다. 자유 주제 대화 시스템이 더욱 다양한 답변을 제공할 수 있도록 사전학습 기반의 생성 언어모델이 활용되고 있지만, 답변 제공의 안정성이 떨어져 검색을 활용한 방법 또한 함께 활용되고 있다. 검색 기반 방법은 사용자의 대화가 들어오면 사전에 구축된 데이터베이스에서 유사한 대화를 검색하고 준비되어있는 답변을 제공하는 기술이다. 하지만 멀티턴으로 이루어진 대화는 일반적인 문서의 문장과 다르게 각 문장에 대한 발화의 주체가 변경되기 때문에 연속된 발화 문장이 문맥적으로 밀접하게 연결되지 않는 경우가 있다. 본 논문에서는 이와 같은 대화의 특징을 고려하여 멀티턴 대화를 효율적으로 임베딩 할 수 있는 DBERT(DialogueBERT) 모델을 제안한다. 기존 공개된 사전학습 언어모델 기반의 문장 임베딩 모델과 비교 평가 실험을 통해 제안하는 방법의 우수성을 입증한다.

  • PDF

멀티턴 대화를 활용한 레퍼런스 기반의 발화 생성 모델 (Reference-based Utterance Generation Model using Multi-turn Dialogue)

  • 박상민;손유리;금빛나;김홍진;김학수;김재은
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.88-91
    • /
    • 2022
  • 디지털 휴먼, 민원 상담, ARS 등 칫챗의 활용과 수요가 증가함에 따라 칫챗의 성능 향상을 위한 다양한 연구가 진행되고 있다. 특히, 오토 인코더(Auto-encoder) 기반의 생성 모델(Generative Model)은 높은 성능을 보이며 지속적인 연구가 이루어지고 있으나, 이전 대화들에 대한 충분한 문맥 정보의 반영이 어렵고 문법적으로 부적절한 답변을 생성하는 문제가 있다. 이를 개선하기 위해 검색 기반의 생성 모델과 관련된 연구가 진행되고 있으나, 현재 시점의 문장이 유사해도 이전 문장들에 따라 의도와 답변이 달라지는 멀티턴 대화 특징을 반영하여 대화를 검색하는 연구가 부족하다. 본 논문에서는 이와 같은 멀티턴 대화의 특징이 고려된 검색 방법을 제안하고 검색된 레퍼런스(준정답 문장)를 멀티턴 대화와 함께 생성 모델의 입력으로 활용하여 학습시키는 방안을 제안한다. 제안 방안으로 학습된 발화 생성 모델은 기존 모델과 비교 평가를 수행하며 Rouge-1 스코어에서 13.11점, Rouge-2 스코어에서 10.09점 Rouge-L 스코어에서 13.2점 향상된 성능을 보였고 이를 통해 제안 방안의 우수성을 입증하였다.

  • PDF

멀티턴 대화에서 윤리적인 발화 생성을 위한 새로운 데이터 세트 (A New Dataset for Ethical Dialogue Generation in Multi-Turn Conversations)

  • 장빈;김서현;박규병
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.446-448
    • /
    • 2022
  • 별개의 분류 모델을 이용하여 비윤리 발화를 억제하려 했던 과거의 시도들과는 달리, 본 연구에서는 데이터 추가를 통한 발화 생성 단계에서의 윤리성 체화에 대해 실험하였다. 본 연구에서는 분류 모델로는 감지하기 어려운 멀티턴 비윤리 공격으로 이루어진 새로운 대화 데이터 세트를 소개하고, 해당 데이터 세트를 통해 개선된 챗봇 대화 모델의 방어 성능을 공개한다.

생성 모델과 검색 모델을 이용한 한국어 멀티턴 응답 생성 연구 (A study on Korean multi-turn response generation using generative and retrieval model)

  • 이호동;이종민;서재형;장윤나;임희석
    • 한국융합학회논문지
    • /
    • 제13권1호
    • /
    • pp.13-21
    • /
    • 2022
  • 최근 딥러닝 기반의 자연어처리 연구는 사전 훈련된 언어 모델을 통해 대부분의 자연어처리 분야에서 우수한 성능을 보인다. 특히 오토인코더 (auto-encoder) 기반의 언어 모델은 다양한 한국어 이해 분야에서 뛰어난 성능과 쓰임을 증명하고 있다. 그러나 여전히 디코더 (decoder) 기반의 한국어 생성 모델은 간단한 문장 생성 과제에도 어려움을 겪고 있으며, 생성 모델이 가장 일반적으로 쓰이는 대화 분야에서의 세부 연구와 학습 가능한 데이터가 부족한 상황이다. 따라서 본 논문은 한국어 생성 모델을 위한 멀티턴 대화 데이터를 구축하고 전이 학습을 통해 생성 모델의 대화 능력을 개선하여 성능을 비교 분석한다. 또한, 검색 모델을 통해 외부 지식 정보에서 추천 응답 후보군을 추출하여 모델의 부족한 대화 생성 능력을 보완하는 방법을 제안한다.

대화 요약 생성을 위한 한국어 방송 대본 데이터셋 (KMSS: Korean Media Script Dataset for Dialogue Summarization )

  • 김봉수;전혜진;전현규;정혜인;장정훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.198-204
    • /
    • 2022
  • 대화 요약은 다중 발화자와 발화문으로 이루어진 멀티턴 형식의 문서에 대해 핵심내용을 추출하거나 생성하는 태스크이다. 대화 요약 모델은 추천, 대화 시스템 등에 콘텐츠, 서비스 기록에 대한 분석을 제공하는 데 유용하다. 하지만 모델 구축에 필요한 한국어 대화 요약 데이터셋에 대한 연구는 부족한 실정이다. 본 논문에서는 생성 기반 대화 요약을 위한 데이터셋을 제안한다. 이를 위해 국내 방송사의 대용량 콘텐츠로 부터 원천 데이터를 수집하고, 주석자가 수작업으로 레이블링 하였다. 구축된 데이터셋 규모는 6개 카테고리에 대해 약 100K이며, 요약문은 단문장, 세문장, 2할문장으로 구분되어 레이블링 되었다. 또한 본 논문에서는 데이터의 특성을 내재화하고 통제할 수 있도록 대화 요약 레이블링 가이드를 제안한다. 이를 기준으로 모델 적합성 검증에 사용될 디코딩 모델 구조를 선정한다. 실험을 통해 구축된 데이터의 몇가지 특성을 조명하고, 후속 연구를 위한 벤치마크 성능을 제시한다. 데이터와 모델은 aihub.or.kr에 배포 되었다.

  • PDF

대화형 TV 서비스 기술 및 전망

  • 강정훈
    • 정보와 통신
    • /
    • 제11권10호
    • /
    • pp.120-138
    • /
    • 1994
  • 최근에 정보 고속도로 사업계획과 관련하여 세계 여러나라들이 실시하거나 실시 예정인 VOD 시험서비스에 많은 관심이 일고 있다. VOD서비스와 같은 대화형 TV 서비스(I-TV, Interactive-TV Service)는 컴퓨터, 통신 가전업체 그리고 영화 제작사등이 함께 참여하고 있다. 본 기고에서는 차세대 통합 멀티미디어 사업이라는 대화형 TV서비스의 개요와 요소기술, 그리고 서비스의 동향 및 전망을 알아보기로 한다. 1. 대화형 TV 서비스(Interactive TV Service)의 개요 현재까지 대부분의 TV 시청자들은 방송국으로부터 송신되는 공중파나 CATV서비스를 통해 프로그램 서비스를 받아보는 방송(broadcasting)방식 형태의 서비스를 이용해 왔다. 그러나 이러한 일방적인 수신방식은 최근 미국의 클린턴 행정부가 미국의 차세대 기반 통신망 구축 정책(정보 고속도로 사업; Information Super High-way)의 일환으로, CATV 사업자뿐만 아니라 지역 전화회사까지도 참여하고 있는 VOD(Video On Demand) 시험서비스가 시행됨에 따라서 미국은 물론, 우리나라를 비롯한 여러나라에서 대화형식의 TV서비스를 시행하려는 움직임이 일어나고 있다. 이러한 움직임은 지난 ‘92년 7월 16일 미 연방통신위원회(FCC. Federal Communication Committee)가 그동안 전화회사에 대해 CATV 시업진출을 금지하였던 정책을 바꿔서, CATV에 대항한 경쟁도입과 기반 정보통신망 정비를 목표로 하여 비디오 다이얼톤(VDT(주), Video Dial Tone)이라는 이름하에 공중통신 사업자에게도 영상신호를 전송을 인가함에 따라 시작되었다. VOD서비스와 같은 대화형 TV서비스는 가입자가 원하는 서비스를 시간에 관계없이 댁내의 통신회선(일반전화망, 케이블망, 광화이버망, 위성망)을 통해서 요구 즉시 실시간에 서비스를 받아볼 수 있는 멀키미디어의 통합서비스 방식이다. 도한 이 서비스는 음성통신과 방송의 통합형 서비스로서, 방송국, 전화회사 혹은 서비스 제공업자(ISP ; Information Service Provider)에 의해 제공된 디지탈 영상 및 일반 데이터 등을 압축하여 서버에 저장한 후, 소비자의 요청이 있을 경우에 통신회선을 통해 즉시 서비스 해준다. 이와 같은 대화형 TV 서비스의 구성요소로는 다양한 영상정보 및 데이타를 보유하고 있는 정보제공자, 전화선이나 CATV 또는 위성방송과 연결해 주는 지역별 비디오 서버 및 교환장치, 통신회선을 통해 전송된 서비스를 영상정보로 만들어주고 또한 가입자의 요구를 즉시 정보제공자에게 알려줄 수 있는 가정용 단말기 (STB. Set Top Box)로 이루어진다. 여기서, 비디오 서버는 다양한 대화형 TV 서비스를 제공해 주는 중계자로서, 영화, 홈쇼핑, 홈뱅킹, 대화형 교육, 비디오 게임 등을 가정에서도 가능하게 해 줄 뿐 아니라, 가입자를 관리하는 기능을 가지고 있어서 가입자 정보는 물론, 각종 서비스 사용료, 개인 통계자료 분석 등도 집계할 수 있는 기능을 가지고 있다.(그림1) 본 기고에서는 이러한 대화형 TV서비스 중에 대표적 응용서비스인 VOD 서비스에 사용되는 기술요소와 각국에서 진행되고 있는 VOD 서비스 동향 및 전망에 대해 알아보고자 한다. (주) VDT(Video Dial Tone) : FCC가 ‘92년 7월 16일에 인가한 지역 전화회사에 의한 가정용 영상 전송서비스 및 CATV에 대항한 경쟁도입과 Infrastructure의 정비를 목표로 하여 결정한 내용은 다음과 같다. 지역 전화회사에 대하여 (1) 공중통신사업자에 대하여 서비스 제공자에 대한 영상신호의 전송을 인가(기본서비스), (2) Video Gateway 서비스, 비디오 기기 제공, 서비스 제공사업자에 대한 과금, 요금징수 대행을 인가(고도서비스), (3) 프로그램 제공자에 대하여 자본출자율을 5%로 높이는 외에 (종래는 1%) 업무 관계의 확대(합병회사 설립 및 consultant 계약 등)를 인가. (4) Rural 지역(영업지역의회의 지방)에 대한 직접 프로그램 제공의 특별인가(주민이 1만세데 미만의 지방 공공 단체만 가능, 영업지역내에서는 제한없음), (5) 지방공공 사업체에 의한 영업면허의 불요(지역 전화회사가 직접 사용자에 서비스를 제공하지 않기 때문에 CATV 서비스로는 보지 않기 때문). (6)의 회로의 권고(케이블 정책법으로 결정되어 있는 통신사업자와 CATV회사 자본의 상호보유 금지의 해제) 등이다.

  • PDF