• 제목/요약/키워드: 대화기술

검색결과 848건 처리시간 0.026초

"대화체 이해 시스템에서의 격조사 생략현상에 대한 한 기술적 고찰" ("A Descriptive Review on Korean Case Markers and their Deletion in On-Going Dialogues")

  • 홍민표
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.160-166
    • /
    • 1997
  • 본고는 우리말에서 빈번하게 일어나는 축약 및 생략 현상을 언어학적으로 규명하기 위한 노력의 일환으로,. 이를 위해 실제 대화체에서 나타나는 격조사 생략현상에 대한 관찰결과를 기술적으로 분석하고, 이를 토대로 향후 대화체 이해 시스템 구현을 위한 생략된 격조사 복원연구의 방향을 제시한다. 연구를 위해 녹취한 약 한시간 분량의 2인 흑은 3인의 자연스런 라디오 대담 프로그램 전화대화들을 전사한 자료를 중심으로, 실제 대화에서 실현되거나 생략된 격조사들을 유형별로 분석한 격과를 보고하고, 기존의 연구 및 관찰에 경험적 타당성을 제공함과 동시에 그들의 분석을 대화이해 시스템에 구현하고자 할 때 발생할 수 있는 문제점을 지적한다. 나아가 격조사가 생략된 명사구들이 나타나는 환경을 통사 및 담화적 특성에 따라 분류함으로써, 대화이해 시스템 구현을 목적으로 하는 격조사 생략현상 연구 및 이를 토대로 한 명사구와 용언 사이의 문법적 의미적 관계 규명을 위한 향후 연구에서 어휘 부의 확장 필요성을 논한다.

  • PDF

BM25 기반 고난도 부정 지식 검색을 통한 오픈 도메인 지식 기반 한국어 대화의 지식 검색 모듈 성능 향상 (Improvement of Knowledge Retriever Performance of Open-domain Knowledge-Grounded Korean Dialogue through BM25-based Hard Negative Knowledge Retrieval)

  • 문선아;김산;신사임
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.125-130
    • /
    • 2022
  • 최근 자연어처리 연구로 지식 기반 대화에서 대화 내용에 자유로운 주제와 다양한 지식을 포함하는 연구가 활발히 이루어지고 있다. 지식 기반 대화는 대화 내용이 주어질 때 특정 지식 정보를 포함하여 이어질 응답을 생성한다. 이때 대화에 필요한 지식이 검색 가능하여 선택에 제약이 없는 오픈 도메인(Open-domain) 지식 기반 대화가 가능하도록 한다. 오픈 도메인 지식 기반 대화의 성능 향상을 위해서는 대화에 이어지는 자연스러운 답변을 연속적으로 생성하는 응답 생성 모델의 성능 뿐만 아니라, 내용에 어울리는 응답이 생성될 수 있도록 적합한 지식을 선택하는 지식 검색 모델의 성능 향상도 매우 중요하다. 본 논문에서는 오픈 도메인 지식 기반 한국어 대화에서 지식 검색 성능을 높이기 위해 밀집 벡터 기반 검색 방식과 주제어(Keyword) 기반의 검색 방식을 함께 사용하는 것을 제안하였다. 먼저 밀집 벡터 기반의 검색 모델을 학습하고 학습된 모델로부터 고난도 부정(Hard negative) 지식 후보를 생성하고 주제어 기반 검색 방식으로 고난도 부정 지식 후보를 생성하여 각각 밀집 벡터 기반의 검색 모델을 학습하였다. 성능을 측정하기 위해 전체 지식 중에서 하나의 지식을 검색했을 때 정답 지식인 경우를 계산하였고 고난도 부정 지식 후보로 학습한 주제어 기반 검색 모델의 성능이 6.175%로 가장 높은 것을 확인하였다.

  • PDF

MPEG-4/7 기술과 대화형 방송

  • 김진웅
    • 정보와 통신
    • /
    • 제18권10호
    • /
    • pp.75-87
    • /
    • 2001
  • 방송 서비스는 이제 디지털 시대를 맞이하여 일대 패러다임의 변화를 겪고 있다. 전 세계는 본격적인 디지털 방송 시대를 맞이하고 있으며, 새로운 반송 환경에서는 기존의 서비스와는 비교할 수 없을 정도로 향상된 품질의 오디오비쥬얼 데이터를 제공할 뿐만 아니라, 시청자의 요구에 적절히 대응하는 대화형 멀티미디어 방송 서비스 제공이 가능해 진다. 이러한 방송 분야의 눈부신 발전에는 국제 표준화 기구인 ISO/IEC 산하의 동영상 전문가 그룹인 MPEG의 표준기술 개발이 큰 원동력이 되고 있다. 본 고에서는 대화형 방송의 개념과 기술을 중심으로 현재 진행되고 있는 방송 기술의 변화를 살펴보고, 객체 지반의 데이터 압축, 처리, 전송을 가능하게 하는 MPEG-4 및 내용 기반 검색 및 필터링을 가능하게 하는 MPEG-7 기술의 개념 및 방송 서비스 적용에 대해 검토해보기로 한다.

  • PDF

대화형 TV의 연구개발 동향과 개념 (Interactive TV: Its Concept and R&D Trend)

  • 김형중
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1999년도 하계종합학술대회 논문집
    • /
    • pp.524-529
    • /
    • 1999
  • 디지털 TV가 2000년대의 주력으로 부상할 것임에는 이론의 여지가 없다. 그런데, 디지털 TV가 시장에 진입하기도 전에 대화형 TV 기능을 추가하지 않으면 안될 것으로 보인다. 디지털 TV는 여전히 단방향 방송기술에 의존하지만, 인터넷 기술 발전으로 사용자는 양방향 서비스를 요구할 것이 분명하기 때문이다. 이미 선진 각국은 양방향 TV를 개발하기 위해 다양한 노력을 경주하고 있다. 그런데, 대화형 TV의 개념이 최근 출현했기 때문에 어떤 기술이 어느 방향으로 발전할지 예측하는 것이 사실상 거의 불가능하다. 기존의 TV 기술은 최소한 30년 이상 존속될 표준에 근거해서 개발되었지만, 하루가 다르게 변화하는 인터넷 기술 표준에 바탕을 두고 제품을 개발해야 하는 특성 때문에 기술개발이 더 어렵다고 할 수 있다. 이 논문은 급변하는 방송환경에 적응할 수 있는 대화형 TV의 개념과 모델을 소개한다. 그리고 세계 각국의 개발 동향을 아울러 살펴보기로 한다.

  • PDF

챗봇을 활용한 영화정보 서비스 개발 (The development of cinema information service using chatbot)

  • 김유리
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.365-368
    • /
    • 2018
  • 인공지능 기술이 발달하면서 챗봇 플랫폼이 주목받고 있다. 챗봇이란 규칙 또는 인공지능(AI)을 이용해 사용자와 상호작용을 하는 대화형 인터페이스다. 챗봇에서 대화를 처리하는 방법은 규칙기반 대화 시스템, 검색기능 대화 시스템, 생성기반 대화 시스템이 있다. 본 논문에서는 규칙 기반 대화 시스템을 바탕으로 하는 모바일 영화 챗봇 서비스를 개발하였다. 이를 통하여 사용자는 더 편리하게 영화 관련 정보를 제공받을 수 있다.

게임 도메인 개체명인식과 딥러닝 의도분류를 통한 주제대화 성능향상 기술 (Topic conversation performance improvement technology through game domain entity name recognition and deep learning intention classification)

  • 윤재민;지민성;신동춘;고연정
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제63차 동계학술대회논문집 29권1호
    • /
    • pp.241-242
    • /
    • 2021
  • 대화시스템에서 게임설명요청과 같은 주제대화의 경우, 입력문장의 의도를 정확하게 분류하는 것이 대화시스템 성능과 직결되므로 매우 중요하다. 본 논문에서는 개체명 인식 방법과 머신러닝 방법을 결합한 하이브리드 방법을 제안하여, 머신러닝 방법을 단독으로 사용하는 방법보다 주제대화의 의도 분류 성능을 향상시켰다.

  • PDF

RNN 문장 임베딩과 ELM 알고리즘을 이용한 금융 도메인 고객상담 대화 도메인 및 화행분류 방법 (RNN Sentence Embedding and ELM Algorithm Based Domain and Dialogue Acts Classification for Customer Counseling in Finance Domain)

  • 오교중;박찬용;이동건;임채균;최호진
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.220-224
    • /
    • 2017
  • 최근 은행, 보험회사 등 핀테크 관련 업체에서는 챗봇과 같은 인공지능 대화 시스템을 고객상담 업무에 도입하고 있다. 본 논문에서는 금융 도메인을 위한 고객상담 챗봇을 구현하기 위하여, 자연어 이해 기술 중 하나인 고객상담 대화의 도메인 및 화행분류 방법을 제시한다. 이 기술을 통해 자연어로 이루어지는 상담내용을 이해하고 적합한 응답을 해줄 수 있는 기술을 개발할 수 있다. TF-IDF, LDA, 문장 임베딩 등 대화 문장에 대한 자질을 추출하고, 추출된 자질을 Extreme learning machine(ELM)을 통해 도메인 및 화행 분류 모델을 학습한다.

  • PDF

RNN 문장 임베딩과 ELM 알고리즘을 이용한 금융 도메인 고객상담 대화 도메인 및 화행분류 방법 (RNN Sentence Embedding and ELM Algorithm Based Domain and Dialogue Acts Classification for Customer Counseling in Finance Domain)

  • 오교중;박찬용;이동건;임채균;최호진
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.220-224
    • /
    • 2017
  • 최근 은행, 보험회사 등 핀테크 관련 업체에서는 챗봇과 같은 인공지능 대화 시스템을 고객상담 업무에 도입하고 있다. 본 논문에서는 금융 도메인을 위한 고객상담 챗봇을 구현하기 위하여, 자연어 이해 기술 중 하나인 고객상담 대화의 도메인 및 화행분류 방법을 제시한다. 이 기술을 통해 자연어로 이루어지는 상담내용을 이해하고 적합한 응답을 해줄 수 있는 기술을 개발할 수 있다. TF-IDF, LDA, 문장 임베딩 등 대화 문장에 대한 자질을 추출하고, 추출된 자질을 Extreme learning machine(ELM)을 통해 도메인 및 화행 분류 모델을 학습한다.

  • PDF

한국어-영어 공감대화 데이터셋과 성격을 기반으로 한 언어모델 평가 (Language Model Evaluation Based on Korean-English Empathetic Dialogue Datasets and Personality)

  • 이영준;현종환;이도경;성주원;최호진
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.312-318
    • /
    • 2023
  • 본 연구는 다양한 대규모 언어 모델들의 한국어/영어 공감 대화 생성에서 성능을 실험적으로 비교 분석하는 것과 개인의 성향과 공감 사이에서의 상관 관계를 실험적으로 분석하는 것을 목표로 한다. 이를 위해, 한국어 공감 대화 데이터셋인 KorEmpatheticDialogues 를 구축하였고, personality-aware prompting 방법을 제안한다. 실험을 통해, 총 18개의 언어 모델들 간의 공감 대화 생성 성능을 비교 분석하였고, 개인의 성향에 맞춤형 제공하는 공감이 더 상호작용을 이끌어낼 수 있다는 점을 보여준다. 코드와 데이터셋은 게재가 허용되면 공개할 예정이다.

  • PDF

대화 데이터 증강에 기반한 도메인에 강건한 종단형 목적지향 대화모델 (Domain-robust End-to-end Task-oriented Dialogue Model based on Dialogue Data Augmentation)

  • 이기영;권오욱;김영길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.531-534
    • /
    • 2022
  • 신경망 기반 심층학습 기술은 대화처리 분야에서 대폭적인 성능 개선을 가져왔다. 특히 GPT-2와 같은 대규모 사전학습 언어모델을 백본 네트워크로 하고 특정 도메인 타스크 대화 데이터에 대해서 미세조정 방식으로 생성되는 종단형 대화모델의 경우, 해당 도메인 타스크에 대해서 높은 성능을 내고 있다. 하지만 이런 연구들은 대부분 하나의 도메인에 대해서만 초점을 맞출 뿐 싱글 모델로 두 개 이상의 도메인을 고려하고 있지는 않다. 특히 순차적인 미세 조정은 이전에 학습된 도메인에 대해서는 catastrophic forgetting 문제를 발생시킴으로써 해당 도메인 타스크에 대한 성능 하락이 불가피하다. 본 논문에서는 이러한 문제를 해결하기 위하여 MultiWoz 목적지향 대화 데이터에 오픈 도메인 칫챗 대화턴을 유사도에 기반하여 추가하는 데이터 증강 방식을 통해 사용자 입력 및 문맥에 따라 MultiWoz 목적지향 대화와 오픈 도메인 칫챗 대화를 함께 생성할 수 있도록 하였다. 또한 목적지향 대화와 오픈 도메인 칫챗 대화가 혼합된 대화에서의 시스템 응답 생성 성능을 평가하기 위하여 오픈 도메인 칫챗 대화턴을 수작업으로 추가한 확장된 MultiWoz 평가셋을 구축하였다.

  • PDF