• 제목/요약/키워드: IRQA

검색결과 3건 처리시간 0.02초

REALM을 이용한 한국어 오픈도메인 질의 응답 (REALM for Open-domain Question Answering of Korean)

  • 강동찬;나승훈;최윤수;이혜우;장두성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.192-196
    • /
    • 2020
  • 최근 딥러닝 기술의 발전에 힘입어 오픈 도메인 QA 시스템의 발전은 가속화되고 있다. 특히 IR 시스템(Information Retrieval)과 추출 기반의 기계 독해 모델을 결합한 접근 방식(IRQA)의 경우, 문서와 질문 각각을 연속 벡터로 인코딩하는 IR 시스템(Dense Retrieval)의 연구가 진행되면서 검색 성능이 전통적인 키워드 기반 IR 시스템에 비해 큰 폭으로 상승하였고, 이를 기반으로 오픈 도메인 질의응답의 성능 또한 개선 되었다. 본 논문에서는 경량화 된 BERT 모델을 기반으로 하여 Dense Retrieval 모델 ORQA와 REALM을 사전 학습하고, 한국어 오픈 도메인 QA에서 QA 성능과 검색 성능을 도출한다. 실험 결과, 키워드 기반 IR 시스템 BM25를 기반으로 했던 이전 IRQA 실험결과와 비교하여 더 적은 문서로 더 나은 QA 성능을 보였으며, 검색 결과의 경우, BM25의 성능을 뛰어넘는 결과를 보였다.

  • PDF

한국어 다중추론 질의응답을 위한 Dense Retrieval 사전학습 (Pretraining Dense retrieval for Multi-hop question answering of Korean)

  • 강동찬;나승훈;김태형;최윤수;장두성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.588-591
    • /
    • 2021
  • 다중추론 질의응답 태스크는 하나의 문서만 필요한 기존의 단일추론 질의응답(Single-hop QA)을 넘어서 복잡한 추론을 요구하는 질문에 응답하는 것이 목표이다. IRQA에서는 검색 모델의 역할이 중요한 반면, 주목받고 있는 Dense Retrieval 모델 기반의 다중추론 질의응답 검색 모델은 찾기 어렵다. 본 논문에서는 검색분야에서 좋은 성능 보이고 있는 Dense Retrieval 모델의 다중추론을 위한 사전학습 방법을 제안하고 관련 한국어 데이터 셋에서 이전 방법과의 성능을 비교 측정하여 학습 방법의 유효성을 검증하고 있다. 이를 통해 지식 베이스, 엔터티 링킹, 개체명 인식모듈을 비롯한 다른 서브모듈을 사용하지 않고도 다중추론 Dense Retrieval 모델을 학습시킬 수 있음을 보였다.

  • PDF

AI기반 콜센터 실시간 상담 도우미 시스템 개발 - N은행 콜센터 사례를 중심으로 (Development of AI-based Real Time Agent Advisor System on Call Center - Focused on N Bank Call Center)

  • 류기동;박종필;김영민;이동훈;김우제
    • 한국산학기술학회논문지
    • /
    • 제20권2호
    • /
    • pp.750-762
    • /
    • 2019
  • 기업의 대고객 접점으로써 콜센터의 중요성은 커지고 있다. 하지만, 콜센터는 상담사의 지식 부족과 업무 부적응에 따른 잦은 이직으로 인해 상담사 운영이 어렵고, 이로 인한 고객 서비스 품질 저하의 문제를 안고 있다. 이에 본 연구에서는 상담사에게 업무 지식에 대한 부하를 줄이고 서비스 품질을 향상 시키기 위해 음성 인식 기술과 자연어 처리 및 질의응답을 지원하는 AI 기술과 PBX, CTI 등의 콜센터 정보시스템을 결합하여 실시간으로 상담사에게 고객의 질의 내용에 대한 답변을 제공해주는 "실시간 상담 도우미" 시스템 개발 방안에 대해 N은행 콜센터 사례를 통해 연구하였다. 사례연구 결과, 실시간 통화 분석을 위한 음성인식 시스템의 구성방안과, 질의응답 시스템의 자연어처리 성능 향상을 위한 말뭉치 구축 방안을 확인 할 수 있었으며, 특히 개체명 인식기의 경우 도메인에 맞는 말뭉치 학습 후 정확도가 31% 향상됨을 확인하였다. 또한, 상담 도우미 시스템을 적용한 후 상담 도우미의 답변에 대한 상담사들의 긍정적 피드백 비율이 93.1%로써 충분히 상담사 업무에 도움을 주고 있음을 확인하였다.