Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))
- 2022.10a
- /
- Pages.105-108
- /
- 2022
- /
- 2005-3053(pISSN)
Rertieval-Augmented Generation for Korean Open-domain Question Answering
RAG를 이용한 한국어 오픈 도메인 질의 응답
- Daewook Kang (Jeonbuk National University) ;
- Seung-Hoon Na (Jeonbuk National University) ;
- Tae-Hyeong Kim (KT) ;
- Hwi-Jung Ryu (KT) ;
- Du-Seong Chang (KT)
- Published : 2022.10.18
Abstract
오픈 도메인 질의 응답은 사전학습 언어모델의 파라미터에 저장되는 정보만을 사용하여 답하는 질의 응답 방식과 달리 대량의 문서 등에서 질의에 대한 정답을 찾는 문제이다. 최근 등장한 Dense Retrieval은 BERT 등의 모델을 사용해 질의와 문서들의 벡터 연산으로 질의와 문서간의 유사도를 판별하여 문서를 검색한다. 이러한 Dense Retrieval을 활용하는 방안 중 RAG는 Dense Retrieval을 이용한 외부 지식과 인코더-디코더 모델에 내재된 지식을 결합하여 성능을 향상시킨다. 본 논문에서는 RAG를 한국어 오픈 도메인 질의 응답 데이터에 적용하여 베이스라인에 비해 일부 향상된 성능을 보임을 확인하였다.