Hallucination Detection for Generative Large Language Models Exploiting Consistency and Fact Checking Technique

Myeong Jin;Gun-Woo Kim;

doi:10.3745/PKIPS.y2023m11a.461

Proceedings of the Korea Information Processing Society Conference (한국정보처리학회:학술대회논문집)

2023.11a
/
Pages.461-464
/
2023
/
2005-0011(pISSN)
/
2671-7298(eISSN)

Korea Information Processing Society (한국정보처리학회)

DOI QR Code

Hallucination Detection for Generative Large Language Models Exploiting Consistency and Fact Checking Technique

생성형 거대 언어 모델에서 일관성 확인 및 사실 검증을 활 용한 Hallucination 검출 기법

Myeong Jin (Dept. of AI Convergence Engineering, Gyeongsang National University) ;
Gun-Woo Kim (Dept. of Computer Science & Engineering, Gyeongsang National University)

진명 (경상국립대학교 AI 융합공학과) ;
김건우 (경상국립대학교 컴퓨터과학부)

Published : 2023.11.02

https://doi.org/10.3745/PKIPS.y2023m11a.461 Citation PDF

Download PDF

⟨ Previous Next ⟩

Abstract

최근 GPT-3 와 LLaMa 같은 생성형 거대 언어모델을 활용한 서비스가 공개되었고, 실제로 많은 사람들이 사용하고 있다. 해당 모델들은 사용자들의 다양한 질문에 대해 유창한 답변을 한다는 이유로 주목받고 있다. 하지만 LLMs 의 답변에는 종종 Inconsistent content 와 non-factual statement 가 존재하며, 이는 사용자들로 하여금 잘못된 정보의 전파 등의 문제를 야기할 수 있다. 이에 논문에서는 동일한 질문에 대한 LLM 의 답변 샘플과 외부 지식을 활용한 Hallucination Detection 방법을 제안한다. 제안한 방법은 동일한 질문에 대한 LLM 의 답변들을 이용해 일관성 점수(Consistency score)를 계산한다. 거기에 외부 지식을 이용한 사실검증을 통해 사실성 점수(Factuality score)를 계산한다. 계산된 일관성 점수와 사실성 점수를 활용하여 문장 수준의 Hallucination Detection 을 가능하게 했다. 실험에는 GPT-3 를 이용하여 WikiBio dataset 에 있는 인물에 대한 passage 를 생성한 데이터셋을 사용하였으며, 우리는 해당 방법을 통해 문장 수준에서의 Hallucination Detection 성능이 baseline 보다 AUC-PR scores 에서 향상됨을 보였다.

Keywords

Acknowledgement

본 논문은 2023년도 정부(교육부)의 제원으로 한국연구재단의 지원을 받아 수행된 기초연구사업임 (NRF-2021R1G1A1006381)

Proceedings of the Korea Information Processing Society Conference (한국정보처리학회:학술대회논문집)

Hallucination Detection for Generative Large Language Models Exploiting Consistency and Fact Checking Technique

생성형 거대 언어 모델에서 일관성 확인 및 사실 검증을 활 용한 Hallucination 검출 기법

Abstract

Keywords

Acknowledgement

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)