DOI QR코드

DOI QR Code

Query Classification Based on Translation Probabilities of Similar Query Pair

유사한 질의쌍의 어휘 번역확률을 이용한 질의 분류

  • Jin, Xueying (Dept. of Computer Engineering, Chonbuk National University) ;
  • Jang, Kye-Hun (Dept. of Computer Engineering, Chonbuk National University) ;
  • Lee, Kyung-Soon (Dept. of Computer Engineering, Chonbuk National University)
  • 김설영 (전북대학교 컴퓨터공학과) ;
  • 장계훈 (전북대학교 컴퓨터공학과) ;
  • 이경순 (전북대학교 컴퓨터공학과)
  • Published : 2010.04.23

Abstract

질의 분류에서 어휘의 다양한 표현으로 인한 어휘 불일치문제는 성능저하의 주요 원인이다. 본 논문에서는 야후!앤써 질의응답 아카이브를 이용해서 같은 카테고리의 질의-질의쌍들에 대해 어휘-어휘 번역확률을 계산하는 방법을 제안한다. 정보검색에서 우수한 성능을 보인 어휘 사이의 번역확률을 반영하는 번역기반 언어모델이 질의 분류에서 유효함을 확인하였고 언어모델과의 비교실험을 통해 성능향상을 보였다. 어휘관계를 측정하는 방법에서 번역확률 계산방법에 따른 성능측정에서 전체 질의-대답쌍들에 대해 번역확률을 계산하는 것보다 같은 카테고리에 속하는 질의-질의쌍들에 대해 번역확률을 계산하는 것이 분류를 위해 더 좋은 번역확률임을 확인하였다.

Keywords