A LF based Answer Indexing Method for Encyclopedia Question-Answering System

백과사전 질의응답을 위한 구문정보기반 정답색인방법

  • 김현진 (한국전자통신연구원 음성/언어정보연구부 지식마이닝연구팀) ;
  • 이충희 (한국전자통신연구원 음성/언어정보연구부 지식마이닝연구팀) ;
  • 오효정 (한국전자통신연구원 음성/언어정보연구부 지식마이닝연구팀) ;
  • 왕지현 (한국전자통신연구원 음성/언어정보연구부 지식마이닝연구팀) ;
  • 장영길 (한국전자통신연구원 음성/언어정보연구부 지식마이닝연구팀)
  • Published : 2005.07.01

Abstract

본 논문은 정답 색인 방법을 이용하여 응답 속도가 빠르고 정확한 백과사전 질의응답 시스템을 구현하는 방법을 제안한다. 논문에서 제안한 정답 색인 방법은 대상 문서에서 160여 개의 정답 유형 범주에 해당하는 정답 후보를 인식하고, 정답 후보와 색인 범주에 속하는 키워드를 색인단위로 정의하여 저장하였다. 특히 용언정보에 대해서는 LF(Logical Form)단위로 색인하여 색인 정확도를 높였다. 정답 랭킹에서는 사용자 질문에서 각 단어별로 문장 성분. 단어 가중치 정보 등을 이용하여, 필수단어를 산정하고 이를 정답랭킹의 방법으로 활용하였다. 이러한 방법론은 용언 정보를 활용해야 효과적인 백과사전이라는 문서 도메인의 특성을 반영하고, 빠른 질문 응답 시간을 보장하는 백과사전 질의응답 시스템에 적합하다.

Keywords