Answer Extraction in Record Sentence using Guinness Record Adverb and Answer-Type

기네스 기록 부사와 정답 유형을 이용한 기록문장에서의 정답 추출

  • 오수현 (충북대학교 컴퓨터공학과) ;
  • 안영민 (충북대학교 컴퓨터공학과) ;
  • 이충희 (한국전자통신 연구원 지식마이닝연구팀) ;
  • 서영훈 (충북대학교 컴퓨터공학과)
  • Published : 2006.06.01

Abstract

본 논문에서는 기네스 기록과 같은 기록정보 즉, 기록적 가치가 있는 문장에 대한 질의가 들어왔을 경우기록 부사와 정답 유형을 이용하여 정답을 추출하는 시스템에 대해 기술한다. 기록정보는 역사적이고 사실적인 내용으로, 기록부사틀 포함하는 문장을 말한다. 기록부사는 기록정보 내에서 쓰이며 어떤 사실의 기록에 대해 뜻을 명확하게 나타내어주는 한 요소이고, 이것은 해당문장이 기록문장임을 나타내준다. 이는 질의-응답 시스템에서 정답 추출의 중요한 단서로 사용될 수 있다. 질의-응답 시스템은 크게 질의를 분석하는 부분과 정답 문서를 찾는 부분으로 나뉘며, 질의 분석을 통하여 기록부사로 지역정보 그리고 정답유형을 결정한 후 이를 이용하여 후보 문서를 검색, 추출하고 정의문 규칙과 개체명 태깅에 의하여 정답을 추출하게 된다.

Keywords