DOI QR코드

DOI QR Code

Concept-based Question Analysis for Accurate Answer Extraction

정확한 해답 추출을 위한 개념 기반의 질의 분석

  • 신승은 (충북대학교 BK2l 충북정보기술사업단) ;
  • 강유환 (충북대학교 전기전자컴퓨터공학부) ;
  • 안영민 (충북대학교 전기전자컴퓨터공학부) ;
  • 박희근 (충북대학교 전기전자컴퓨터공학부) ;
  • 서영훈 (충북대학교 전기전자컴퓨터공학부)
  • Published : 2007.01.28

Abstract

This paper describes a concept-based question analysis to analyze concept which is more important than keyword for the accurate answer extraction. Our idea is that we can extract correct answers from various paragraphs with different structures when we use well-defined concepts because concepts occurred in questions of same answer type are similar. That is, we will analyze the syntactic and semantic role of each word or phrase in a question in order to extract more relevant documents and more accurate answer in them. For each answer type, we define a concept frame which is composed of concepts commonly occurred in that type of questions and analyze user's question by filling a concept frame with a word or phrase. Empirical results show that our concept-based question analysis can extract more accurate answer than any other conventional approach. Also, concept-based approach has additional merits that it is language universal model, and can be combined with arbitrary conventional approaches.

본 논문에서는 정확한 해답 추출을 위해 키워드보다 중요한 역할을 하는 개념을 분석하는 개념 기반 질의 분석에 대해 기술한다 해답 유형이 같은 질의들에서 나타나는 개념은 유사하기 때문에 이러한 개념들을 잘 정의하여 이용할 경우, 해답을 포함하는 다양한 형태의 구문으로부터 보다 정확한 해답을 추출할 수 있다는 것이 본 논문의 주요 아이디어이다. 즉, 해답을 포함하는 문서와 그 문서 내에 있는 해답을 좀더 정확하게 추출하기 위해 질문에 있는 각 단어나 구절들의 구문 및 의미 역할을 파악하고자 하는 것이다. 이를 위해, 정답 유형별로 그 유형의 질문에서 공통으로 나타나는 주요 개념들로 구성된 개념 프레임을 정의하고, 사용자 질의를 분석하여 개념 프레임을 채우는 과정으로 질의 분석을 수행한다. 실험 결과 본 논문에서 제안한 개념 기반 방식이 기존의 질의분석 기법에 비해 높은 정답 추출 성능을 보여주었다. 본 논문에서 제안한 개념 기반 접근 방법은 언어에 관계없이 적용 가능한 모델이며, 또한 기존 방식과 함께 사용할 수 있는 장점도 있다.

Keywords

References

  1. 장명길,김현진,장문수,최재훈,오효정,이충희,허정,"의미기반 정보검색" 정보과학회지,제 19권, 제 10호,pp.7-18, 2001.
  2. E. M. Voorhees and H T. Dang,"Overview of the TREC 2005 Question Answering Track," In Proceedings of the TREC 2005, 2005.
  3. 황이규,김현진,장명길,"질의응답 기술 개발" 정보처리학회지,제 11권,제2호,pp.48-56, 2004.
  4. D. Moldovan, S. Harabargiu, M Pasca, R. Mihalcea,R. Goodrun,R. Girju,and V. Rus, ''LASSO: A Tool for Surfing the Answer Net," In the 8th Text REtrieval conference (TREC-8), 1999.
  5. J. Prager, D. Radev, E. Brown, and A Coden,"The Use of Predictive Annotation for Question Answering in TREC8," In the 8th Text REtrieval Conference (TREC-8), 1999.
  6. J. Kupiec, "MURAX A Robust Linguistic Approach For Question Answering Using An On-Line Encyclopedia," In Proceedings 16'th ACM SIGIR International conference on Research and Development in Information Retrieval, pp.181-190, 1993.
  7. A Ittycheriah, M Franz, W. J. Zhu, and A. Ratnaparkhi, "Question Answering Using Maximum Entropy Components," In Proceeding of NAACL, 2001.
  8. G. S. Marrn, "A Statistical Method for Short Answer Extraction," In Proceedings of the ACL Workshop Open-Domain Question Answering, pp.13-30, 2001.
  9. 김학수,안영훈,서정연,"한국어 질의응답시스템을 위한 지지벡터기계 기반의 질의유형분류기" 정보과학회 논문지,제30권,제5호,pp.466-475, 2003.
  10. E. Voorhees, "Query Expansion using Lexical Semantic Relation," In Proceedings of the 17th ACM-SIGIR Conference, pp.61-69, 1994.
  11. B. V. Dobrow, N. V. Loukachevitch,and T. N. Yudina, "Conceptual Indexing Using thematic Representation of Texts" TREC-6, 1997.
  12. 강승식, "한글 문서의 색언어와 색인 기법" 정보과학회지,제 22권, 제4호, pp.72-71, 2004.
  13. E. M. Voorhees and H. T. Dang, "Overview of the TREC 2005 Question Answering Track," TREC 2005, 2005.