A Fast and Powerful Question-answering System using 2-pass Indexing and Rule-based Query Processing Method

2-패스 색인 기법과 규칙 기반 질의 처리기법을 이용한 고속, 고성능 질의 응답 시스템

  • Published : 2002.12.01

Abstract

We propose a fast and powerful Question-answering (QA) system in Korean, which uses a predictive answer indexer based on 2-pass scoring method. The indexing process is as follows. The predictive answer indexer first extracts all answer candidates in a document. Then, using 2-pass scoring method, it gives scores to the adjacent content words that are closely related with each answer candidate. Next, it stores the weighted content words with each candidate into a database. Using this technique, along with a complementary analysis of questions which is based on lexico-syntactic pattern matching method, the proposed QA system saves response time and enhances the precision.

본 논문은 2-패스 점수 부여 방법에 기초한 정답 후보 색인기를 이용하여 고속, 고정밀의 질의 응답을 실현하는 한국어 질의 응답 시스템을 제안한다. 제안한 정답 후보 색인기의 색인 과정은 다음과 같다. 먼저, 대상 문서에 포함된 모든 정답 후보들을 추출한다. 그리고, 2-패스 점수 부여 방법을 이용하여 각 정답 후보와 밀접하게 연관된 주변 내용어들에게 점수를 부여한다. 마지막으로 데이터베이스에 각 정답과 점수가 부여된 내용어들을 역파일 형태로 저장한다. 사용자의 질의에 포함된 의도(질의 유형)을 파악하기 위해서는 수동으로 구축된 lexico-syntactic 패턴을 이용한다. 이러한 색인 방법과 질의 처리 방법을 이용하여, 제안된 질의 응답 시스템은 빠른 응답 시간을 보장하고 정확률을 향상시킨다.

Keywords

References

  1. Voorhees E. and Tice D. M., 'Building a Question Answering Test Collection', In Proceedings of SIGIR 2000, pp. 200-207, 2000 https://doi.org/10.1145/345508.345577
  2. AAAI Fall Symposium on Question Answering, http://www.aaai.org/Press/Reports/Symposia/Fall /fs-99-02.html
  3. TREC (Text REtrieval Conference) Overview, http://trec.nist.gov/overview.html
  4. Vicedo J. L. and Ferrandex A., 'Importance of Pronominal Anaphora resolution in Question Answering systems', In Proceeding of ACL 2000, pp. 555-562, 2000 https://doi.org/10.3115/1075218.1075288
  5. Moldovan D., Harabagiu S., Pasca M., Mihalcea R., Goodrum R., Girju R. and Rus V., 'LASSO: A Tool for Surfing the Answer Net', In Proceedings of The Eighth Text REtrieval Conference (TREC-8), from http://trec.nist.gov/pubs/trec8/ t8_proceedings.html, 1999
  6. Prager J., Radev D., Brown E. and Coden A., 'The Use of Predictive Annotation for Question Answering in TREC8', In Proceedings of The Eighth Text REtrieval Conference (TREC-8), from http://trec.nist.gov/pubs/trec8/t8_proceedings.html, 1999
  7. Berri, J., Molla D., and Hess M., 'Extraction automatique de reponses: implementations du systeme ExtrAns', In Proceedings of the fifth conference TALN 1998, pp. 10-12, 1998
  8. Harabagiu S., Moldovan D, Pasca M., Mihalcea R., Surdeanu M., Bunescu R., Girju R., Rus V. and Morarescu P., 'FALCON: Boosting Knowledge for Answer Engines', In Proceedings of the Ninth Text REtrieval Conference (TREC-9), from http://trec.nist.gov/pubs/trec9/t9_proceedings.html, 2000
  9. Kupiec J., 'Murax: A Robust Linguistic Approach for Question Answering Using an On-line Encyclopedia', In Proceedings of SIGIR'93, 1993 https://doi.org/10.1145/160688.160717
  10. Prager J., Radev D., Brown E., and Coden A., 'The Use of Predictive Annotation for Question Answering in TREC8', In Proceedings of the Eighth Text REtrieval Conference (TREC-8), http://trec.nist.gov/pubs/trec8/t8_proceedings.html, Gaithersburg, Maryland, 1999
  11. Prager J., Brown E. and Coden A., 'Question-Answering by Predictive Annotation', In Proceedings of SIGIR 2000, pp. 184-191, 2000 https://doi.org/10.1145/345508.345574
  12. Kim H., Kim K., Lee G. G. and Seo J., 'MAYA: A Fast Question-answering System Based On A Predictive Answer Indexer', In Proceedings of the ACL Workshop Open-Domain Question Answering, pp. 9-16, 2001
  13. DiQuest.com, http://www.diquest.com
  14. Fox E. A., Extending the Boolean and Vector Space Models of Information Retrieval with P-norm Queries and Multiple Concept Types, Ph.D. Thesis, CS, Cornell University, 1983
  15. Salton G., Fox E. A. and Wu H., Extended Boolean Information Retrieval, Communication of the ACM, Vol.26, No.12, pp. 1022-1036, 1983 https://doi.org/10.1145/182.358466
  16. Lee, G., Park, M., and Won, H., 'Using syntactic information in handling natural language queries for extended boolean retrieval model', In Proceedings of the 4th international workshop on information retrieval with Asian languages (IRAL99), pp. 63-70, 1999
  17. 이경순, 김재호, 최기선, '질의응답시스템의 성능 평가를 위한 테스트컬렉션 구축', 제12회 한글 및 한국어 정보처리 학술 대회 논문집, pp. 190-197, 2000
  18. Voorhees E. and Tice D. M., 'The TREC-8 Question Answering Track Evaluation', In Proceedings of the Eighth Text REtrieval Conference (TREC-8), from http://trec.nist.gov/ pubs/trec8/t8_proceedings.html, 1999
  19. 이경순, 김재호, 최기선, '한국어 질의응답시스템에서 개체인식에 기반한 대답 추출', 제12회 한글 및 한국어 정보처리 학술대회 논문집, pp. 184-189, 2000