DOI QR코드

DOI QR Code

자기구성 지도를 이용한 인터넷 FAQ의 자동응답 및 개념적 브라우징

Automatic Response and Conceptual Browsing of Internet FAQs Using Self-Organizing Maps

  • 안준현 (연세대학교 컴퓨터과학과) ;
  • 류중원 (연세대학교 컴퓨터과학과) ;
  • 조성배 (연세대학교 컴퓨터과학과)
  • 발행 : 2002.10.01

초록

최근 인터넷상의 정보를 가공하여 사용자에게 효율적으로 제공하는 서비스들이 많아지고 있지만, 컴퓨터에 익숙하지 않은 사용자들은 이러한 서비스를 쉽게 이용하지 못하기 때문에 사용자들을 돕는 시스템이 필요하다. 예를 들어, 웹사이트의 경우 전자우편을 통한 사용자들의 질문에 대해 관리자가 직접 답을 해줘야 하는데, 사용자의 증가로 질의응답 업무의 양이 커지고 있다. 본 논문에서는 이를 해결하기 위하여 사용자의 질의를 자동으로 분류하여 응답하고 사용자가 FAQ를 개념적으로 브라우징할 수 있도록 하는 시스템을 제안한다. 이 시스템은 다양한 크기의 질의 메일을 정형화된 크기로 만들기 위한 키워드 클러스터링 자기구성 지도(SOM)와 이를 실제 해당 답변 클래스로 분류하는 전자 우편 분류 SOM의 이단계 구조로 구성되어 사용자의 질의에 해당하는 답변을 자동으로 전송할 수 있으며, 사용자가 이차원상에 표현된 문서 지도를 이용하여 쉽게 전체 자료의 분포를 파악하여 검색할 수 있다. 실제 한 달간 수집한 2,206개의 한메일넷 질의 데이터에 대한 실험 결과, 95%의 분류율을 보여 그 유용성을 볼 수 있었으며, 단계별 검색이 가능하여 사용자가 효율적으로 검색할 수 있음을 확인할 수 있었다.

Though many services offer useful information on internet, computer users are not so familiar with such services that they need an assistant system to use the services easily In the case of web sites, for example, the operators answer the users e-mail questions, but the increasing number of users makes it hard to answer the questions efficiently. In this paper, we propose an assistant system which responds to the users questions automatically and helps them browse the Hanmail Net FAQ (Frequently Asked Question) conceptually. This system uses two-level self-organizing map (SOM): the keyword clustering SOM and document classification SOM. The keyword clustering SOM reduces a variable length question to a normalized vector and the document classification SOM classifies the question into an answer class. Experiments on the 2,206 e-mail question data collected for a month from the Hanmail net show that this system is able to find the correct answers with the recognition rate of 95% and also the browsing based on the map is conceptual and efficient.

키워드

참고문헌

  1. 정영미, 정보검색론, 구미무역출판부, 1993.
  2. D. D. Lewis, "Feature selection and feature extraction for text categorization," Proc. of Speech and Natural Language Workshop, Morgan Kaufmann, San Francisco, pp. 212-217, 1992.
  3. 홍진혁,류중원,조성배, "실세계 FAQ 메일 자동분류를 위한 문서 특징추출 방법의 성능 비교," 한국정보과학회 춘계 학술대회 발표 논문집(B),vol. 28, no. 1, pp.271-273, 2001.
  4. D. D. Lewis and M. Ringuette, "A comparison of two learning algorithms for text categorization," Proc. of ACM Intl. Conf. Research and Development in Information Retrieval, pp. 281-282, 1999.
  5. Y. Yang, "A comparative study on feature selection in text categorization," Proc. of Intl. Conf. Machine Learning, Morgan Kaufmann, San Francisco, 1997.
  6. Y. Yang and X. Liu, "A re-examination of text categorization methods," Proc. ACM Intl. Conf. Research and Development in Information Retrieval, pp. 42-49, 1999.
  7. C. Apte, F. Damerau and S. Weiss, "Automated learning of decision rules for text categorization," ACM Trans. Information Systems, vol. 12, no. 3, pp. 233-251, July 1994. https://doi.org/10.1145/183422.183423
  8. I. Moulinier and J. G. Ganascia, "Applying an existing machine learning algorithm to text categorization," S. Wermter, E. Riloff and G. Scheler (Eds.), Connectionist, Statistics and Symbolic Approaches to Learning for Natural Language Processing, Springer Verlag, Published in the "Lecture Notes for Computer Science" series, no. 1040, pp. 343-354, 1996.
  9. T. Joachims, "Text Categorization with Support Vector Machines: Learning with Many Relevant Features," Technical Report, Univ. of Dortmund, Dept. of Informatics, Dortmund, Germany, 1997.
  10. M. E. Ruiz and P. Srinivasan, "Hierarchical neural networks for text categorization," Proc. of ACM Intl. Conf. Research and Development in Information Retrieval, pp. 81-93, 1994.
  11. http://www.ask.com
  12. http://www.pragmatech.com
  13. T. Kohonen, "The self-organizing map," Procee dings of the IEEE, vol. 78, no. 9, pp. 1464-1480, Sep 1990. https://doi.org/10.1109/5.58325
  14. S. Kaski, T. Honkela, Krista Lagus and T. Kohonen, "Creating an order in digital libraries with self-organizing maps," World Congress on Neural Networks, pp. 814-817, 1996.
  15. K. Lagus and S. Kaski, "Keyword selection method for characterizing text document maps," Proc. of Intl. Conf. on Artificial Neural Networks, vol. 1, pp. 371-376, IEE, London 1999.
  16. T. Kohonen, "Self-organization of very large document collections: State of the art," L. Niklasson, M. Boden and T. Ziernke (Eds.), pp. 343-354, Proc. of Intl. Conf. on Artificial Neural Networks, vol. 1, pp. 65-74. Springer, London, 1998.
  17. G. Salton, Automatic Text Processing: The Transformation, Analysis, and Retrieval of Information by Computer, Addison-Wesley, 1988.
  18. J. C. Scholtes, "Kohonen feature maps in full-text database: A case study of the 1987 Pravda," Proc. of Informatiewetenschap, pp. 203-220, STINFON, Nijmegen, Netherlands, 1991.
  19. J. C. Scholtes, "Unsupervised learning and the information retrieval problem," Proc. of Intl. Joint Conf. on Neural Networks, pp. 95-100, IEEE Service Center, Piscataway, NJ, 1991.
  20. T. Kohonen, "Self-organized formation of topologically correct feature maps," Biol. Cyb., vol. 43, pp. 59-69, 1982. https://doi.org/10.1007/BF00337288
  21. T. Kohonen, Self-Organizing Maps, Springer, Berlin Heidelberg, 1995.
  22. T. Honkela, S. Kaski, K. Lagus, and T. Kohonen, "Exploration of full-text databases with self-organizing maps," Proc. of Intl. Conf. on Neural Networks, vol. 1, pp. 56-61, IEEE Service Center, Piscataway, NJ, 1996.
  23. K. Lagus, T. Honkela, S. Kaski, and T. Kohonen, "WEBSOM for textual data mining," Artificial Intelligence Review, vol. 13, pp. 345-364, 1999. https://doi.org/10.1023/A:1006586221250
  24. S. S. Kaski, T. Honkela, K. Lagus, and T. Kohonen, "WEBSOM: Self-organizing maps of document collections," Neurocomputing, vol. 21, pp. 101-117, 1998. https://doi.org/10.1016/S0925-2312(98)00039-3
  25. H. Ritter and T. Kohonen, "Self-organizing semantic maps," Biol. Cyb., vol. 61, pp. 241-254, 1989. https://doi.org/10.1007/BF00203171
  26. E. Gose, R. Johnsonbaugh and S. Jost, Pattern Recognition and Image Analysis, Prentice Hall PTR, 1996.
  27. L. Wall, T. Christiansen, R. L. Schwartz, and S. Potter, Programming Perl, 2nd Edition, 1996.