Evaluation of the Feature Selection function of Latent Semantic Indexing(LSI) Using a kNN Classifier

잠재의미색인(LSI) 기법을 이용한 kNN 분류기의 자질 선정에 관한 연구

  • Park, Boo-Young (Dept. of Library and Information Science, Yonsei University) ;
  • Chung, Young-Mee (Dept. of Library and Information Science, Yonsei University)
  • 박부영 (연세대학교 문헌정보학과) ;
  • 정영미 (연세대학교 문헌정보학과)
  • Published : 2004.08.20

Abstract

텍스트 범주화에 관한 선행연구에서 자주 사용되면서 좋은 성능을 보인 자질 선정 기법은 문헌빈도와 카이제곱 통계량 등이다. 그러나 이들은 단어 자체가 갖고 있는 모호성은 제거하지 못한다는 단점이 있다. 본 연구에서는 kNN 분류기를 이용한 범주화 실험에서 단어간의 상호 관련성이 자동적으로 유도됨으로써 단어 자체 보다는 단어의 개념을 분석하는 잠재의미색인 기법을 자질 선정 방법으로 제안한다.

Keywords