Proceedings of the Korean Society for Information Management Conference (한국정보관리학회:학술대회논문집)
- 2004.08a
- /
- Pages.163-166
- /
- 2004
Evaluation of the Feature Selection function of Latent Semantic Indexing(LSI) Using a kNN Classifier
잠재의미색인(LSI) 기법을 이용한 kNN 분류기의 자질 선정에 관한 연구
- Park, Boo-Young (Dept. of Library and Information Science, Yonsei University) ;
- Chung, Young-Mee (Dept. of Library and Information Science, Yonsei University)
- Published : 2004.08.20
Abstract
텍스트 범주화에 관한 선행연구에서 자주 사용되면서 좋은 성능을 보인 자질 선정 기법은 문헌빈도와 카이제곱 통계량 등이다. 그러나 이들은 단어 자체가 갖고 있는 모호성은 제거하지 못한다는 단점이 있다. 본 연구에서는 kNN 분류기를 이용한 범주화 실험에서 단어간의 상호 관련성이 자동적으로 유도됨으로써 단어 자체 보다는 단어의 개념을 분석하는 잠재의미색인 기법을 자질 선정 방법으로 제안한다.
Keywords