DOI QR코드

DOI QR Code

Document Classification of Green Technology Literature based on Support Vector Machines

녹색기술문헌 자동 범주화를 위한 문서 분류기 개발

  • 주원균 (한국과학기술정보연구원 R&D시스템개발실) ;
  • 박민우 (한국과학기술정보연구원 R&D시스템개발실) ;
  • 최기석 (한국과학기술정보연구원 R&D시스템개발실)
  • Published : 2012.11.22

Abstract

최근에 이슈화되고 있는 녹색기술문헌의 중요성에 부합하여 녹색기술 문헌을 자동으로 분류해주는 문서 분류시스템 개발하였다. 분류체계로는 14개의 관심 녹색기술 분류 체계를 선택하였고, 다양한 문서 분류 기법 중 SVM(Support Vector Machine)에 기초를 둔 방법을 이용하였다. 문서 벡터를 생성할 때 제목과 본문에 동일한 가중치를 적용하는 방법을 벗어나서 제목의 키워드에 좀 더 높은 가중치를 부여하는 방식을 적용하여 성능평가를 수행하였다.

Keywords