Abstract
There have been enormous technological advances in science & technology domain and frequent convergences between its sub-domains. Topic analysis with science & technology corpus is a key process to grasp topic trends and relations between topics. The main objective of this research is to show various analytic approaches with topics extracted from CiteSeer corpus, which is widely used in information technology domain. This paper will also show a case study of Onto-Frame, an R&D support system developed by KISTI, to reveal the role of topics on the system.
과학기술 분야는 매우 빠른 발전 속도를 보이며 세부 분야 간 융 복합 현상이 빈번하게 일어나는 특징을 가지고 있다. 과학기술정보 말뭉치로부터 상기 특성을 분석해 내는 작업은 연구 주제 추이를 분석하고 주제 간 연관 관계를 파악하기 위해 필요하다. 본 연구는 과학기술 분야 - 특히 정보기술(Information Technology) 분야 - 에서 광범위하게 활용되고 있는 Citeseer 말뭉치로부터 추출된 주제를 이용하여 다양한 주제 분석을 수행하는 방안을 보이는 것을 목표로 한다. 특히, 연구개발 전주기 지원 시스템인 OntoFrame에서 주제가 어떠한 역할을 할 수 있는지 사례를 통해 실증하고자 한다.