DOI QR코드

DOI QR Code

Development of the KnowledgeMatrix as an Informetric Analysis System

계량정보분석시스템으로서의 KnowledgeMatrix 개발

  • 이방래 (한국과학기술정보연구원 정보분석센터) ;
  • 여운동 (한국과학기술정보연구원 정보분석센터) ;
  • 이준영 (한국과학기술정보연구원 정보분석센터) ;
  • 이창환 (한국과학기술정보연구원 정보분석센터) ;
  • 권오진 (한국과학기술정보연구원 정보분석센터) ;
  • 문영호 (한국과학기술정보연구원 정보분석센터)
  • Published : 2008.01.28

Abstract

Application areas of Knowledge Discovery in Database(KDD) have been expanded to many R&D management processes including technology trends analysis, forecasting and evaluation etc. Established research field such as informetrics (or scientometrics) has utilized techniques or methods of KDD. Various systems have been developed to support works of analyzing large-scale R&D related databases such as patent DB or bibliographic DB by a few researchers or institutions. But extant systems have some problems for korean users to use. Their prices is not moderate, korean language processing is impossible, and user's demands not reflected. To solve these problems, Korea Institute of Science and Technology Information(KISTI) developed stand-alone type information analysis system named as KnowledgeMatrix. KnowledgeMatrix system offer various functions to analyze retrieved data set from databases. KnowledgeMatrix's main operation unit is composed of user-defined lists and matrix generation, cluster analysis, visualization, data pre-processing. Matrix generation unit help extract information items which will be analyzed, and calculate occurrence, co-occurrence, proximity of the items. Cluster analysis unit enable matrix data to be clustered by hierarchical or non-hierarchical clustering methods and present tree-type structure of clustered data. Visualization unit offer various methods such as chart, FDP, strategic diagram and PFNet. Data pre-processing unit consists of data import editor, string editor, thesaurus editor, grouping method, field-refining methods and sub-dataset generation methods. KnowledgeMatrix show better performances and offer more various functions than extant systems.

데이터베이스로부터 지식을 발견하고 이를 연구기획자, 정책의사결정자들이 활용하는 움직임이 전세계적으로 활발해지고 있다. 이러한 연구분야 중 대표적인 것이 계량정보학이고 이 분야를 지원하기 위해서 주로 선진국을 중심으로 분석시스템이 개발되고 있다. 그러나 외국의 분석시스템은 실제 수요자의 요구를 충분히 반영하지 못하고 있고, 고가이면서 한글이 지원되지 않아 국내 연구기획자가 사용하기에 어려운 점이 있다. 따라서 한국과학기술정보연구원에서는 이러한 단점을 극복하기 위해서 계량정보분석시스템 KnowledgeMatrix를 개발하였다. KnowledgeMatrix는 논문 및 특허의 서지정보를 분석하여 지식을 발견하기 위한 목적으로 설계된 독립형(stand-alone) 시스템이다 KnowledgeMatrix의 주요 구성을 살펴보면 행렬 생성, 클러스터링, 시각화, 데이터 전처리로 요약된다. 본 논문에서 소개하고 있는 KnowledgeMatrix는 외국의 대표적인 정보분석시스템과 비교했을 때 다양한 기능을 제공하고 있고 특히 영문데이터 처리 이외에 한글데이터 처리가 가능하다는 장점을 갖고 있다.

Keywords

References

  1. 문영호 외, 지식정보의 조사분석체계 구축 연구, KISTI, 2004.
  2. 문영호 외, 차세대 R&D 정보분석.평가.예측시스템 개발, KISTI, 2007.
  3. S. A. Morris, Unified mathmatical treatment of complex cascaded bipartite networks: the case of collections of journal papers, Oklahoma State University, 2005.
  4. N. H, Timm, Applied Multivariate Analysis, Springer, 2002
  5. 임종원 외, 마케팅조사방법, 법문사, 2001.
  6. W. Bae and S. W. Ron, "A study on k-means clustering", The Korean Communications in Statistics Vol.12, No.2, pp.497-508, 2005. https://doi.org/10.5351/CKSS.2005.12.2.497
  7. P. Eades, "A heuristic for graph drawing", CONGRESSUS NUMERANTIUM, Vol.42, pp.149-160, 1984.
  8. T. Kamada and S. Kawai, "An algorithm for drawing general undirected graphs", Information Processing Letters 31, pp.7-15, 1989. https://doi.org/10.1016/0020-0190(89)90102-6
  9. T.M.J. Fruchterman and E.M. Reingold, "Graph drawing by force-directed placement", Softwrar-practice and experience, Vol.21 No.11, pp.1129-1164, 1991. https://doi.org/10.1002/spe.4380211102
  10. R.W. Schvaneveldt, Pathfinder associative networks: studies in knowledge organization, Ablex publishing corporation, 1990.
  11. 이재윤, "지적 구조의 규명을 위한 네트워크 형성 방식에 관한 연구", 한국문헌정보학회지, 제40권, 제2호, pp.333-355, 2006. https://doi.org/10.4275/KSLIS.2006.40.2.333
  12. M. Callon, J.P. Courtial, and F. Laville, "Co-word analysis as a tool for describing the network of interactions between basic and technological research: the case of polymer chemistry", Scientometrics, Vol.22, No.1, pp.155-205, 1991. https://doi.org/10.1007/BF02019280
  13. B. Lee and Y. Jeong, "Mapping the Korea's national R&D domain of robot technology by using the co-word analysis", Scientometrics, Vol.77, No.1 (2008년 10월 출판 예정)
  14. M.F. Porter, "An algorithm for suffix stripping", Program, Vol.14 No.3, pp.130-137, 1980. https://doi.org/10.1108/eb046814
  15. B.Y. Ricardo, and R.N. Berthier, Modern information retrieval, ACM press, 1999.
  16. 이방래, 이준영, 여운동, 이창환, 문영호, 권오진, "서지데이터 분석 툴에 대한 특성 및 편의성 비교분석", KOSTI 2007/한국콘텐츠학회 추계종합학술대회, pp.501-505, 2007.

Cited by

  1. A Preliminary Study on the Development of Library R&D Policy Agenda vol.29, pp.4, 2012, https://doi.org/10.3743/KOSIM.2012.29.4.209
  2. Morphological Classification of Knowledge Map for Science and Technology and Development of Knowledge Map Examples in the View of Information Analysis vol.13, pp.11, 2013, https://doi.org/10.5392/JKCA.2013.13.11.461