Data Mining Analysis of Educational and Research Achievements of Korean Universities Using Public Open Data Services

정보공시 자료를 이용한 교육/연구성과 영향요인 추출 및 대학의 군집 분석

  • Received : 2014.01.10
  • Accepted : 2014.01.28
  • Published : 2014.01.30


The purpose of this study is to provide useful knowledge for improving indicators that represent competitiveness and educational competency of the university by deriving a new pattern or the meaningful results from the data of information disclosure of universities using statistical analysis and data mining techniques. To achieve this, a model of decision tree was made and various factors that affect education/research performance such as employment rate, the number of technology transfer and papers per full-time faculty were explored. In addition to this, the cluster analysis of universities was conducted using attributes related to evaluation of university. According to the analysis, common factors affecting higher education/research performance are following indicators ; incoming student recruitment rate, enrollment rate, and the number of students per full-time faculty. In the cluster analysis, when performed by the entire university, the size, location of the university respectively, clusters are mainly formed by well-known universities, art physical non-science and engineering religious leaders training universities, and others. The main influencing factors of this cluster are higher education/research performance indicators such as employment rate and the number of technology transfer.

본 연구의 목적은 통계 분석과 데이터마이닝 기법을 이용하여 대학정보공시 자료 속의 새로운 패턴이나 의미 있는 결과를 도출함으로써 대학의 교육역량 및 경쟁력을 나타내는 지표 개선에 유용한 지식을 제공하는 것이다. 이를 위해 교육/연구성과를 나타내는 취업률, 기술이전건수, 전임교원 1인당 논문수 지표의 영향요인 탐색 및 의사결정나무 모형 도출과 대학평가 관련지표를 이용한 대학의 군집분석을 실시하였다. 연구 결과, 대학 교육/연구성과 지표의 공통 영향요인은 신입생충원율, 재학생충원율, 전임교원 1인당 학생수로 나타났다. 군집분석에서는 전체 대학, 대학규모별, 소재지별로 각각 실시하였을 때 유명대학, 예체능 비이공계 종교지도자양성 대학, 그 외 대학으로 군집이 형성되는 양상을 보였고, 그 주요 영향요인으로는 대학 교육/연구성과 지표인 취업률, 기술이전건수 등으로 나타났다.