Development of newly recruited privates on-the-job Training Achievements Group Classification Model

신병 주특기교육 성취집단 예측모형 개발

  • Published : 2007.12.31

Abstract

The period of military personnel service will be phased down by 2014 according to 'The law of National Defense Reformation' issued by the Ministry of National Defense. For this reason, the ROK army provides discrimination education to 'newly recruited privates' for more effective individual performance in the on-the-job training. For the training to be more effective, it would be essential to predict the degree of achievements by new privates in the training. Thus, we used data mining techniques to develop a classification model which classifies the new privates into one of two achievements groups, so that different skills of education are applied to each group. The target variable for this model is a binary variable, whose value can be either 'a group of general control' or 'a group of special control'. We developed four pure classification models using Neural Network, Decision Tree, Support Vector Machine and Naive Bayesian. We also built four hybrid models, each of which combines k-means clustering algorithm with one of these four mining technique. Experimental results demonstrated that the highest performance model was the hybrid model of k-means and Neural Network. We expect that various military education programs could be supported by these classification models for better educational performance.

국방부에서 발표한 '국방개혁에 관한 법률'에 따라 2014년까지 현역병들에 대한 복무기간이 단계적으로 단축될 예정이다. 이에 따라 육군에서는 좀 더 효율적인 직무교육 방안의 일환으로 훈련병들에게 '차등제 교육'을 시행하고 있다. 이러한 차등제 교육의 효과를 향상시키기 위해서는 훈련병들의 예상 학업 성취도를 미리 예측하여 성취집단별로 차별화 된 교육과정을 거치게 하는 것이 매우 중요하다. 따라서 본 연구에서는 입교초기에 얻을 수 있는 신병들의 제한된 자료들만을 이용하여 그들의 예상 교육 성취집단을 예측하는 모형을 개발하였다. 본 모형의 목적 변수는 '성취집단'이며 '일반관리 인원' 및 '집중관리 인원'의 두 가지 값을 갖는다. 사용된 기법은 인공신경망(Neural Network) 모형, 의사결정나무(Decision Tree) 모형, SVM 모형, 그리고 Naive Bayesian모형 등 4가지 순수 모형과, 각각의 순수 모형을 k-means군집기법과 혼합한 4가지의 혼합모형 등 총 8개의 모형의 성능을 비교 분석하였다. 실험 결과 k-means군집기법과 인공신경망 기법을 혼합한 모형이 가장 좋은 예측력을 보이는 것으로 나타났다. 이러한 교육 성취집단 예측 모형은 향후 군에서 이루어지는 다양한 교육 프로그램에 효과적으로 이용될 수 있을 것으로 기대된다.

Keywords

References

  1. 국방부, 국방개혁에 관한 법률 시행령, 2007
  2. 김혜숙, 문양세, 김진호, 노웅기, '데이터 마이닝을 사용한 방학 중 학습방법과 학업성 취도의 관계 분석 ' 정보과학회논문지 : 소프트웨어 및 응용, 제 34권. pp 40-51, 2007
  3. 배재호, '데이터 마이닝을 이용한 학업성취 도 분석,'경희대학교 교육대학원 석사학위논문 2001
  4. 오성삼, 구병두, '메타분석을 통한 한국형 학업성취 관련변인의 탐색' 교육학연구, 제 39권. pp. 99-122. 1999
  5. 육군본부, 육군규정. 2007
  6. 차지혜, '영어과 학업성취도에 영향을 미치는 배경변수에 대한 다차원적 분석' 이화여자대학교 대학원 석사학위논문. 2001
  7. 하영자, '공무원의 온라인 직무교육에서 자기효능감과 자기조절학습 수행력이 만족도와 성취도에 미치는 영향' 한국사이버교육학회, e-learing 학술연구, 제4권 제1호. pp. 31-63. 2005
  8. 허명회, 비교연구를 위한 통계적 방법론. 경기, 자유아카데미. 2005
  9. Anderberg, R., Cluster analysis for applications, New York, MA: Academic Press, 1973
  10. Carvalho, D.R., and Freitas, A. A. , 'A hybrid decision tree/genetic algorithm method for data mining,' Information Sciences, Vol. 163. pp 13-35, 2004. https://doi.org/10.1016/j.ins.2003.03.013
  11. Chang, P.C., Lai, C.-Y., and Lai, K.R., 'A hybrid system by eVol.ving case-based reasoning with genetic algorithm in wholesaler's returning book forecasting,' Decision Support Systems. Vol. 42, pp. 1715-1729. 2006. https://doi.org/10.1016/j.dss.2006.02.014
  12. Dash. M., and Liu. H,. 'Feature Selection for Classification,' Intelligent Data Analysis. Vol. 1, pp. 131-156, 1997 https://doi.org/10.1016/S1088-467X(97)00008-5
  13. Delen. D., Glenn W .. and Amit K., 'Predicting breast cancer survivability: a comparison of three data mining methods:' Artificial Intelligence in Medicine, Vol. 34. pp. 113-127. 2005 https://doi.org/10.1016/j.artmed.2004.07.002
  14. Fuller. B., 'What school factors raise achievement in the third word:' Review of Educational Research. Vol. 57. pp. 255-273, 1987 https://doi.org/10.3102/00346543057003255
  15. Guldemir, H. and Abdulkadir S., 'Comparison of clustering algorithms for analog modulation classification:' Expert Systems with Applications, Vol. 30. pp. 642-649. 2006 https://doi.org/10.1016/j.eswa.2005.07.014
  16. Hsieh. N.C., 'Hybrid mining approach in the design of credit scoring models:' Expert Systems with Applications, Vol. 28. pp. 655-665. 2005 https://doi.org/10.1016/j.eswa.2004.12.022
  17. Hung. S,Y., David, C.Y.. and Wang. H.-Y.. 'Applying data mining to telecom churn management,' Expert Systems with Application, Vol.31, pp. 515-524, 2006 https://doi.org/10.1016/j.eswa.2005.09.080
  18. Kim, K-J., and Ahn, H., 'A recommender system using GAK-means clustering in an online shopping market.' Forthcoming. 2007
  19. Kuo, R.J., Ho. L.M .. and Hu, C.M., 'Integration of self-organizing feature maps neural network and genetic K -means algorithm for market segmentation.' Computers & Operation Research. Vol. 29, pp. 1475-1493, 2002 https://doi.org/10.1016/S0305-0548(01)00043-0
  20. Min, S.H., Lee, J., and Han, I., 'Hybrid genetic algorithms and support vector machines for bankruptcy prediction,' Expert Systems with Applications, Vol. 31, pp 652-660, 2006 https://doi.org/10.1016/j.eswa.2005.09.070
  21. Ryu, Y.U., Chandrasekaran. R., and Jacob, V.S., 'Breast cancer prediction using the isotonic separation technique,' European Journal of Operation Research. Vol. 181, pp. 842-854. 2007 https://doi.org/10.1016/j.ejor.2006.06.031
  22. Witten, I.H., and Frank. E., DATA MINING: Practical Machine Learning Tools and Techniques. San Francisco, MA: Morgan Kaufmann. 2005