머신러닝 기반 보안데이터 분석 연구

  • 이식 (국민대학교 컴퓨터공학과) ;
  • 김동훈 (국민대학교 컴퓨터공학과) ;
  • 조영훈 (국민대학교 컴퓨터공학과) ;
  • 명준우 (국민대학교 컴퓨터공학과) ;
  • 문다민 (국민대학교 컴퓨터공학과) ;
  • 이재구 (국민대학교 컴퓨터공학과) ;
  • 윤명근 (국민대학교 컴퓨터공학과)
  • Published : 2019.06.30

Abstract

최근 머신러닝 기술이 비약적으로 발전하고 있다. 하드웨어 성능이 향상되고 머신러닝 활용 도구가 오픈소스로 사용 편리하게 개발되어 대중화됨으로써 보안데이터 분석 분야에서도 머신러닝을 이용한 기술 개발이 활발히 진행되고 있다. 본 논문에서는 보안 분야의 악성코드 데이터와 보안관제 로그 데이터를 주요 대상으로 머신러닝 기술을 적용할 때 고려되어야 할 기술적 사항들과 최신 연구 동향, 데이터 셋 특징, 그리고 머신러닝 기반의 보안데이터 분석 기술의 기대 효과 및 현재 기술의 한계점 등을 다루도록 한다.

Keywords

References

  1. Y. Shen, E. Mariconti, P. Vervier, and G.Stringhini, "Tiresias: Predicting Security Events Through Deep Learning," Proceedings of ACM CCS'18
  2. Z. Cui, F. Xue, Y. Cao, and G. Wanf, "Detection of Malicious Code Variants Based on Deep Learning", IEEE Trans. on Industrial Informatics, Vol.14, No.7, 2018
  3. M. Du, F. Li, G. Zheng, V. Srikumar, "DeepLog: Anomaly Detection and Diagnosis from System Logs through Deep Learning," Proceedings of ACM CCS'17
  4. Z. Li, D. Zou, S. Xu, X. Ou, H. Jin, S. Wang, Z. Deng, and Y. Zhong, "VulDeePecker: A Deep Learning-Based System for Vulnerability Detection," NDSS'18
  5. E. Raff, J. Barker, J. Sylvester, R. Brandon, B. Catanzaro, and C. Nicholas, "Malwrae Detection by Eating a whole EXE," AAAI Workshop on Artificial Intelligence for Cyber Security, 2018
  6. R. Ronen, M. Radu, C. Feuerstein, E. Yom-Tov, and M. Ahmadi, "Microsoft Malware Classification Challenge," https://arxiv.org/abs/1802.10135
  7. Microsoft Malware Prediction, 2019, https://www.kaggle.com/c/microsoft-malware-prediction
  8. http://datachallenge.kr/
  9. http://ocslab.hksecurity.net/Datasets
  10. M. Tavallaee, E. Bagheri, W. Lu, and A. Ghorbani, "A Detailed Analysis of the KDD CUP 99 Data Set," Proceedings of the IEEE CSIDA'09
  11. Canadian Institute for Cybersecurity, https://www.unb.ca/cic/datasets/index.html
  12. 2011-2013 VAST Cyber Challenge: Computer Network Operations at All Freight Corporation, http://www.vacommunity.org/2011+-+2013+VAST+Cyber+Challenges
  13. E. Rezende, G. Ruppert, T. Carvalho, F. Ramos and P. Geus, "Malicious Software Classification Using Transfer Learning of ResNet-50 Deep Neural Network," in Proceedings of the IEEE ICMLA'17
  14. X. Ugarte-pedrero, M. Graziano, and D. Balzarotti, "A Close Look at a Daily Dataset of Malware Samples," ACM Transactions on Privacy and Security, Vol. 22, Jan., 2019
  15. Kaspersky, "Machine Learning for Malware Detection," 2017
  16. S. Khatuya, N. Ganguly, J. Basak, M. Bharde, and B. Mitra, "ADELE: Anomaly Detection from Event Log Empiricism," Proceedings of IEEE INFOCOM'18
  17. Microsoft Malware Winners' Interview, http://blog.kaggle.com/2015/05/26/microsoft-malware-winners-interview-1st-place-no-to-overfitting/
  18. KDD Cup 1999: Computer network intrusion detection, https://www.kdd.org/kdd-cup/view/kdd-cup-1999/Data