Analysis of Malware Image Data Augmentation based on GAN

GAN 기반의 악성코드 이미지 데이터 증강 분석

  • Won-Jun Lee (Dept. of Cyber Security, Pai Chai University) ;
  • ChangHoon Kang (Dept. of Cyber Security, Pai Chai University) ;
  • Ah Reum Kang (New Technology Innovation and Convergence University Project Group, Pai Chai University)
  • 이원준 (배재대학교 사이버보안학과) ;
  • 강창훈 (배재대학교 사이버보안학과) ;
  • 강아름 (배재대학교 신기술혁신융합대학사업단)
  • Published : 2024.01.17

Abstract

다양한 변종들의 존재와 잘 알려지지 않은 취약점을 이용한 공격은 악성코드 수집을 어렵게 하는 요인들이다. 부족한 악성코드 수를 보완하고자 생성 모델을 활용한 이미지 기반의 악성코드 데이터를 증강한 연구들도 존재하였다. 하지만 생성 모델이 실제 악성코드를 생성할 수 있는지에 대한 분석은 진행되지 않았다. 본 연구는 VGG-11 모델을 활용해 실제 악성코드와 생성된 악성코드 이미지의 이진 분류하였다. 실험 결과 VGG-11 모델은 99.9%의 정확도로 두 영상을 다르게 판단한다

Keywords

Acknowledgement

Following are results of a study on the "Convergence and Open Sharing System" Project, supported by the Ministry of Education and National Research Foundation of Korea.

References

  1. L, Yan and L, Jiang, "Generative Adversarial Network for Improving Deep Learning Based Malware Classification," 2019 Winter Simulation Conference. IEEE, pp. 584-593, 2019. 
  2. L. Nataraj, S. Karthikeyan, G. Jacob, and B. S. Manjunat, "Malware Images: Visualization and Automatic Classification," Proceedings of the 8th International Symposium on Visualization for Cyber Security, pp. 1-7, 2011. 
  3. A. Radford, L. Metz, and S. Chintala, "Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks," arXiv preprint arXiv:1511.06434, 2015. 
  4. H. Zhang, I. Goodfellow, D. Metaxas and A. Odena, "Self-Attention Generative Adversarial Networks," International conference on machine learning. PMLR, Vol. 97, pp. 7354-7363, Jun 2019. 
  5. K. Simonyan, and A. Zisserman "Very Deep Convolutional Networks for Large-Scale Image Recognition," arXiv preprint arXiv:1409.1556, 2014.