A Study on Machine Learning-Based Ransomware Classification methods using Optimized Feature Selection

최적화 특징 선택을 활용한 머신러닝 기반 랜섬웨어 분류 방법 연구

  • Hye-Min Jeon (Dept. of Information Security, Hanyang University) ;
  • Doo-Seop Choi (Dept. of Computer Science, Hanyang University) ;
  • Eul Gyu Im (Dept. of Computer Science, Hanyang University)
  • 전혜민 (한양대학교 정보보안학과) ;
  • 최두섭 (한양대학교 컴퓨터.소프트웨어학과) ;
  • 임을규 (한양대학교 컴퓨터.소프트웨어학과)
  • Published : 2024.05.23

Abstract

최근 랜섬웨어의 유포 증가로 인한 금전적 피해가 전세계적으로 급증하고 있다. 랜섬웨어는 사용자의 데이터를 암호화하여 금전을 요구하거나, 사용자의 중요하고 민감한 데이터를 파괴하여 사용하지 못하도록 피해를 입힌다. 이러한 피해를 막기 위해 파일의 API calls 이나, opcode 를 이용하는 탐지 및 분류 연구가 활발하게 진행되고 있다. 본 논문에서는 랜섬웨어를 효과적으로 탐지하기 위해 파일 PE 기능 값을 PCA 와 Wrapper 방법으로 데이터 전처리 후 머신러닝으로 학습하고, 학습한 모델을 활용하여 랜섬웨어를 정상과 악성으로 분류하는 방법을 제안한다. 제안한 방법으로 실험 결과 RF 는 98.25%, DT 96.25%, SVM 95%, NB 83%의 분류 정확도를 보였으며, RF 모델에서 가장 높은 분류 정확도를 달성하였다.

Keywords

Acknowledgement

This work was supported by the National Research Foundation of Korea(NRF) grant funded by the Korea government(MSIT) (No. NRF-2022R1A4A1032361)

References

  1. PaloAltoNetworks, Unit42. "Ransomware Retrospective 2024: Unit 42 Leak Site Analysis". https://unit42.paloaltonetworks.com/unit-42-ransomware-leak-site-data-analysis/
  2. Koppen, Mario. "The curse of dimensionality." In proceedings of the 5th online world conference on soft computing in industrial applications (WSC5). Vol. 1. 2000.
  3. Mackiewicz, Andrzej, and Waldemar Ratajczak. "Principal components analysis (PCA)." Computers & Geosciences 19.3 (1993): 303-342.
  4. Kohavi, Ron, and George H. John. "Wrappers for feature subset selection." Artificial intelligence 97.1-2 (1997): 273-324
  5. Majd, Nahid Ebrahimi, and Torsha Mazumdar. "Ransomware Classification Using Machine Learning." In proceedings of the 2023 32nd International Conference on Computer Communications and Networks (ICCCN). IEEE, 2023
  6. Zhang, Bin, et al. "Ransomware classification using patch-based CNN and self-attention network on embedded N-grams of opcodes." Future Generation Computer Systems 110 (2020): 708-720.
  7. Masum, Mohammad, et al. "Ransomware classification and detection with machine learning algorithms." In proceedings of the 2022 IEEE 12th Annual Computing and Communication Workshop and Conference (CCWC). IEEE, 2022.
  8. Madani, Houria, et al. "Classification of ransomware using different types of neural networks." Scientific Reports 12.1 (2022): 4770.
  9. Guyon, Isabelle, et al. "Gene selection for cancer classification using support vector machines." Machine learning 46 (2002): 389-422.
  10. Anaconda, Available: https://www.anaconda.com/
  11. RansomwareDetection, Available: https://github.com/mudimathur2020/RansomwareDetection