DOI QR코드

DOI QR Code

Dynamic Analytic Data Preprocessing Techniques for Malware Detection

악성코드 탐지를 위한 동적 분석 데이터 전처리 기법

  • Hae-Soo Kim (School of Computer Engineering & Applied Mathematics, Computer System Institute Hankyong National University) ;
  • Mi-Hui Kim (School of Computer Engineering & Applied Mathematics, Computer System Institute Hankyong National University)
  • 김해수 (한경국립대학교 컴퓨터응용수학부, 컴퓨터시스템연구소) ;
  • 김미희 (한경국립대학교 컴퓨터응용수학부, 컴퓨터시스템연구소)
  • Published : 2023.11.02

Abstract

악성코드를 탐지하는 기법 중 동적 분석데이터와 같은 시계열 데이터는 프로그램마다 호출되는 API의 수가 모두 다르다. 하지만 딥러닝 모델을 통해 분석할 때는 모델의 입력이 되는 데이터의 크기가 모두 같아야 한다. 이에 본 논문은 TF-IDF(Term Frequency-Inverse Document Frequency)와 슬라이딩 윈도우 기법을 이용해 프로그램의 동적 특성을 유지하면서 데이터의 길이를 일정하게 만들 수 있는 전처리 기법과 LSTM(Long Short-Term Memory) 모델을 통해 정확도(Accuracy) 95.89%, 재현율(Recall) 97.08%, 정밀도(Precision) 95.9%, F1-score 96.48%를 달성했다.

Keywords