DOI QR코드

DOI QR Code

AutoML Machine Learning-Based for Detecting Qshing Attacks Malicious URL Classification Technology Research and Service Implementation

큐싱 공격 탐지를 위한 AutoML 머신러닝 기반 악성 URL 분류 기술 연구 및 서비스 구현

  • Dong-Young Kim ;
  • Gi-Seong Hwang
  • 김동영 (경북소프트웨어고등학교 소프트웨어개발학과 ) ;
  • 황기성 (경북소프트웨어고등학교 인공지능소프트웨어학과 )
  • Received : 2024.02.15
  • Accepted : 2024.05.07
  • Published : 2024.06.28

Abstract

In recent trends, there has been an increase in 'Qshing' attacks, a hybrid form of phishing that exploits fake QR (Quick Response) codes impersonating government agencies to steal personal and financial information. Particularly, this attack method is characterized by its stealthiness, as victims can be redirected to phishing pages or led to download malicious software simply by scanning a QR code, making it difficult for them to realize they have been targeted. In this paper, we have developed a classification technique utilizing machine learning algorithms to identify the maliciousness of URLs embedded in QR codes, and we have explored ways to integrate this with existing QR code readers. To this end, we constructed a dataset from 128,587 malicious URLs and 428,102 benign URLs, extracting 35 different features such as protocol and parameters, and used AutoML to identify the optimal algorithm and hyperparameters, achieving an accuracy of approximately 87.37%. Following this, we designed the integration of the trained classification model with existing QR code readers to implement a service capable of countering Qshing attacks. In conclusion, our findings confirm that deriving an optimized algorithm for classifying malicious URLs in QR codes and integrating it with existing QR code readers presents a viable solution to combat Qshing attacks.

최근 정부 기관을 사칭한 가짜 QR(Quick Response)코드를 이용하여 개인정보와 금융정보를 탈취하는 QR코드와 스미싱을 결합한 '큐싱(Qshing)' 공격이 증가하는 추세이다. 특히, 이 공격 방식은 사용자가 단지 QR코드를 인식하는 것만으로 스미싱 페이지에 연결되거나 악성 소프트웨어를 다운로드하게 만들어 피해자가 자신이 공격당했는지조차 인지하기 어려운 특징이 있다. 본 논문에서는 머신러닝 알고리즘을 활용해 QR 코드 내 URL의 악성도를 파악하는 분류 기술을 개발하고, 기존의 QR 코드 리더기와 결합하는 방식에 관해 연구를 진행하였다. 이를 위해 QR코드 내 악성 URL 128,587개, 정상 URL 428,102개로부터 프로토콜, 파라미터 등 각종 특징 35개를 추출하여 데이터셋을 구축한 후, AutoML을 이용하여 최적의 알고리즘과 하이퍼파라미터를 도출한 결과, 약 87.37%의 정확도를 보였다. 이후 기존 QR코드 리더기와 학습한 분류 모델의 결합을 설계하여 큐싱 공격에 대응할 수 있는 서비스를 구현하였다. 결론적으로, QR코드 내 악성 URL 분류 모델에 최적화된 알고리즘을 도출하고, 기존 QR코드 리더기에 결합하는 방식이 큐싱 공격의 대응 방안 중 하나임을 확인하였다.

Keywords

References

  1. 'QR코드 활용' 신종 금융사기 '큐싱' 주의보 (2015), https://cm.asiae.co.kr/article/2015052709110452713, (accessed Jan., 08, 2024). 
  2. What is a phishing attack? by CloudFlare(2024), https://www.cloudflare.com/ko-kr/learning/access-management/phishing-atack, (accessed Jan., 08, 2024). 
  3. Woman receives $788 Walmart charge after scanning QR code in downtown Lafayette parking lot(2023), https://www.klfy.com/local/lafayette-parish/woman-receives-788-walmart-charge-after-scanning-qr-code-in-downtown-lafayette-parking-lot/, (accessed Jan., 09, 2024). 
  4. 김은결, 김보람, 권소연, 김유빈, and 이광재, "A Development of a Deep Learning-based Qshing Detection App using DGA and WHOIS Information," 제어로봇시스템학회 국내학술대회 논문집, 577-578쪽, 2023년 06월 
  5. 한국인터넷진흥원_피싱사이트 URL(2022),https://www.data.go.kr/data/15109780/fileData.do, (accessed Jan., 12, 2024). 
  6. Malicious URLs dataset(2021), https://www.kaggle.com/datasets/sid321axn/malicious-urls-dataset/data, (accessed Jan., 12, 2024). 
  7. Chae-rim Han, Su-hyun Yun, Myeong-jin Han, and Il-Gu Lee, "Machine Learning-Based Malicious URL Detection Technique," Journal of the Korea Institute of Information Security & Cryptology, vol. 32, no. 3, pp. 555-564, 2022. 
  8. 한채림, 윤수현, 한명진, and 이일구, "머신러닝 기반 악성 URL 탐지 기법," 정보보호학회논문지, 제32권, 제3호, 555-564쪽, 2022년 6월 
  9. Zoller, M.A., Huber, M.F., "Benchmark and survey of automated machine learning frameworks," Journal cf Artificial Intelligence Research 70, pp. 409-472. 2021. 
  10. 장성민, 김준학, 권희정, 오은희, 서창진, "RandomForest와 XGBoost를 이용한 악성코드 탐지 시스템 개발," 대한전기학회 학술대회 논문집, 제주, 대한민국, 2023년 5월