DOI QR코드

DOI QR Code

Comparison of Adversarial Example Restoration Performance of VQ-VAE Model with or without Image Segmentation

이미지 분할 여부에 따른 VQ-VAE 모델의 적대적 예제 복원 성능 비교

  • Tae-Wook Kim (Division of Software, Yonsei University) ;
  • Seung-Min Hyun (Department of Computer & Telecommunications Engineering, Yonsei University) ;
  • Ellen J. Hong (Division of Software, Yonsei University)
  • 김태욱 (연세대학교 소프트웨어학부) ;
  • 현승민 (연세대학교 컴퓨터정보통신공학부) ;
  • 홍정희 (연세대학교 소프트웨어학부)
  • Received : 2022.11.01
  • Accepted : 2022.12.10
  • Published : 2022.12.31

Abstract

Preprocessing for high-quality data is required for high accuracy and usability in various and complex image data-based industries. However, when a contaminated hostile example that combines noise with existing image or video data is introduced, which can pose a great risk to the company, it is necessary to restore the previous damage to ensure the company's reliability, security, and complete results. As a countermeasure for this, restoration was previously performed using Defense-GAN, but there were disadvantages such as long learning time and low quality of the restoration. In order to improve this, this paper proposes a method using adversarial examples created through FGSM according to image segmentation in addition to using the VQ-VAE model. First, the generated examples are classified as a general classifier. Next, the unsegmented data is put into the pre-trained VQ-VAE model, restored, and then classified with a classifier. Finally, the data divided into quadrants is put into the 4-split-VQ-VAE model, the reconstructed fragments are combined, and then put into the classifier. Finally, after comparing the restored results and accuracy, the performance is analyzed according to the order of combining the two models according to whether or not they are split.

다양하고 복잡한 영상 데이터 기반의 산업에서 높은 정확도와 활용성을 위해 고품질의 데이터를 위한 전처리가 요구된다. 하지만 기존 이미지 또는 영상 데이터와 노이즈를 결합해 기업에 큰 위험을 초래할 수 있는 오염된 적대적 예제가 유입될 시 기업의 신뢰도 및 보안성, 완전한 결과물 확보를 위해 손상되기 이전으로의 복원이 필요하다. 이를 위한 대비책으로 기존에는 Defense-GAN을 사용하여 복원을 진행하였지만, 긴 학습 시간과 복원물의 낮은 품질 등의 단점이 존재하였다. 이를 개선하기 위해 본 논문에서는 VQ-VAE 모델을 사용함과 더불어 이미지 분할 여부에 따라 FGSM을 통해 만든 적대적 예제를 이용하는 방법을 제안한다. 먼저, 생성된 예제를 일반 분류기로 분류한다. 다음으로 분할 전의 데이터를 사전 학습된 VQ-VAE 모델에 전달하여 복원한 후 분류기로 분류한다. 마지막으로 4등분으로 분할된 데이터를 4-split-VQ-VAE 모델에 전달하여 복원한 조각을 합친 뒤 분류기에 넣는다. 최종적으로 복원된 결과와 정확도를 비교한 후 분할 여부에 따른 2가지 모델의 결합 순서에 따라 성능을 분석한다.

Keywords

Acknowledgement

이 성과는 정부(과학기술정보통신부)의 재원으로 한국연구재단의 지원을 받아 수행된 연구임 (No, 2022R1F1A1074273).

References

  1. Pouya Samangouei, Maya Kabkab, Rama Chellappa. (2018). Defense-GAN: Protecting Classifiers Against Adversarial Attacks Using Generative Models. ICLR 2018, arXiv:1805.06605
  2. Xiang Li, Shihao Ji. (2019). Defense-VAE: A Fast and Accurate Defense against Adversarial Attacks. MLCS 2019, arXiv:1812.06570
  3. Aaron van den Oord, Oriol Vinyals, & Koray Kavukcuoglu. (2017). Neural Discrete Representation Learning. NIPS 2017, arXiv:1711.00937
  4. Deng, L. (2012). The mnist database of handwritten digit images for machine learning research. IEEE Signal Processing Magazine, 29(6), 141-142. https://doi.org/10.1109/MSP.2012.2211477
  5. Ian J. Goodfellow, Jonathon Shlens & Christian Szegedy. (2015). Explaining and Harnessing Adversarial Examples. ICLR 2015, arXiv:1412.6572