GAN-Based Synthesis of Sparse Disease Data for Improving Medical AI Performance

의료 인공지능 성능 향상을 위한 GAN 기반 희소 질병 데이터 합성

  • Ye-Rim Jeong (Dept. of Convergence Security Engineering, Sungshin Women's University) ;
  • So-Yeon Kim (Dept. of Future Convergence Technology Engineering, Sungshin Women's University) ;
  • Il-Gu Lee (Dept. of Convergence Security Engineering, Sungshin Women's University)
  • 정예림 (성신여자대학교 융합보안공학과) ;
  • 김소연 (성신여자대학교 미래융합기술공학과) ;
  • 이일구 (성신여자대학교 융합보안공학과 미래융합기술공학과)
  • Published : 2024.05.23

Abstract

최근 디지털 헬스케어 기술과 서비스가 널리 활용되면서 의료 인공지능 성능 향상에 대한 관심이 높아지고 있다. 그러나 양성 데이터 대비 질병 데이터가 희소하여 학습 과정에서 과적합이 발생하거나 질병 예측 모델의 성능이 떨어진다는 한계가 있다. 본 논문에서는 데이터가 균질하지 않은 상황에서 생성형 인공지능 모델을 사용하여 합성 데이터를 생성하는 방안을 제안한다. 실험 결과에 따르면, 종래 방법 대비 제안한 방법의 정확도가 약 5.8% 향상되었고, 재현율이 약 21% 개선되었다.

Keywords

Acknowledgement

본 논문은 2024년도 산업통상자원부 및 한국산업 기술진흥원의 산업혁신인재성장지원사업 (RS-2024-00415520)과 과학기술정보통신부 및 정보통신기획평가원의 ICT혁신인재4.0 사업의 연구결과로 수행되었음 (No. IITP-2022-RS-2022-00156310)

References

  1. Hao, Weituo, et al. "Towards fair federated learning with zero-shot data augmentation." Proceedings of the IEEE/CVF conference on computer vision and pattern recognition. 2021.
  2. Heart Attack Risk Prediction Dataset. Sourav Banerjee. https://www.kaggle.com/datasets/iamsouravbanerjee/heart-attack-prediction-dataset