DOI QR코드

DOI QR Code

암 유전체 데이터 처리 및 다중 분류 모델에 따른 성능 비교 연구

Performance Comparison of Multiple Classification Models for Cancer Genomic Data Processing

  • 성다훈 (숙명여자대학교 IT공학과) ;
  • 임유진 (숙명여자대학교 인공지능공학부)
  • Da-Hun Seong (Dept. of Information Technology Engineering, Sookmyung Women's University) ;
  • Yujin Lim (Div. of Artificial Intelligence Engineering, Sookmyung Women's University)
  • 발행 : 2024.10.31

초록

암 환자의 유전체 변이 데이터는 샘플 수가 적으나 많은 특성 정보를 가지는 의료 데이터로, 이러한 특성은 ML 모델의 성능 향상에 상당한 장벽으로 작용한다. 따라서 본 연구는 제한된 의료 데이터의 한계를 해결할 수 있는 적절한 모델 선택을 돕고자, 유전체 데이터를 이용하여 암종을 예측하는 다중 클래스 분류 문제에서 성능향상기법과 다중 클래스 분류 모델에 따른 성능을 분석하였다.

키워드

과제정보

본 연구는 과학기술정보통신부 및 정보통신기획평가원의 ICT혁신인재4.0 사업의 연구결과로 수행되었음 (IITP-2024-RS-2022-00156299)

참고문헌

  1. M. E. Ozer, P. O. Sarica and K. Y. Arga, "New Machine Learning Applications to Accelerate Personalized Medicine in Breast Cancer: Rise of the Support Vector Machines," Omics: A Journal of Integrative Biology, Vol.24, No.5, pp.241-246, 2020.
  2. W. Zhu, L. Xie, J. Han and X. Guo, "The Application of Deep Learning in Cancer Prognosis Prediction," Cancers, Vol.12, No.3, pp.603, 2020.
  3. I. T. Jolliffe, "Principal Component Analysis and Factor Analysis," Principal Component Analysis, pp.150-166, 2002.
  4. C. M. Bishop and N. M. Nasrabadi, "Pattern Recognition and Machine Learning," New York, Springer, 2006.
  5. A. Liaw and M. Wiener, "Classification and Regression by Random Forest," R News, Vol.2, No.3, pp.18-22, 2002.
  6. T. Chen and C. Guestrin, "XGBoost: A Scalable Tree Boosting System," In Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, San Francisco, USA, 2016, pp.785-794.
  7. G. Ke, Q. Meng, T. Finley, T. Wang, W. Chen, W. Ma and T. Y. Liu, "LightGBM: A Highly Efficient Gradient Boosting Decision Tree," In Advances in Neural Information Processing Systems, Long Beach, USA, 2017, pp.3146-3154.
  8. L. Prokhorenkova, G. Gusev, A. Vorobev, A. V. Dorogush and A. Gulin, "CatBoost: Unbiased Boosting with Categorical Features," In Advances in Neural Information Processing Systems, Montreal, Canada, 2018, pp.6638-6648.
  9. V. Vapnik, "Support-Vector Networks," Machine Learning, pp.273-297, 1995.
  10. T. Cover and P. Hart, "Nearest Neighbor Pattern Classification," IEEE Transactions on Information Theory, Vol.13, No.1, pp.21-27, 1967.
  11. I. Goodfellow, Y. Bengio and A. Courville, "Deep Learning," Cambridge, MIT Press, 2016.