An Empirical Study on Frequently used Python APIs in AI-Related Open Source Python Software Projects

인공지능과 관련된 오픈 소스 파이썬 소프트웨어 프로젝트에서 자주 사용되는 파이썬 API들에 대한 연구

  • Jungil Kim (Center of Self-Organizing Software, Kyungpook National University)
  • 김정일 (경북대학교 자율군집소프트웨어연구센터)
  • Published : 2024.01.17

Abstract

전통 소프트웨어 프로젝트 개발과 AI 관련된 소프트웨어 프로젝트 개발에 큰 차이가 있어서 AI 관련된 소프트웨어 프로젝트 개발 환경을 이해하려는 많은 노력이 있었지만 AI 관련 소프트웨어 프로젝트 개발에서 어떤 API들이 자주 사용되는지에 대해서 아직 충분히 조사되지 않았다. 본 논문에서는 "AI 관련 오픈 소스 소프트웨어 프로젝트에서 어떤 파이썬 API들이 자주 사용되는가?"에 대한 연구 질문의 해답을 알아보는 경험 연구를 소개한다. 이 경험 연구의 결과로 AI 관련 오픈 소스 소프트웨어 프로젝트에서 파이썬 표준 라이브러리와 관려된 API들이 가장 자주 사용된다는 것을 확인했다. 또한 기계 학습을 포함해서 데이터 처리, 이미지 처리, 테스팅, 웹 서비스와 관련된 라이브러리들에 있는 API들도 AI 관련 오픈 소스 소프트웨어 프로젝트들에 자주 사용된다는 것을 알아냈다.

Keywords

Acknowledgement

본 연구는 과학기술정보통신부의 재원 (1711194613, RS-2023-00213733)과 교육부의 재원 (NRF-2018R1A6A1A03025109)으로 한국연구재단의 지원을 받아 수행된 연구임.

References

  1. Islam, M. J., Nguyen, G., Pan, R., & Rajan, H., A comprehensive study on deep learning bug characteristics. In: Proceedings of the 2019 27th ACM Joint Meeting on European Software Engineering Conference and Symposium on the Foundations of Software Engineering. 2019. p. 510-520.
  2. Zhang, H., Cruz, L., & Van Deursen, A., Code smells for machine learning applications. In: Proceedings of the 1st International Conference on AI Engineering: Software Engineering for AI. 2022. p. 217-228.
  3. Simmons, A. J., Barnett, S., Rivera-Villicana, J., Bajaj, A., & Vasa, R., A large-scale comparative analysis of coding standard conformance in open-source data science projects. In: Proceedings of the 14th ACM/IEEE International Symposium on Empirical Software Engineering and Measurement (ESEM). 2020. p. 1-11.
  4. Jebnoun, H., Ben Braiek, H., Rahman, M. M., & Khomh, F., The scent of deep learning code: An empirical study. In: Proceedings of the 17th International Conference on Mining Software Repositories. 2020. p. 420-430.