Development of dataset amplification software

학습데이터 증폭 소프트웨어 개발

  • Seo, Kyeong-Deok (School of Computer Science and Engineering, Kyungpook National University) ;
  • Koh, Seok-Joo (School of Computer Science and Engineering, Kyungpook National University) ;
  • Shin, Jae-Won (School of Computer Science and Engineering, Kyungpook National University) ;
  • Park, Hyung-Seok (School of Computer Science and Engineering, Kyungpook National University) ;
  • Joe, Seong-Yoon (School of Computer Science and Engineering, Kyungpook National University) ;
  • Kim, Kyeong-Rae (School of Computer Science and Engineering, Kyungpook National University)
  • 서경덕 (경북대학교 컴퓨터학부) ;
  • 고석주 (경북대학교 컴퓨터학부) ;
  • 신재원 (경북대학교 컴퓨터학부) ;
  • 박형석 (경북대학교 컴퓨터학부) ;
  • 조성윤 (경북대학교 컴퓨터학부) ;
  • 김경래 (경북대학교 컴퓨터학부)
  • Published : 2020.07.13

Abstract

데이터의 다양성은 학습에 따른 모델의 성능을 좌지우지하는 중요한 요소이다. 그렇기 때문에 많은 양의 데이터를 확보하는 것은 학습에 있어서 아주 중요하다. 하지만, 데이터를 수집하는 것은 시간과 비용이 많이 드는 단계 중 하나이다. 본 논문에서는 제한된 데이터를 가지고 이미지 처리를 거쳐 대량의 데이터로 증폭시켜 많은 양의 데이터를 확보하는 과정에 대해 제안한다. 가지고 있는 YOLOv4용 학습 데이터 셋을 활용하여 사용자로부터 입력받은 확대/축소 비율, 각도로 데이터를 변형하고, 이렇게 추가로 생성된 데이터 셋을 기존 학습 데이터 셋에 재포함시키는 소프트웨어를 개발하는 것을 목표로 한다. 구현된 소프트웨어로 증폭된 대량의 데이터 셋을 다시 원본 학습 데이터 셋에 추가하고, 같은 영상에 대해서 원본 데이터 셋만 학습시킨 경우의 객체 검출 결과와 증폭된 학습 데이터 셋이 포함된 데이터 셋의 경우의 객체 검출 결과를 비교하여 그 성능을 검증하고 분석하도록 한다.

Keywords