Data Augmentation of Shelf Product for Object Recognition in O2O Stores Based on Generative AI

O2O 상점의 객체 인식을 위한 생성 AI 기반의 진열대 상품 데이터 증강

  • Jongwook Si (Dept. of Computer.AI Convergence Engineering, Kumoh National Institute of Technology) ;
  • Sungyoung Kim (Dept. of Computer Engineering, Kumoh National Institute of Technology)
  • 시종욱 (국립금오공과대학교 컴퓨터.AI융합공학과) ;
  • 김성영 (국립금오공과대학교 컴퓨터공학과)
  • Published : 2024.01.17

Abstract

본 논문에서는 O2O 상점의 자동화에 필수적인 객체 인식 모델의 성능 향상을 목표로, 생성 AI 기술을 이용한 데이터 증강 방법을 제시한다. 제안하는 방법은 텍스트 프롬프트를 활용하여 진열대 상품 이미지를 포함한 다양한 고품질 이미지를 생성할 수 있음을 보인다. 또한, 실제에 더 가까운 상세한 이미지를 생성하기 위한 최적화된 프롬프트를 제안하고, Stable-Diffusion과 DALL-E2의 생성 결과를 통해 비교 분석한다. 이러한 접근 방법은 객체 인식 모델의 성능 향상에 영향을 미칠 것으로 기대된다.

Keywords

Acknowledgement

본 연구는 2023년도 중소벤처기업부의 기술개발사업 지원에 의한 연구임 [S3344882]

References

  1. R. Rombach, A. Blattmann, D. Lorenz, P. Esser, and B. Ommer, "High-resolution image synthesis with latent diffusion models", Proc. Of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, pp. 10684-10695, 2023.
  2. A. Ramesh, P. Dhariwal, A. Nichol, C. Chu, and M. Chen, "Hierarchical text-conditional image generation with clip latents", arXiv preprint arXiv:2204.06125.
  3. J. Si, and S. Kim, "Fine-tuning using dreambooth: Focusing on realistic virtual interviewer generation based on stable-diffusion", Proc. Of Korean Institute of Information Technology Conference, pp. 145-145, Nov. 2023.
  4. J. Si, and S. Kim, "Diffusion model-based data augmentation for defect detection: Inpainting using prompts", Domestic Conference, Proc. Of Korean Institute of Information Technology Conference, pp. 146-146, Nov. 2023.
  5. Y. Ge, J. Xu, B. N. Zhao, L. Itti, V. Vineet, "Dall-e for detection: Language-driven context image synthesis for object detection", arXiv preprint arXiv:2206.09592.