사물인식을 위한 딥러닝 모델 선정 플랫폼

Deep Learning Model Selection Platform for Object Detection

  • 투고 : 2019.03.26
  • 심사 : 2019.04.08
  • 발행 : 2019.06.30


최근 컴퓨터 비전을 활용한 사물인식 기술이 센서 기반 사물인식 기술을 대체할 기술로 주목을 받고 있다. 센서 기반 사물인식 기술은 일반적으로 고가의 센서를 필요로 하기 때문에 기술이 상용화되기 어렵다는 문제가 있었다. 반면 컴퓨터 비전을 활용한 사물인식 기술은 고가의 센서 대신 비교적 저렴한 카메라를 사용할 수 있다. 동시에 CNN이 발전하면서 실시간 사물인식이 가능해진 이후 IoT, 자율주행자동차 등 타 분야에 활발하게 도입되고 있다. 그러나 사물 인식 모델을 상황에 알맞게 선택하고 학습시키기 위해서는 딥러닝에 대한 전문적인 지식을 요구하기 때문에 비전문가가 사물 인식 모델을 사용하기에는 어려움이 따른다. 따라서 본 논문에서는 딥러닝 기반 사물인식 모델들의 구조와 성능을 분석하고, 사용자가 원하는 조건의 최적의 딥러닝 기반 사물 인식 모델을 스스로 선정할 수 있는 플랫폼을 제안한다. 또한 통계에 기반한 사물 인식 모델 선정이 필요한 이유를 실험을 통해 증명한다.

Recently, object recognition technology using computer vision has attracted attention as a technology to replace sensor-based object recognition technology. It is often difficult to commercialize sensor-based object recognition technology because such approach requires an expensive sensor. On the other hand, object recognition technology using computer vision may replace sensors with inexpensive cameras. Moreover, Real-time recognition is viable due to the growth of CNN, which is actively introduced into other fields such as IoT and autonomous vehicles. Because object recognition model applications demand expert knowledge on deep learning to select and learn the model, such method, however, is challenging for non-experts to use it. Therefore, in this paper, we analyze the structure of deep - learning - based object recognition models, and propose a platform that can automatically select a deep - running object recognition model based on a user 's desired condition. We also present the reason we need to select statistics-based object recognition model through conducted experiments on different models.



  1. 김재상, 문해민, 반성범, "오픈소스 하드웨어 기반 차선검출 기술에 대한 연구," 스마트미디어저널, 제6권, 제3호, 15-20쪽, 2017년 9월
  2. Krizhevsky Alex., Sutskever Ilya., and Hinton E. Geoffrey.. "ImageNet Classification with Deep Convolutional Neural Networks." Advances in Neural Information Processing Systems (NIPS). IEEE. 2012.
  3. Girshick Ross. "Fast R-CNN." The IEEE International Conference on Computer Vision (ICCV). IEEE. 2015.
  4. Ren Shaoqing, He Kaiming,, Girshick Ross, and sun Jian. "Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks." Advances in Neural Information Processing Systems 28 (NIPS 2015). IEEE. 2015.
  5. Redmon Joseph., and Farhadi Ali.. "YOLOv3: An Incremental Improvement." arXiv Preprint. arXiv:1804.02767. 2017.
  6. Redmon Joseph., and Farhadi Ali. "YOLO9000: Better, Faster, Stronger." The IEEE Conference on Computer Vision and Pattern Recognition (CVPR). IEEE. 2017.
  7. Redmon. Joseph, Divvala Santosh., Girschick Ross., Farhadi Ali. "You Only Look Once: Unified, Real-Time Object Detection," The IEEE Conference on Computer Vision and Pattern Recognition (CVPR). IEEE. 2016.
  8. Ioffe Sergey. "Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift.," Proceedings of the 32nd International Conference on Machine Learning, 2015
  9. He Kaiming., Zhang Xiangyu., Ren Shaoqing., and Sun Jian. "Deep Residual Learning for Image Recognition,." The IEEE Conference on Computer Vision and Pattern Recognition (CVPR). IEEE. 2016.
  10. Sandler Mark, Howard Andrew, Zhu Menglong, Zhmoginov Andrey, and Chen Liang-Chieh, "MobileNetV2: Inverted Residuals and Linear Bottlenecks," The IEEE Conference on Computer Vision and Pattern Recognition (CVPR). IEEE. 2018.
  11. Ma Ningning, Xiangyu Zhang, Zheng Hai-Tao, and Sun Jian . "ShuffleNet V2: Practical Guidelines for Efficient CNN Architecture Design," The European Conference on Computer Vision (ECCV). Springer. 2018.
  12. 김진수, 김민구, 반성범, "임베디드 모듈 기반 지능형 영상감시 시스템의 최적화에 관한 연구," 스마트미디어저널, 제7권, 제2호, 40-46쪽, 2018년 6월
  13. Han, Junwei, Zhang Dingwen, Cheng Gong, Liu Nian, and Xu Dong, "Advanced Deep-Learning Techniques for Salient and Category-Specific Object Detection," The IEEE Signal Processing Magazine. IEEE. 2018.
  14. Gauen Kent, Dailey Ryan, Laiman John, Zi Yuxiang, Asokan Nirmal, Lu Yung-Hsiang, Thiruvathukal K. George, Shyu Mei-Ling, and Chen Shu-Ching, "Comparison of Visual Datasets for Machine Learning," The IEEE Conference on Information Reuse and Integration (IRI). IEEE. 2017.