The Comparison of Segmentation Performance between SegFormer and U-Net on Railway Components

SegFormer 및 U-Net의 철도 구성요소 객체 분할 성능 비교

  • Jaehyun Lee (Dept. of Computer Engineering, Korea National University of Transportation) ;
  • Changjoon Park (Dept. of IT.Energy Convergence, Korea National University of Transportation) ;
  • Namjung Kim (Dept. of Software, Korea National University of Transportation) ;
  • Junhwi Park (Dept. of AI.Robotics Engineering, Korea National University of Transportation) ;
  • Jeonghwan Gwak (Dept. of Software, Korea National University of Transportation)
  • 이재현 (국립한국교통대학교 컴퓨터공학과) ;
  • 박창준 (국립한국교통대학교 교통.에너지융합학과) ;
  • 김남중 (국립한국교통대학교 소프트웨어학과) ;
  • 박준휘 (국립한국교통대학교 AI.로봇공학과) ;
  • 곽정환 (국립한국교통대학교 소프트웨어학과)
  • Published : 2024.01.17

Abstract

본 논문에서는 철도 구성요소 모니터링을 위한 효율적인 객체 분할 기법으로 사전학습된 SegFormer 모델의 적용을 제안하고, 객체 분할을 위해 보편적으로 사용되는 U-Net 모델과의 성능 비교 분석을 진행하였다. 철도의 주요 구성요소인 선로, 침목, 고정 장치, 배경을 분할할 수 있도록 라벨링된 데이터셋을 학습에 사용하였다. SegFormer 모델이 대조군인 U-Net보다 성능이 Jaccard Score 기준 5.29% 향상됨에 따라 Vision Transformer 기반의 모델이 기존 CNN 기반 모델의 이미지의 전역적인 문맥을 파악하기 상대적으로 어렵다는 한계를 극복하고, 철도 구성요소 객체 분할에 더욱 효율적인 모델임을 확인한다.

Keywords

Acknowledgement

This work was supported by the Institute of Information & Communications Technology Planning & Evaluation (IITP) grant funded by the Korean government (MSIT) (No. 2014-3-00077).

References

  1. X. Gibert, V. M. Patel and R. Chellappa, "Material Classification and Semantic Segmentation of Railway Track Images with Deep Convolutional Neural Networks," IEEE International Conference on Image Processing (ICIP), Sep. 2015.
  2. A. Dosovitskiy, L. Beyer, A. Kolesnikov, D. Weissenborn, X. Zhai, T. Unterthiner, M. Dehghani, M. Minderer, G. Heigold, S. Gelly, J. Uszhoreit and N. Houlsby," An Image is Worth 16×16 Words: Transformers for Image Recognition at Scale," In International Conference on Learning Representations, May 2021.
  3. E. Xie, W. Wang, Z. Yu, A. Anandkumar, J. M. Alvarez and P. Luo, "SegFormer: Simple and Efficient Design for Semantic Segmentation with Transformers," Conference on Neural Information Processing Systems (NeuraIPS), Dec. 2021.
  4. O. Ronneberger, P. Fischer and T. Brox, "U-Net: Convolutional Networks for Biomedical Image Segmentation," Medical Image Computing and Computer-Assisted Intervention (MICCAI), Oct. 2015.