DOI QR코드

DOI QR Code

Design of CNN-based Gastrointestinal Landmark Classifier for Tracking the Gastrointestinal Location

캡슐내시경의 위치추적을 위한 CNN 기반 위장관 랜드마크 분류기 설계

  • Jang, Hyeon-Woong (Department of Electrical and Computer Engineering, Ajou University) ;
  • Lim, Chang-Nam (Department of Electrical and Computer Engineering, Ajou University) ;
  • Park, Ye-Seul (Department of Electrical and Computer Engineering, Ajou University) ;
  • Lee, Kwang-Jae (Department of Gastroenterology, Ajou University Hospital) ;
  • Lee, Jung-Won (Department of Electrical and Computer Engineering, Ajou University)
  • 장현웅 (아주대학교 전자공학과) ;
  • 임창남 (아주대학교 전자공학과) ;
  • 박예슬 (아주대학교 전자공학과) ;
  • 이광재 (아주대학교 의과대학 소화기내과) ;
  • 이정원 (아주대학교 전자공학과)
  • Published : 2019.10.30

Abstract

최근의 영상 처리 분야는 딥러닝 기법들의 성능이 입증됨에 따라 다양한 분야에서 이와 같은 기법들을 활용해 영상에 대한 분류, 분석, 검출 등을 수행하려는 시도가 활발하다. 그중에서도 의료 진단 보조 역할을 할 수 있는 의료 영상 분석 소프트웨어에 대한 기대가 증가하고 있는데, 본 연구에서는 캡슐내시경 영상에 주목하였다. 캡슐내시경은 주로 소장 촬영을 목표로 하며 식도부터 대장까지 약 8~10시간 동안 촬영된다. 이로 인해 CT, MR, X-ray와 같은 다른 의료 영상과 다르게 하나의 데이터 셋이 10~15만 장의 이미지를 갖는다. 일반적으로 캡슐내시경 영상을 판독하는 순서는 위장관 교차점(Z-Line, 유문판, 회맹판)을 기준으로 위장관 랜드마크(식도, 위, 소장, 대장)를 구분한 뒤, 각 랜드마크 별로 병변 정보를 찾아내는 방식이다. 그러나 워낙 방대한 영상 데이터를 가지기 때문에 의사 혹은 의료 전문가가 영상을 판독하는데 많은 시간과 노력이 소모되고 있다. 본 논문의 목적은 캡슐내시경 영상의 판독에서 모든 환자에 대해 공통으로 수행되고, 판독하는 데 많은 시간을 차지하는 위장관 랜드마크를 찾는 것에 있다. 이를 위해, 위장관 랜드마크를 식별할 수 있는 CNN 학습 모델을 설계하였으며, 더욱 효과적인 학습을 위해 전처리 과정으로 학습에 방해가 되는 학습 노이즈 영상들을 제거하고 위장관 랜드마크 별 특징 분석을 진행하였다. 총 8명의 환자 데이터를 가지고 학습된 모델에 대해 평가 및 검증을 진행하였는데, 무작위로 환자 데이터를 샘플링하여 학습한 모델을 평가한 결과, 평균 정확도가 95% 가 확인되었으며 개별 환자별로 교차 검증 방식을 진행한 결과 평균 정확도 67% 가 확인되었다.

Keywords