Table Detection in Chemical Documents Using Cascade Mask R-CNN

Cascade Mask R-CNN을 이용한 화학 문서 내 표 검출

  • Kwon, Junhyeong (Department of ECE, INMC, Seoul National University) ;
  • Cho, Nam Ik (Department of ECE, INMC, Seoul National University)
  • 권준형 (서울대학교 전기정보공학부 뉴미디어통신공동연구소) ;
  • 조남익 (서울대학교 전기정보공학부 뉴미디어통신공동연구소)
  • Published : 2021.11.26

Abstract

본 논문은 화학 문서 내에 존재하는 표를 검출하는 문제를 다룬다. 우선 문서에서 표가 있을 만한 영역만을 남긴 후, 객체 검출 분야에서 좋은 성능을 보이는 Cascade Mask R-CNN을 이용하여 화학 문서 내 표 검출을 수행하였다. 더 나아가 감마 보정과 스캔 잡음을 이용하여 학습 데이터를 증강함으로써 다양한 스타일의 표들을 강인하게 검출할 수 있도록 하였다. 합성 화학문서와 실제 화학 문서에 대해 제안한 방법을 적용하여 표 검출 성능을 측정하였다.

Keywords

Acknowledgement

이 논문은 2021년도 정부(과학기술정보통신부)의 재원으로 한국연구재단의 지원(2021R1A2C2007220)과 LG AI연구원의 지원을 받아 수행된 연구임.