Table Structure Recognition using Borderline Heatmap Regression

딥러닝 기반의 표 경계선 히트맵 회귀를 이용한 표의 구조 인식

  • Lee, EunJi (Department of ECE, INMC, Seoul National University) ;
  • Park, Jaewoo (Department of ECE, INMC, Seoul National University) ;
  • Koo, Hyung Il (Department of ECE, Ajou Univiersity) ;
  • Cho, Nam Ik (Department of ECE, INMC, Seoul National University)
  • 이은지 (서울대학교 전기정보공학부 뉴미디어통신공동연구소) ;
  • 박재우 (서울대학교 전기정보공학부 뉴미디어통신공동연구소) ;
  • 구형일 (아주대학교 전자공학과) ;
  • 조남익 (서울대학교 전기정보공학부 뉴미디어통신공동연구소)
  • Published : 2021.11.26

Abstract

본 논문에서는 딥러닝을 기반으로 문서영상에서 표 안의 셀 경계선을 히트맵 회귀(heatmap regression)로 추정함으로써 표의 구조를 인식하는 방법을 제안한다. 표는 기본적으로 행과 열로 이루어져 있기 때문에, 제안하는 방법에서는 먼저 1 차원 벡터 형태로 세로/가로 방향의 행/열 경계선 위치를 찾고, 이에 병합된 셀을 처리하기 위해 경계선이 그어져야 할 위치를 2 차원으로 추정한 결과를 적용하여 온전한 표의 경계선을 구한다. 이러한 구조를 통해 제안하는 방법은 표의 행과 열에 대한 정보를 효과적으로 이용함과 동시에, 복잡한 후처리 없이 병합된 셀을 처리할 수 있는 이점을 보인다. 실험은 1 차원의 행/열 경계선 위치를 반영하는 두 가지 방식에 대해 PubTabNet[11]에 대해 진행하여 결과를 보였다.

Keywords

Acknowledgement

이 논문은 2021 년도 BK21 FOUR 정보기술 미래인재교육연구단 및 LG AI 연구원의 지원을 받아 이루어졌음.