DOI QR코드

DOI QR Code

Line Tracking Algorithm for Table Structure Analysis in Form Document Image

양식 문서 영상에서 도표 구조 분석을 위한 라인 추적 알고리즘

  • Received : 2021.11.30
  • Accepted : 2021.12.20
  • Published : 2021.12.31

Abstract

To derive grid lines for analyzing a table layout, line image enhancement techniques are studying such as various filtering or morphology methods. In spite of line image enhancement, it is still hard to extract line components and to express table cell's layout logically in which the cutting points are exist on the line or the tables are skewing . In this paper, we proposed a line tracking algorithm to extract line components under the cutting points on the line or the skewing lines. The table document layout analysis algorithm is prepared by searching grid-lines, line crossing points and gird-cell using line tracking algorithm. Simulation results show that the proposed method derive 96.4% table document analysis result with average 0.41sec processing times.

도표로 작성된 양식 문서에서 도표의 레이아웃 해석에 필요한 그리드 라인을 추출하기 위해 다양한 필터링 또는 모폴로지 등의 방법을 사용하여 직선 성분을 선명하게 개선시키기 위한 연구들이 많이 진행되고 있다. 도표의 직선 성분을 선명화하더라도 직선 내부에 절단 점들이 존재하거나 기울어진 경우에는 직선 추출이 어렵고 도표 셀들의 레이아웃을 논리적으로 표현하는데 여전히 어려움을 겪을 수 있다. 본 연구에서는 직선에 절단점들이 존재하거나 기울어져도 직선을 검출할 수 있는 라인 추적 알고리즘을 제안하였다. 이를 이용하여 그리드 라인을 추출하고 라인들의 교차점 및 셀 정보들을 찾아 도표의 구조를 분석할 수 있는 알고리즘을 마련하였다. 제안한 알고리즘을 실제 양식 문서 영상을 대상으로 실험한 결과 평균 0.41초 처리시간에 96.4%의 도표 구조를 분석할 수 있음을 확인하였다.

Keywords

Acknowledgement

본 연구는 산업통상자원부와 한국산업기술진흥원의 "지역혁신클러스터육성(R&D, P0015279_산업 현장 내 맞춤형 AI 서비스를 위한 지능형 플랫폼 개발 및 실증운영)" 사업의 지원을 받아 수행된 연구결과임

References

  1. X. Liang, A. Cheddad and J. Hall, " Comparative Study of Layout Analysis of Tabulated Historical Documents", Big Data Research, pp.1-13, Vol. 24, 2021. DOI: https://doi.org/10.1016/j.bdr.2021.100195
  2. Y. Yoon, K. Ban, H. Yoon and J. Kim, "Automatic Container Code Recognition from Multiple Views", ETRI Journal|, pp. 767-775, Vol. 38, Issue 4, 2016. https://www.koreascience.or.kr/article/JAKO201671261180459.page
  3. B. Couasnon and A. Lemaitre, "Recognition of Tables and Forms", pp.646-699, Handbook of Document Image Processing and Recognition, 2014. https://hal.inria.fr/hal-01087230
  4. P. Rege, C. Chanchal and A. Chandrakar, "Text-Image Separation in Document Images using Boundary/Perimeter Detection", J. of Signal Image Processing, pp.29-35, Vol. 4, 2013. https://ia600609.us.archive.org/1/items/indexing_theides_1044/1044.pdf
  5. D. Nazir, K. Hashmi, A. Pagani, M. Liwicki, D. Striker and M. Afzal, "HybridTabNet: Towards Better Table Detection in Scanned Document Images", Applied Science, pp.1-22, 2021. DOI: https://doi.org/10.3390/app11188396
  6. D. Burdick, M. Danilevsky, A. Evmievski, Y. Katsis, and N. Wang,"Table Extraction and Understanding for Scientific and Enterprise Application", PVLDB, Vol. 13, No, 12, pp.3433-3436, 2020.
  7. T. Nguyen, A. Doucet and M. Coustaty, "Enhancing Table of Contents Extraction by System Aggregation", The 14th IAPR International Conference on Document Analysis and Recognition, pp.242-247, 2017.
  8. D. Tran, T. Tran, A. Oh, S. Kim and I. Na, "Table Detection from Document Image using Vertical Arrangement of Text Blocks", International Journal of Contents, pp.77-85, Vol. 11, No. 4, 2015. https://doi.org/10.5392/IJoC.2015.11.4.077
  9. S. Perantonis, B. Gatos and N. Papamarkos, "Block decomposition and segmentation for fast Hough transform evaluation", pp.811-824, Vol. 32, 1999. https://users.iit.demokritos.gr/~bgat/BHT.pdf https://doi.org/10.1016/S0031-3203(98)00125-3
  10. L. Tong, H. Zhao, Q. Peng, G. Zhan and Y. LI, "Document Image Skew Correction Method based on Characteristic Sample Point Detection and Hough Transform", Journal of Convergence Information Technology, pp.576-584, Vol. 7, No. 22, 2012. https://www.semanticscholar.org/paper/Document-Image-Skew-Correction-Method-based-on-and-Tong-Zhao/d8f03ec797f551660d741bfb479adfcbc341dbac https://doi.org/10.4156/jcit.vol7.issue22.68