디지털융복합연구 (Journal of Digital Convergence)
- 제10권11호
- /
- Pages.383-387
- /
- 2012
- /
- 2713-6434(pISSN)
- /
- 2713-6442(eISSN)
DOI QR Code
인보이스 서류 영상의 테이블 헤더 문자 분류를 통한 구매 정보 추출 모델
Purchase Information Extraction Model From Scanned Invoice Document Image By Classification Of Invoice Table Header Texts
- 신현경 (가천대학교 수학정보학과)
- 투고 : 2012.11.12
- 심사 : 2012.12.10
- 발행 : 2012.12.31
초록
스캔된 인보이스에 특화된 서류 관리 자동화 시스템 구축에있어서 추출된 금전적 데이터의 정확도에대한 엄격한 요구는 인보이스 테이블을 위한 발생적 모델 설계에서 자체 인증 절차를 포함하는 것을 필요로 한다. 가격 = 단가
Development of automated document management system specified for scanned invoice images suffers from rigorous accuracy requirements for extraction of monetary data, which necessiate automatic validation on the extracted values for a generative invoice table model. Use of certain internal constraints such as "amount = unit price times quantity" is typical implementation. In this paper, we propose a noble invoice information extraction model with improved auto-validation method by utilizing table header detection and column classification.
키워드