DOI QR코드

DOI QR Code

지능형 OCR 시스템을 위한 한글 필기체 생성 및 분류 모델에 관한 연구

A Study on Hangul Handwriting Generation and Classification Mode for Intelligent OCR System

  • 백진성 (망고클라우드(주)) ;
  • 서지윤 (동서대학교 산학협력단) ;
  • 정상중 (동서대학교 인공지능응용학과) ;
  • 정도운 (동서대학교 인공지능응용학과)
  • Jin-Seong Baek (MangoCloud Inc.,) ;
  • Ji-Yun Seo (Industry-Academic Cooperation Foundation, Dongseo University) ;
  • Sang-Joong Jung (Dept. Applied Artificial Intelligence, Dongseo University) ;
  • Do-Un Jeong (Dept. Applied Artificial Intelligence, Dongseo University)
  • 투고 : 2022.12.01
  • 심사 : 2022.12.15
  • 발행 : 2022.12.31

초록

본 논문에서는 다양한 산업분야에 적용 가능한 딥러닝 알고리즘 기반의 한글 필기체 생성 및 분류 모델을 구현하였다. 구현된 GAN 기반의 한글 필기체 생성 모델과 CNN 기반의 한글 필기체 분류 모델 2가지로 구성되어 있다. GAN 모델은 가짜 한글 필기체 데이터를 생성하기 위한 생성자 모델과 가짜 필기체 데이터를 판별하기 위한 판별자 모델로 구성된다. CNN 모델의 경우 'PHD08' 데이터세트를 활용하여 모델의 학습을 수행하였으며, 학습 결과 92.45% 정확도로 한글 필기체를 분류하는 것을 확인하였다. 구현된 GAN 모델을 통해 생성된 한글 필기체 데이터를 기존 CNN 모델의 학습 데이터세트와 통합하여 분류 모델의 성능평가를 진행한 결과 96.86%로 기존 분류 성능보다 우수하게 나타남을 확인하였다.

In this paper, we implemented a Korean text generation and classification model based on a deep learning algorithm that can be applied to various industries. It consists of two implemented GAN-based Korean handwriting generation models and CNN-based Korean handwriting classification models. The GAN model consists of a generator model for generating fake Korean handwriting data and a discriminator model for discriminating fake handwritten data. In the case of the CNN model, the model was trained using the 'PHD08' dataset, and the learning result was 92.45. It was confirmed that Korean handwriting was classified with % accuracy. As a result of evaluating the performance of the classification model by integrating the Korean cursive data generated through the implemented GAN model and the training dataset of the existing CNN model, it was confirmed that the classification performance was 96.86%, which was superior to the existing classification performance.

키워드

과제정보

본 연구는 교육부의 재원으로 한국연구재단의 지원을 받아 수행된 기초연구(No.2018R1D1A1B07045337) 사업 및 중소벤처기업부의 산학연 collabo R&D 사업(S3247582)에 의해 지원된 연구 결과물임을 밝힙니다.

참고문헌

  1. S. R. Zanwar, U. B. Shinede, A. S. Narote, S. P. Narote, "Hybrid Optimization And Effectual Classification For High Recognitions In OCR Systems", Journal of The Institution of Engineers, Vol.102, Iss.5, pp.966-977, 2021.
  2. A. Keipour, M. Eshghi, S. M. Ghadikolaei, N. Mohammadi, S. Ensafi, "Omnifont Persian OCR system using primitives", arXiv preprint arXiv:2202.06371, 2022.
  3. N. H. Imam, V. G. Vassilakis, D. Kolovos, "OCR post-correction for detecting adversarial text images", Journal of Information Security and Applications, Vol. 66, pp. 103170, 2022.
  4. F. K. Dankar, M. Ibrahim, "Fake it till you make it: Guidelines for effective synthetic data generation", Applied Sciences, Vol.11, Iss.5, pp.2158, 2021.
  5. K. Chaitanya, N. Karani, C. F. Baumgartner, E. Erdil, A. Becker, O. Donati, E. Konukoglu, "Semi-supervised task-driven data augmentation for medical image segmentation", Medical Image Analysis, Vol.68, pp.101934, 2021.
  6. T. Zhou, Q. Li, H. Lu, Q. Cheng, X. Zhang, "GAN review: Models and medical image fusion applications", Information Fusion, Vol.91, pp.134-148, 2023. https://doi.org/10.1016/j.inffus.2022.10.017
  7. D. S. Ham, D. R. Lee, I. S. Jung, I. S. Oh, "Construction of printed hangul character database phd08", The Journal of the Korea Contents Association, Vol.8, Iss.11, pp.33-40, 2008.