DOI QR코드

DOI QR Code

Printed Hangul Recognition with Adaptive Hierarchical Structures Depending on 6-Types

6-유형 별로 적응적 계층 구조를 갖는 인쇄 한글 인식

  • 함대성 (전북대학교 전자정보공학부 컴퓨터공학) ;
  • 이득용 (전북대학교 전자정보공학부 컴퓨터공학) ;
  • 최경웅 (전북대학교 전자정보공학부 컴퓨터공학) ;
  • 오일석 (전북대학교 전자정보공학부 컴퓨터공학)
  • Published : 2010.01.28

Abstract

Due to a large number of classes in Hangul character recognition, it is usual to use the six-type preclassification stage. After the preclassification, the first consonent, vowel, and last consonent can be classified separately. Though each of three components has a few of classes, classification errors occurs often due to shape similarity such as 'ㅔ' and 'ㅖ'. So this paper proposes a hierarchical recognition method which adopts multi-stage tree structures for each of 6-types. In addition, to reduce the interference among three components, the method uses the recognition results of first consonents and vowel as features of vowel classifier. The recognition accuracy for the test set of PHD08 database was 98.96%.

한글 인식은 부류 수가 많다는 특성을 가지며 이 특성으로 인해 6-유형으로 사전 분류하는 것이 일반적이다. 사전 분류 후 각 유형들은 초성, 중성, 종성으로 분리하여 인식할 수 있다. 초성, 중성, 종성 각각은 부류의 수는 적지만 'ㅔ', 'ㅖ', 과 같이 서로간의 유사도가 높아 오 인식 되는 경우가 종종 발생한다. 따라서 본 논문에서는 6-유형 각각에 대해 다단계 트리 구조를 가진 계층적 인식 방법을 제안 하였다. 또한 초성, 중성, 종성의 서로 간의 간섭을 줄이기 위해, 초성과 종성의 인식 결과를 중성 분류기의 특징으로 사용하였다. PHD08 데이터베이스의 테스트 집합에 대해 98.96%의 정확률을 보였다.

Keywords

References

  1. 정인숙, 오일석, “분산맵을 이용한 웹 이미지 텍스트 영역 추출,” 한국콘텐츠학회논문집, 제9권, 제9호, pp.68-79, 2009.
  2. 이주근, “한글 문자의 인식에 관한 연구,” 전자공학회지, 제9권, 제4호, pp.35-32, 1972.
  3. http://www.kssn.net/
  4. 최환수, 정동철, 공성필, “잡영과 왜곡이 심한 한글 문자의 자소분리 및 인식에 관한 연구”, 한국통신학회논문집, 제22권, 제6호, pp.1160-1169, 1997.
  5. 김민기, 권오성, 권영빈, “모음의 구조적 형태와 조합 규칙에 충실한 한글 문자의 유형 분류”, 정보과학회논문지, 제25권, 제4호, pp.685-695, 1998.
  6. 이판호, 장희동, 남궁재찬, “동적자소분할과 신경망을 이용한 인쇄체 한글 문자인식에 관한 연구”, 한국통신학회논문지, 제19권, 제11호, pp.2133-2146, 1994.
  7. 김병기, “유형의 상대적 크기를 고려한 한글문자의 유형 분류”, 컴퓨터정보학회논문지, 제11권, 제6호, pp.99-106, 2006.
  8. 이성훈, 조규태, 김진식, 김진형, 정철곤, 김상균, 문영수, 김지연, “저해상도 인쇄체 한글 영상 인식을 위한 자소 분할 방법”, 한국컴퓨터종합학술대회 논문집, 제33권, 1호, pp.382-384, 2006.
  9. 홍순재, 김백섭, “신경망을 이용한 인쇄체 한글의 자소 분리 및 인식”, 한국정보과학회논문집, 제23권, 제1호, pp.285-288, 1996.
  10. 조성배, 김진형, “인쇄체 한글문자의 인식을 위한 계층적 신경망”, 한국정보과학회 논문지, 제17권, 제3호, pp.306-316, 1992.
  11. 이진수, 권오준, 방승양, “개선된 자소 인식 방법을 통한 고인식률 인쇄체 한글 인식”, 정보과학회 논문지, 제23권, 제8호, 1996.
  12. 임길택, 김호연, “문자형식 분류 기반의 인쇄체 문자인식에 관한 연구”, 전자공학회논문집, 제40권, 제5호, pp.266-279, 2003.
  13. 오일석, Ching Y.Suen, “광학 문자 인식을 위한 거리 특징”, 정보과학회논문지, 제25권, 제7호, pp.1028-1043, 1998.
  14. 함대성, 이득용, 정인숙, 오일석, “한글 문자 데이터베이스 PHD08 구축”, 한국컨텐츠학회논문지, 제11권, 제8호, 2008.
  15. http://cv.chonbuk.ac.kr/
  16. http://ai.kaist.ac.kr/
  17. I. S. Jung, D. S. Ham, D. R. Lee, and I. S. Oh, "Two-Level Text Segmentation from Web Document Images based on Variance Analysis," Korea and Japan Joint Workshop on Pattern Recognition, pp.107-108, 2008.