DOI QR코드

DOI QR Code

A Study on Character Recognition using Wavelet Transformation and Moment

웨이브릿 변환과 모멘트를 이용한 문자인식에 관한 연구

  • 조민환 (창원전문대학 메카트로닉스과)
  • Received : 2010.08.11
  • Accepted : 2010.09.01
  • Published : 2010.10.31

Abstract

In this thesis, We studied on hand-written character recognition, that characters entered into a digital input device and remove noise and separating character elements using preprocessing. And processed character images has done thinning and 3-level wavelet transform for making normalized image and reducing image data. The structural method among the numerical Hangul recognition methods are suitable for recognition of printed or hand-written characters because it is usefull method deal with distortion. so that method are applied to separating elements and analysing texture. The results show that recognition by analysing texture is easily distinguished with respect to consonants. But hand-written characters are tend to decreasing successful recognition rate for the difficulty of extraction process of the starting point, of interconnection of each elements, of mis-recognition from vanishing at the thinning process, and complexity of character combinations. Some characters associated with the separation process is more complicated and sometime impossible to separating elements. However, analysis texture of the proposed character recognition with the exception of the complex handwritten is aware of the character.

본 논문에서는 웨이브릿 변환을 이용한문자인식 방법 중 문자의 최소 단위인자음과 모음을 분리시켜 문자의 모멘트를 분석하여 산출되는 정보를 사전에 컴퓨터에 입력시켜 문서화된 수기 문자를 컴퓨터에 저장하고 인식시키는 방법에 접근 하였다. 연구는 획득한 문장 이미지에서 잡음을 없애고 줄 단위로 분리, 분리된 줄 단위 문장은 한 문자 단위로 다시 분리된 후 자음과 모음으로 분리 하였다. 분리된 자소는 CVIPtools를 사용하여 히스토그램 평활화와 침식 및 평균값 필터를 처리한 후 C++를 이용하여 세선화 처리하고 세선화된 자소는 팽창 및 크기 변환하여 모든 자소가 동일 굵기, 크기 이미지로 만들었다. 표준화 이미지는 이진화 이미지로 변환하여 3단계 웨이브릿 변환을 이용하여 데이터의 양을 1/64로 줄인 후 해밍거리를 조사하였다. 연구 결과 다양한 'ㄱ'상호간 및 'ㅅ'상호간의 일치도는 매우 높게 나타났고, 서로 상이한 'ㄱ'과 'ㅅ'을 비교 했을 때 상호간 일치도가 매우 낮게 나옴을 알 수 있었다. 이 연구 결과로 더 많은 수기 자소들에 대한 해밍거리조사가 이루어지면 각각의 자음과 모음의 모멘트 구분하여 수기 문자 인식에 중요한 정보를 알 수 있을 것으로 판단된다.

Keywords

References

  1. 길문호, 유기형, 곽훈성, "웨이브렛 변환을 이용한 필기체 한글문자의 세선화알고리즘," 전자공학회 하계종합학술 논문집, 745-748쪽, 1998년.
  2. 이성환, "문자인식 이론과 실제," 홍능과학출판사, 27-31쪽, 1993년.
  3. 이영석, 김석광, "OCR의 기술 동향 및 인식 기술," 기술 정보 시리즈, 제 21권, 1988년.
  4. 박창순, "오프라인 필기체 한글 및 숫자 인식에 관한 연구," 박사학위논문, 동아대학교, 1996년
  5. 조민환, "HMM을 이용한 수기숫자 인식에 관한연구," 한국컴퓨터정보학회 논문집, 제 9권, 제 3호, 121-125쪽, 2004년 9월.
  6. E. Trupin and Y. Lecourtier, "A modified contour following algorithm applied to document segmentation," 11th LAPR, International Conference on Pattern Recognition, The Hauge, The Nethelands, 1992년8월.
  7. Rafael C. Gonzalez, Richard E. Woods, "Digital Image Processing," New Jersey: Pearson Books, 2008.
  8. D. Wang and S. Srihari, "Classification of newspaper image blocks using texture analysis," Computer Vision Graphics, and Image Processing, pp. 327-352, 1989.
  9. S. G. Mallat, "A theory for multiresolution signal decomposition: The wavelet representation," IEEE trans. PAMI, vol.11, pp. 674-693, July 1989. https://doi.org/10.1109/34.192463
  10. L. O. Gorman, "Binarization and multithresholding of document images using connectivity," CVGIP: Graphical models and image processing, vol.56, no.6, pp. 494-506, 1994 https://doi.org/10.1006/cgip.1994.1044

Cited by

  1. 윈도우 기반의 광학문자인식을 이용한 영상 번역 시스템 구현 vol.5, pp.2, 2019, https://doi.org/10.20465/kiots.2019.5.2.015