• 제목/요약/키워드: Printed Korean characters recognition

검색결과 44건 처리시간 0.022초

웨이브릿 변환과 모멘트를 이용한 문자인식에 관한 연구 (A Study on Character Recognition using Wavelet Transformation and Moment)

  • 조민환
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권10호
    • /
    • pp.49-57
    • /
    • 2010
  • 본 논문에서는 웨이브릿 변환을 이용한문자인식 방법 중 문자의 최소 단위인자음과 모음을 분리시켜 문자의 모멘트를 분석하여 산출되는 정보를 사전에 컴퓨터에 입력시켜 문서화된 수기 문자를 컴퓨터에 저장하고 인식시키는 방법에 접근 하였다. 연구는 획득한 문장 이미지에서 잡음을 없애고 줄 단위로 분리, 분리된 줄 단위 문장은 한 문자 단위로 다시 분리된 후 자음과 모음으로 분리 하였다. 분리된 자소는 CVIPtools를 사용하여 히스토그램 평활화와 침식 및 평균값 필터를 처리한 후 C++를 이용하여 세선화 처리하고 세선화된 자소는 팽창 및 크기 변환하여 모든 자소가 동일 굵기, 크기 이미지로 만들었다. 표준화 이미지는 이진화 이미지로 변환하여 3단계 웨이브릿 변환을 이용하여 데이터의 양을 1/64로 줄인 후 해밍거리를 조사하였다. 연구 결과 다양한 'ㄱ'상호간 및 'ㅅ'상호간의 일치도는 매우 높게 나타났고, 서로 상이한 'ㄱ'과 'ㅅ'을 비교 했을 때 상호간 일치도가 매우 낮게 나옴을 알 수 있었다. 이 연구 결과로 더 많은 수기 자소들에 대한 해밍거리조사가 이루어지면 각각의 자음과 모음의 모멘트 구분하여 수기 문자 인식에 중요한 정보를 알 수 있을 것으로 판단된다.

영상처리기술을 이용한 핵 연료봉 문자 자동인식시스템 개발 (Development of Automatic Nuclear Fuel Rod Character Recognition System Based on Image Processing Technique)

  • Woong Ki Kim;Yong Bum Lee;Jong Min Lee;Sung IL Chien
    • Nuclear Engineering and Technology
    • /
    • 제25권3호
    • /
    • pp.424-429
    • /
    • 1993
  • 핵연료 소결체가 장전되는 핵연료봉의 끝부분에는 각각의 핵연료봉을 구분해주는 고유의 문자가 인쇄되어 있다. 핵연료 집합체 제조 과정에서 각각의 핵연료봉은 고유 문자에 의해 구분되어 체계적으로 관리되고 있으며 아울러 핵연료 연소 이상상태 감시 및 사용후 핵연료 검사 분야에서 핵연료봉 제조과정 추적에 이용되고 있다. 핵연료봉 문자 자동인식은 핵연료 집합체 제조과정의 자동화를 위한 핵심 기술이다. 본 연구에서는 핵연료봉 문자인식 시스템을 개발하여, 핵 연료봉단에 기록된 각 문자로 부터 추출한 메쉬 특징값을 데이타베이스에 저장된 특정 문자의 특징값과 비교하여 자동으로 문자인식을 수행하도록 하였다. 실험 결과, 95.83 퍼센트의 양호한 인식률을 기록하였다.

  • PDF

IDMLP를 이용한 한자인식에 관한 연구 (A Study for the Chinese Character Recognition Using IDMLP)

  • 려진경;이우일;정호선
    • 전자공학회논문지B
    • /
    • 제28B권10호
    • /
    • pp.783-789
    • /
    • 1991
  • A learing method for the recognition of printed Chinese character by using the input driven multi-layer perceptron model was proposed and the circuit representing the learning result was designed. In learning the extracted features from Chinese characters are used as inputs and the synapse's weight is integer value. So it is possible to implement the learning result with CMOS circuit.

  • PDF

오프라인 인쇄체 문장부호, 일본 문자, 영문자, 한자 인식에서의 오인식 문자 교 정에 관한 연구 (A study on the Character Correction of the Wrongly Recognized Sentence Marks, Japanese, English, and Chinese Character in the Off-line printed Character Recognition)

  • 이병희;김태균
    • 한국정보처리학회논문지
    • /
    • 제4권1호
    • /
    • pp.184-194
    • /
    • 1997
  • 최근 상용 오프라인 문자 인식시스템들이 계속 발표되고 있다. 본 눈문에서는 적 은 메모리와 빠른 시간내에 검색이 가능한 자기조직화 구조를 가진 단어 사전을 구축 하고 검색하는 알고리즘을 제시하며 오프라인 문자 인식 시스템을 이용하여 오인식 교정의 측면에서 문장부호, 영문자, 한자를 인식한 후에 나온 오인식된 문자들을 수 집하여 오인식 형태를 제분류하였다. 영문자에 대해서는 영문자의 오인식 형태와 오 인식의 예들을 조사하고 오인식이 자주 일어나는 글자에 대해 오인식 혼동 테이블을 작성하였으며 25,145개의 영어 단어가 입력된 자기조직화된 영어 단어 사전을 가지고 교정을 행하여 0.5%의 인식률 향상을 가져왔다. 한자에 대해서도 영문자와 마찬가지 로 오인식 행태를 조사하고 혼동 테이블을 작성하였으며 34,593개의 단어가 입력된 자기조직화된 한자 단어 사전을 이용하여 교정을 행하여 인식률을 6.1% 향상시켰다.

  • PDF

인쇄체 한글 문자 인식에 관한 연구 (The Recognition of Printed HANGUL Character)

  • 장승석;장동식
    • 대한산업공학회지
    • /
    • 제17권2호
    • /
    • pp.27-37
    • /
    • 1991
  • A recognition algorithm for Hangul is developed by structural analysis to Hangul in this theses. Four major procedures are proposed : preprocessing, type classification, separation of consonant and vowel, recognition. In the preprocessing procedure, the thinning algorithm proposed by CHEN & HSU is applied. In the type classification procedure, thinned Hangul image is classified into one of six formal types. In the separation of consonant and vowel procedure, starting from branch-points which are existed in a vowel, character elements are separated by means of tracing branch-point pixel by pixel and comparison with proposed templates. In the same time, the vowels are recognized. In the recognition procedure, consonants are extracted from the separated Hangul character and recognized by modified Crossing method. Recognized characters are converted into KS-5601-1989 codes. The experiments show that correct recognition rate is about 80%-90% and recognition speed is about 2-3 character persecond in three types of different input data on computer with 80386 microprocessor.

  • PDF

인쇄체 영문의 구문론적 인식 (A CHARACTER RECOGNITION SYSTEM BASED ON SYNTACTIC APPROACH)

  • 박동춘;박성한
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1987년도 전기.전자공학 학술대회 논문집(II)
    • /
    • pp.1598-1601
    • /
    • 1987
  • This paper proposes a new set of topological features (primitives) for use with a syntactic recognizer for high-accuracy recognition of printed alphanumeric characters. The recognition is accomplished on nine character groups, where each group has different combinations of four feature points. A skeleton enhancement eliminating isolated points and smoothing irregular points is developed. The tree automata processed in parallel enables the realization of high-recognition speeds and font-type independent recognition. The proposed character recognition system is tested for alphanumeric character fonts of dot matrix printer and plotter using IBM-PC/XT.

  • PDF

Optical Font Recognition For Printed Korean Characters Using Serif Pattern of Strokes

  • Kim, Soo-Hyung;Kim, Sam-Soo;Kwag, Hee-Kue;Lee, Guee-Sang
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 ITC-CSCC -2
    • /
    • pp.916-919
    • /
    • 2002
  • This paper introduces the problem of typeface classification of Hangul characters and proposes features for typeface classification among Serif and Sans-serif classes. Serif classes have a small decorative stroke around the beginning of vertical strokes, while Sans-serif classes have no serif. Therefore, the serif part is first segmented from the vertical strokes, and the direction of the serif is computed as the feature for Hangul typeface identification. To evaluate the performance of the proposed system, we used 3,000 characters extracted from Korean documents - 1,500 from Serif fonts, other 1,500 from Sans-serif fonts.

  • PDF

방향 투영에 의한 인쇄체 한글의 기본 선소 추출에 관한 연구 (A Study on Primitive Segments Extraction from Printed Korean Characters by means of a Directional Projection)

  • 김상운;이병래;이규원;박규태
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1987년도 전기.전자공학 학술대회 논문집(II)
    • /
    • pp.1100-1103
    • /
    • 1987
  • In this paper, we report a method for the primitive segments extraction from printed Korean characters without thinning as a preliminary stage to design an efficient recognition system. The primitive segments are defined by fundamental subpatterns which are vertical(I), right sloping(/), left. sloping(\). horizontal(-), and circular segment(o). The circular segment among the five kinds of segment is different from the others in geometrical properties. Therefore, at first, the circular segment is extracted by using the closed circle of the inner boundary and the geometrical characteristics of its outer. Next, linear segments are separated from the character pattern by means of a directional coding method. Finally, primitive segments are extracted from each set of linear segments by using a projection profile which involves the fact whether the segment has branches or not. The experimental results show that this method reduces computation time and storage space in comparision with the existing methods.

  • PDF

텍스트와 그래픽으로 구성된 혼합문서 인식에 관한 연구 (A Study on the Recognition of Mixed Documents Consisting of Texts and Graphic Images)

  • 함영국;김인권;정홍규;박래홍;이창범;김상중;윤병남
    • 전자공학회논문지B
    • /
    • 제31B권7호
    • /
    • pp.76-90
    • /
    • 1994
  • In this paper, an efficient algorithm is proposed which recognizes the mixed document consisting of the printed Korean/alphanumeric texts and graphic images. In the preprocessing step an input document is aligned if necessary by rotating it. We obtain the rotation angle using the Hough transform and align the input document horizontally. Then we separate graphic image parts from text parts by considering chain codes of connected components. We further separate each character using vertical and horizontal projections. In the recognition step Korean and alphanumeric characters are classified and each of them is recognized hierarchically using several features. In summary an efficient recognition algorithm for mixed documents is proposed and its performance is demonstrated via computer simulations.

  • PDF

인쇄체 한글의 광학적 인식을 위한 다중 MACE 필터의 합성 (Synthesis of Multiplexed MACE Filter for Optical Korean Character Recognition)

  • 김정우;김철수;배장근;도양회;김수중
    • 한국통신학회논문지
    • /
    • 제19권12호
    • /
    • pp.2364-2375
    • /
    • 1994
  • 효율적인 인쇄체 한글 인식을 위하여 다중 최소평균 상관 에너지 필터를 제안하였다. 제안된 방법은 기존의 나무구조 알고리듬의 단점인 인식시스템의 방대함과 인식방법의 복잡함을 해결하였다. 오직 하나의 자음 MMACE 필터와 모음 MMACE 필터를 사용하여 완전한 한글을 인식하였다. 각 MMACE 필터는 24개의 자모음으로 합성된 4개의 K-tuple MACE 필터를 이용하여 다중화시켰다. 따라서 제안된 MMACE 필터의 필터평면과 상관분포 평면은 4개의 부평면으로 나누어 진다. 각 상관분포 부평면으로 한글 인식을 위한 코드를 얻었다. 얻어진 코드와 컴퓨터에 내장된 자모음을 인식하기 위한 진리표와 비교하였다. 일치하는 코드의 해당자모음을 찾아 출력상관평면상의 상관첨두 위치에 치환하면 완전한 한글을 인식할 수 있다. 컴퓨터 시뮬레이션과 광 실험을 통하여 제안된 MMACE 필터를 이용한 한글 인식 시스템의 높은 변별력을 확인하였다.

  • PDF