• 제목/요약/키워드: Hangul Recognition

검색결과 150건 처리시간 0.022초

변형에 의한 필기체 한글의 생성과 이를 이용한 한글 문자인식 시스템의 정량적 평가 (Automatic Generation of Handwritten Hangul Character Images and Its Application to the Evaluation of Hangul Character Recognition Systems)

  • 박상태;방승양
    • 전자공학회논문지B
    • /
    • 제30B권3호
    • /
    • pp.50-59
    • /
    • 1993
  • There is basic problem with the current evaluation method for character recognition systems. The current method evaluates the average recognition rate by applying the test data to the target system. The average recognition rate tells no more than and no less than the overall performance and it depends on the data. In this paper we propose a testing method which will analyze the target system and point out its strong points and weak points. This can be made possible through using the data which are generated cy distorting the standard character images according to a carefully controlled manner. This paper will describe how to automatically generate such distorted images. Also we will show the method is actually effective and useful by applying it to evaluating existing recognition algorithms.

  • PDF

자소간의 흘림을 허용하는 연속형 온라인 필기 인식 시스템의 구현 (Implementation of An On-Line Continuous Recognition System for Cursive Handwriting)

  • 권오성;권영빈
    • 전자공학회논문지B
    • /
    • 제31B권9호
    • /
    • pp.166-177
    • /
    • 1994
  • In this paper, an implemenation of on-line continuous recognizer for cursive Hangul handwriting is explained. For the Hangul recognition system, we propose a high speed string matching. The editing process in our proposed string matching is accomplished by single editing path. And the matching results are stored in a heap structure and we decide the user comfortibility of unceasing writing during recognition owing to the high speed matching. In the experimental result, a recongition rate of 86.36% at 1.75 second/character over 21,076 characters collected from 50 persons are abtained. And it is shown that the proposed recognition system is operated properly for the on-line recognition for cursive handwring between graphemes.

  • PDF

신경망 학습 코드에 따른 오프라인 필기체 한글 인식률 비교 (Comparisons of Recognition Rates for the Off-line Handwritten Hangul using Learning Codes based on Neural Network)

  • 김미영;조용범
    • 전기전자학회논문지
    • /
    • 제2권1호
    • /
    • pp.150-159
    • /
    • 1998
  • 본 논문은 필기체 한글의 특징을 추출한 후 이를 신경망을 이용하여 인식하였다. 한글의 특징 추출을 위해 $5{\times}5$ 윈도우 방법을 사용하였는데, 이는 $3{\times}3$ 윈도우 방법을 수정한 것이다. 추출된 특징을 이진화 코드로 변환하여 신경망의 입력으로 사용하며, 백프로퍼게이션 알고리즘으로 학습시켰다. 수직 모음, 수평모음, 자음 인식을 위한 3개의 신경망을 각각 구성하였고, 결과를 비교하기 위하여 3가지 학습 방법을 사용하였다. 3가지 학습 방법은 고정 코드 방법, 학습 코드 방법 I, 학습 코드 방법 II이고 학습 코드 방법 II가 가장 좋은 결과를 보였다. 이 경우 수직 모음과 수평 모음은 100%의 인식률을, 자음은 93.75%의 인식 결과를 보였다.

  • PDF

퍼지추론을 이용한 한글 문자 인식:최대 길이 투영에 의한 한글 문자 유형 분류 (Hangul Character Recognition Using Fuzzy Reasoning:Hangul Character Type Classification by Maximum Run Length Projenction)

  • 이근수;최형일
    • 인지과학
    • /
    • 제3권2호
    • /
    • pp.249-270
    • /
    • 1992
  • 본 논문은 입력 문자에 대한 특징 추출을 위하여 최대 길이 투영(MRLP:Maximum Run Length Project)방법을 제안한다. 제안된 최대길이 투영 방법은 잡음에 강하며 필요한 정보를 가능한 정확하고 효율적으로 추출하는데 유용하다.한글문자는 그 양이 방대하고 그 구조가 복잡하며 몬자들 사이에 밀접한 유사성이 있다.따라서 본 논문에서는 추출된 특징들에 대한 퍼지추론을 적용하여 유형 분류율의 향상을 도모하였다.사용 빈도수가 높은 인쇄체 한글 문자 917자에 대하여 실험한 결과 98.58%의 분류율을 얻었다.

새로운 한글코드 “Truecode”의 개발과 응용 (The Development of New Hangul Code "Truecode" and Its Applications)

  • 이문형;김기두
    • 전자공학회논문지B
    • /
    • 제30B권5호
    • /
    • pp.43-51
    • /
    • 1993
  • A new Hangul code called Truecode is developed for accomodating to the future computing environments of graphical user interface and multimedia as well as for corresponding with the invention principle of Hangul. Truecode is not a forced two-byte code of syllable unit, as completion-type of combination-type, currently used, but a one byte code of phoneme unit, which can represent initial consonant, vowel, and final consonant each. It is quite different from three-byte code of syllable unit and also does not require the fill code used for three-byte code. We expect great contribution to the Hangul culture from Truecode's some important following features. It can express all the Korean characters we may imagine and does not cause any problem in communication. As well as we may use direct connection font, we can assign ont-to-one correspondence between Truecode and a keyboard with three sets. Truecode has a good advantage in developing application softwares of Hangul and it can nicely be applied to the fields of speech recognition and artificial intelligence using natural language.

  • PDF

필기체 한글의 오프라인 인식을 위한 효과적인 두 단계 패턴 정합 방법 (Efficient two-step pattern matching method for off-line recognition of handwritten Hangul)

  • 박정선;이성환
    • 전자공학회논문지B
    • /
    • 제31B권4호
    • /
    • pp.1-8
    • /
    • 1994
  • In this paper, we propose an efficient two-step pattern matching method which promises shape distortion-tolerant recognition of handwritten of handwritten Hangul syllables. In the first step, nonlinear shape normalization is carried out to compensate for global shape distortions in handwritten characters, then a preliminary classification based on simple pattern matching is performed. In the next step, nonlinear pattern matching which achieves best matching between input and reference pattern is carried out to compensate for local shape distortions, then detailed classification which determines the final result of classification is performed. As the performance of recognition systems based on pattern matching methods is greatly effected by the quality of reference patterns. we construct reference patterns by combining the proposed nonlinear pattern matching method with a well-known averaging techniques. Experimental results reveal that recognition performance is greatly improved by the proposed two-step pattern matching method and the reference pattern construction scheme.

  • PDF

웨이브렛 특징과 순위 기반 인식을 이용한 한글 문서 영상 검색 시스템 (A Hangul Document Image Retrieval System Using Rank-based Recognition)

  • 이득용;김우연;오일석
    • 한국콘텐츠학회논문지
    • /
    • 제5권2호
    • /
    • pp.229-242
    • /
    • 2005
  • 우리는 스캔된 한글 문서 영상에 대한 전문(full-text) 검색 시스템을 구축하였다. 이 시스템은 크게 전처리부, 인식부, 그리고 검색부로 구성되어 있다 검색 알고리즘은 k순위까지의 인식 결과를 이용한다. 이 방법은 검색 성능이 인식 오류에 둔감할 뿐만 아니라, 재현률과 정확률을 사용자가 조절할 수 있는 장점을 갖는다. 객관적인 성능 평가를 위해 KISTI가 제공하는 정보과학회 논문지 영상을 실험에 사용하였다. 인식과 검색 성능을 통하여 시스템이 실용적임을 보였다.

  • PDF

신경회로망을 이용한 온라인 문자 인식 시스템의 자소 분리에 관한 연구 (A Phoneme Separation and Learning Using of Neural Network in the On-Line Character Recognition System)

  • 홍봉화
    • 정보학연구
    • /
    • 제9권1호
    • /
    • pp.55-63
    • /
    • 2006
  • In this paper, a Hangul recognition system using of Kohonen Network in the phoneme separation and learning is proposed. A Hangul consists of phoneme that are consists of strokes. The phoneme recognition and separation are very important in the recognition of character. So, the phonemes which mismatching has been happened are correctly separated through the learning of neural networks. also, learning rate($\alpha$) adjusted according to error, in order to solved that its decreased the number of iteration and the problem of local minimum, adaptively.

  • PDF

공간 위치 변조에 의한 한글자소의 필터링 (On the Filtering of Hangul character Element with the Spatial Positioning Modulation)

  • 강대수;진용옥
    • 한국통신학회논문지
    • /
    • 제17권9호
    • /
    • pp.1029-1039
    • /
    • 1992
  • 본 논문은 한글인식 방법중 주파수 변환영역에서 행하는 필터링의 방법을 제시한 것이다. 한글 문자패턴을 2차원 변조처리하여 공간위치에 의존적인 한글자소의 위상문자적 특징을 주파수 영역으로 사상하였고, 이때 변조 주파수를 정규화함으로서 주파수 영역에서 문자의 크기를 정규화 한다. 또한 한글의 각 자소를 발생위치에 따라 분류하여 표준패턴으로 설정하고, 설정된 각 자소의 표준패턴을 자소필터로 사용하여 주파수 영역으로 사상된 문자패턴을 필터링하였다. 한글자소의 분별 파라미터로는 정규화된 상호상관함수와 필터링 결과로 부터 유도된 코히어런스 함수를 산출하여 분별기준을 설정하였으며, 그 결과로서 문자크기의 변화, 자소의 융착, 제한적인 자획의 유실이나 잡음의 혼입등의 요인이 발생하였음 경우에도 한글자소의 분별이 가능하였고 또한 표준패턴을 설정함에 따라 숫자, 영문자등의 분별에도 적용할 수 있었다.

  • PDF

한글 문자 데이터베이스 PHD08 구축 (Construction of Printed Hangul Character Database PHD08)

  • 함대성;이득용;정인숙;오일석
    • 한국콘텐츠학회논문지
    • /
    • 제8권11호
    • /
    • pp.33-40
    • /
    • 2008
  • 문자 인식의 응용이 형식 문서의 인식 같은 고전적인 영역을 벗어나 웹 문서나 자연 영상의 문자 인식으로 확장되고 있다. 이러한 새로운 응용에서는 명조나 고딕같은 표준 글꼴뿐만 아니라 다양한 모양의 글꼴을 사용하는 것이 보편적이다. 기존의 데이터베이스들은 주로 표준 글꼴을 대상으로 제작되어 새로운 응용에 사용하는데 한계를 안고 있다. 본 논문에서는 완성형 2350자 각각을 대상으로 9종류의 글꼴에 대해 글꼴 크기, 품질, 해상도를 달리하여 243개의 이미지 샘플을 생성하였다. 또한 이들 샘플 각각에 대해 이진 임계치와 회전 각도를 달리하여 변형된 샘플을 얻었다. 이러한 과정으로 각 글자마다 2,187개의 샘플을 생성하였으며, 총 5,139,450개의 샘플을 갖는 인쇄체 한글 데이터베이스를 구축하였다. 데이터베이스에 대한 특성과 상용 OCR 소프트웨어에 대한 인식 성능 등을 제시한다.