• Title/Summary/Keyword: classification of Korean characters

Search Result 247, Processing Time 0.023 seconds

대용량 필기 문자인식을 위한 최소거리 분류법의 성능 개선 전략 (Performance Improvement Strategies on Minimum Distance Classification for Large-Set handwritten Character Recognition)

  • 김수형
    • 한국정보처리학회논문지
    • /
    • 제5권10호
    • /
    • pp.2600-2608
    • /
    • 1998
  • 본 논문은 한글이나 한자처럼 문자 부류의 개수가 많은 경우에 효과적인 오프라인 필기 문자인식 알고리즘을 제안한다. 이 알고리즘은 간단하며 구현하기 쉬운 최소거리 분류법에 기반을 두고 있는데, 최소거리 분류법의 인식 성능을 향상시키기 위해 다단계 선인식(multi-stage pre-classification) 및 신경망을 이용한 후보문자 재정렬(candidate reordering)의 두 가지 전략이 첨가되었다. 제안된 알고리즘의 성능은 PE92 데이터베이스 상의 574 종의 한글 문자들에 대한 실험을 통해 입증하였는데, 인식률은 86%, 처리 속도는 초당 15자로서 기존의 연구 결과보다 우수함을 관측하였다.

  • PDF

Cluster분석에 의한 버어리종 담배품종의 분류 (Varietal Classification on the Basis of Cluster Analysis in Burley Tobacco of N. tabacum L.)

  • 안대진;김윤동
    • 한국연초학회지
    • /
    • 제5권2호
    • /
    • pp.25-32
    • /
    • 1983
  • To obtain basic information on the breeding of burley tobacco, classification of 41 varieties was carried out by using the cluster analysis of correlation coefficients and taxonomic distance based on twenty-one agromonic characters. Eight characters, such as days to flowering, length of flower axis, internode length, leaf length, yield, leaf angle to stem, vein angle to midrib and plant height, were useful in monothetic classification. Forty-one varieties were classified into four groups (I, II, III and IV) with weighted variable group method (WVGM ) and weighted jai. group method(WPGM), whereas the results classification of 33 varieties among them by WVGM were coincident with the results by WPGM. As for the characteristics of each group, group I related to late maturity, tall height and high yield, group II related to intermediate maturity, tall height and low yield, group 19 related to early maturity, intermediate height and low yield, and group W related to early maturity, short height and intermediate yield.

  • PDF

Hough Transform을 이용한 한글 필기체 형식 분류에 관한 연구 (A Study on the Classification of Hand-written Korean Character Types using Hough Transform)

  • 구하성;고경화
    • 한국통신학회논문지
    • /
    • 제19권10호
    • /
    • pp.1991-2000
    • /
    • 1994
  • 본 논문에서는 필기체 문자 인식 시스템을 위하여 6형식 분류 알고리즘을 제안하였다. 입력 영상은 세선화 과정을 거친 후 잡음을 제거하는 절단화 과정을 거친 후 $64\times64$ 크기로 정규화하여 이용하였다. 6형식 분류는 신경회로망의 모델 중 다층 퍼셉트론의 학습알고리즘을 이용하여 대분류와 상세분류 과정에서 이루어진다. 특징값 추출은 부분적인 특정값으로는 Subblock Hough transform을 이용하였으며 전체적인 특징값으로는 표본화 Hough transfrom을 이용하였다. 실험은 10사람이 한 형식당 30번씩 쓴 1800자를 대상으로 하였으며 받침의 유무로 대분류한 후 각기 종모음과 횡모음의 유무로 상세분류하여 90%의 분류 성공율을 얻었다.

  • PDF

Optical Font Recognition For Printed Korean Characters Using Serif Pattern of Strokes

  • Kim, Soo-Hyung;Kim, Sam-Soo;Kwag, Hee-Kue;Lee, Guee-Sang
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 ITC-CSCC -2
    • /
    • pp.916-919
    • /
    • 2002
  • This paper introduces the problem of typeface classification of Hangul characters and proposes features for typeface classification among Serif and Sans-serif classes. Serif classes have a small decorative stroke around the beginning of vertical strokes, while Sans-serif classes have no serif. Therefore, the serif part is first segmented from the vertical strokes, and the direction of the serif is computed as the feature for Hangul typeface identification. To evaluate the performance of the proposed system, we used 3,000 characters extracted from Korean documents - 1,500 from Serif fonts, other 1,500 from Sans-serif fonts.

  • PDF

붙은 글자들이 포함된 인쇄체 한.영 혼용 문서에서의 효과적인 문자 인식 알고리즘 (An Efficient Character Recognition Algorithm in Printed Korean/English Documents Including Touching Characters)

  • 김규경;김진호;진성일;최흥문
    • 전자공학회논문지B
    • /
    • 제33B권11호
    • /
    • pp.116-126
    • /
    • 1996
  • In this paper, we present a character recognition algorithm in printed korean and english documents including touching characters. We derived two rules to segment and recognize touching characters in the bilingual documents, one from the shape characteristics of korean and english characters of the writing blocks defined in this paper, and the other from the RF (reliability factor) values generated from the classifiers. Overall classification accuracy for the KITE paper of the proposed algorithm was about 96.8% for the english abstract, and about 97.8% for the bilingual parts. Also we confirmed the proposed algorithm significantly improves the accuracy of character segmentation of the actual mixed korean and english documents including touching characters.

  • PDF

초성자소분리 인식에 의한 필기 한글문자의 대분류에 관한 연구 (A Study on the Pre-Classification of Handwritten Hangeul Characters Using Partial Separation and Recognition of Initial Consonants)

  • 안석출;김명기
    • 한국인쇄학회지
    • /
    • 제6권1호
    • /
    • pp.41-57
    • /
    • 1988
  • Recently, it Is required to develop OCR(Optical Character Reader) along with the progress of the information processing system for Hangeul. Characters have to be recognized clearly so that OCR can be applied, Structure analysis method and lump method are used for the recognition of characters, and OCR is now available for the recognition of printed characters and handwritten alphanumeric characters having simple structure by them However, It is known that there should be much more study on the development of handwritten Hangout's OCR. This paper proposed a new method for the handwritten Hangout character recognition. The units of Initial consonant of Hangout are separated and then recognized from the utilization of the position- Information of Hangeul's units from the normalized patterns using the regression line theory. It is carried out for the extraction of the block which exists in the virtual Initial consonant region from the normalized input patterns and the calculation on maximum value (${\beta}$) of likelihood after comparing the features of separated subpattern with the initial consonant dictionary.

  • PDF

한국산 골풀속의 해부학적 형질에 의한 분류학적 연구 (A taxonomic study of Korean Juncus based on the anatomical characters)

  • 장창석;오병운
    • 식물분류학회지
    • /
    • 제46권4호
    • /
    • pp.392-404
    • /
    • 2016
  • 한국산 골풀속 19 분류군에 대하여 해부학적 형질의 유용성을 검토하고자 연구를 수행하였다. 줄기, 잎, 삭과 등을 횡단하여 관찰하였으며, 주요 형질을 도해하고, 기재하였다. 또한 해부학적 형질에 근거한 검색표를 작성하였고, 분류군간 차이점을 표로 제시하였다. 연구 결과, 줄기의 유관속, 섬유, 기도의 배열양상과 잎의 형태, 유관속 및 유조직의 배열양상, 삭과에서 태좌의 발달정도 등의 형질들이 골풀속 식물의 분류에 매우 유용한 것으로 확인되었다. 그러나 일부 분류군에서는 근연 분류군과의 분류형질로 유용한 것으로 밝혀졌지만, 종 수준보다는 절 또는 아속 수준의 분류에 더 유용한 것으로 확인되었다. 따라서 해부학적 형질은 다른 외부형태학적 형질과 더불어 보다 자연적인 분류체계 설정에 기여할 수 있을 것이라 판단되었다.

A Study on the Fractal Attractor Creation and Analysis of the Printed Korean Characters

  • Shon, Young-Woo
    • Journal of information and communication convergence engineering
    • /
    • 제1권1호
    • /
    • pp.53-57
    • /
    • 2003
  • Chaos theory is a study researching the irregular, unpredictable behavior of deterministic and non-linear dynamical system. The interpretation using Chaos makes us evaluate characteristic existing in status space of system by tine series, so that the extraction of Chaos characteristic understanding and those characteristics enables us to do high precision interpretation. Therefore, This paper propose the new method which is adopted in extracting character features and recognizing characters using the Chaos Theory. Firstly, it gets features of mesh feature, projection feature and cross distance feature from input character images. And their feature is converted into time series data. Then using the modified Henon system suggested in this paper, it gets last features of character image after calculating Box-counting dimension, Natural Measure, information bit and information dimension which are meant fractal dimension. Finally, character recognition is performed by statistically finding out the each information bit showing the minimum difference against the normalized pattern database. An experimental result shows 99% character classification rates for 2,350 Korean characters (Hangul) using proposed method in this paper.

Distribution of Korean Syllables by Characters

  • Lee, Soon-Hyang
    • 음성과학
    • /
    • 제9권1호
    • /
    • pp.185-192
    • /
    • 2002
  • This study classifies Korean syllables into various types and investigates the distribution of syllables by each type. Korean syllables are classified into four or eight types. In this study, they are classified into thirty-two types based on character combination in order to evaluate the intelligibility of Korean synthetic syllables. Among those Korean syllables derived from the possible combinations of Korean characters, only currently used syllables were selected. Based on this classification and distribution, representative and diagnosable testing materials can be made. These testing materials can be applicable to intelligibility tests of Korean synthetic syllables.

  • PDF

벼속(Oryza) 잎의 식물규소체 표징형질 (Some opal phytoliths diagnostic characters of Oryza leaves)

  • 황성수;김경식
    • 식물분류학회지
    • /
    • 제31권4호
    • /
    • pp.321-341
    • /
    • 2001
  • 벼속(Oryza) 잎의 식물규소체에 대한 분류학적 연구의 일환으로 표징형질을 정립하고 검색표를 작성하고자 광학현미경과 주사전자현미경을 사용하였다. 벼의 잎에서 가장 다양한 형태의 규소체를 형성했던 기공장치규소체, 장세포규소체 그리고 단세포규소체 등을 대상으로 엽신 배축면의 동일한 위치에 형성된 종류를 집중적으로 조사하였다. 이들 규소체의 특징은 속내 분류체계의 설정과 종을 동정하는데 유용하게 사용될 수 있었다. 기공장치규소체는 공변세포와 부세포 상의 유두상돌기 유래 규소체의 발달 유무와 배열 양상의 특징이 다양하게 나타났고, 이들의 특징은 절 및 계열 수준에서 기존 분류체계와 일치하였다. 장세포규소체는 표면에 유두상돌기의 발달 유무, 배열양상 및 형태 등에 따라 다양한 형태가 확인되었다. 그러나 확인된 특징이 본 속내 기존 분류체계와 일치하기보다는, 종의 동정에 유용한 것으로 생각되었다. 단세포규소체는 모두 형판규소체로 십자형, 안장형, 이완형 그리고 3완형 등이 확인되었으며, 이들의 특징은 절 및 계열 수준에서 계통학적으로 의의가 있었다. 또한 단세포규소체가 맥상표피역에 밴드를 형성하는 종류와 밴드를 형성하지 않는 종류, 유관속 종류에 따른 맥상표피역 규소괴의 밴드 수 그리고 맥간표피역에 안장형 규소체의 발달 여부 등에 따라 다양한 종류가 확인되었으나, 이들의 특징이 속내 분류체계와 일치하지 않는 것으로 나타났다. 조사된 기공장치규소체, 장세포규소체 그리고 단세포규소체 등의 특징에 따라 각각 검색표를 작성하였고, 각 형질의 특징과 속내 분류계급과 비교하여 계통학적 의의를 논의하였다.

  • PDF