• 제목/요약/키워드: Hangul Recognition

검색결과 150건 처리시간 0.024초

한글의 구조적 특징을 이용한 인쇄체 한글인식을 위한 신경망 설계 (Neural Network design for Printed Hangul recognition using structural characteristic of Hangul)

  • 서원택;조범준
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 춘계학술발표대회논문집
    • /
    • pp.588-591
    • /
    • 2003
  • 본 논문에서는 한글의 구조적인 특징을 이용하여 이를 효과적으로 인식할 수 있는 신경망을 설계해보았고, 이를 이용하여 주민등록증에 있는 이름을 인식하는 시스템을 구성해 보았다. 본 시스템은 한글의 6형식에 따른 구조적인 특징을 효과적으로 구분하기 위해 형식을 구분하는 신경망을 먼저 구성하여 형식별로 분류한 뒤, 형식에 따라 자모음을 분리하여 각 형식에 따라 구성된 2차 신경망으로 입력을 하여 인식하는 구조로 설계되었다. 훈련용 데이터는 각 형식 별로 자소를 분리해서 얻은 영상들을 자소별 평균이미지로 만들어서 이를 조합하여 만든 글자로 사용하였다. 그래서 같은 형식의 같은 자음이라도 글자의 모양과 위치가 조금 다른 것에 대해서 강인한 훈련을 할 수 있었다. 또한 히스토그램의 국부 평균을 적용함으로써 잡음에 효과적으로 대응하였다. 100명의 주민등록증을 컴퓨터 카메라를 이용하여 입력 받아서 테스트한 결과 98.1%의 높은 인식률을 얻을 수 있었다.

  • PDF

Comparative Analysis of Speech Recognition Open API Error Rate

  • Kim, Juyoung;Yun, Dai Yeol;Kwon, Oh Seok;Moon, Seok-Jae;Hwang, Chi-gon
    • International journal of advanced smart convergence
    • /
    • 제10권2호
    • /
    • pp.79-85
    • /
    • 2021
  • Speech recognition technology refers to a technology in which a computer interprets the speech language spoken by a person and converts the contents into text data. This technology has recently been combined with artificial intelligence and has been used in various fields such as smartphones, set-top boxes, and smart TVs. Examples include Google Assistant, Google Home, Samsung's Bixby, Apple's Siri and SK's NUGU. Google and Daum Kakao offer free open APIs for speech recognition technologies. This paper selects three APIs that are free to use by ordinary users, and compares each recognition rate according to the three types. First, the recognition rate of "numbers" and secondly, the recognition rate of "Ga Na Da Hangul" are conducted, and finally, the experiment is conducted with the complete sentence that the author uses the most. All experiments use real voice as input through a computer microphone. Through the three experiments and results, we hope that the general public will be able to identify differences in recognition rates according to the applications currently available, helping to select APIs suitable for specific application purposes.

한글 단어 재인에서 시각적 요인에 따른 공간주의의 영향 (The Effect of Spatial Attention in Hangul Word Recognition: Depending on Visual Factors)

  • 이고은;이혜원
    • 인지과학
    • /
    • 제34권1호
    • /
    • pp.1-20
    • /
    • 2023
  • 본 연구에서는 시각적 요인에 따라 한글 단어 재인에 미치는 공간주의의 영향을 살펴보았다. 시각적 요인에 따라 공간주의의 영향이 다르게 나타나는지 살펴보기 위해 단어의 시각적 복잡성(실험 1)과 단어의 밝기 대비(실험 2)를 조작하였다. 단어의 복잡성에 따라 받침이 있는 조건과 받침이 없는 조건으로 나뉘었고, 단어의 대비에 따라 대비가 높은 조건과 대비가 낮은 조건으로 나뉘었다. 어휘판단과제를 사용하여 공간단서가 표적 위치에 주어지는 경우(타당 시행)와 표적 위치에 주어지지 않는 경우(비타당 시행) 간의 수행 차이를 단서효과로 계산하여 주의의 영향을 살펴보았다. 실험 결과, 단어의 복잡성에 따라서는 단서효과가 유사하게 나타났으므로, 공간주의의 영향은 복잡성에 의해 달라지지 않는 것으로 해석되었다. 단어의 대비에 따라서는 고대비 조건에 비해 저대비 조건에서 단서효과가 크게 나타났다. 대비가 낮을 때 공간주의의 영향이 더 커지는 것은 자극의 신호를 강화시키는 공간주의의 기제로 설명되었다.

A Study on the Fractal Attractor Creation and Analysis of the Printed Korean Characters

  • Shon, Young-Woo
    • Journal of information and communication convergence engineering
    • /
    • 제1권1호
    • /
    • pp.53-57
    • /
    • 2003
  • Chaos theory is a study researching the irregular, unpredictable behavior of deterministic and non-linear dynamical system. The interpretation using Chaos makes us evaluate characteristic existing in status space of system by tine series, so that the extraction of Chaos characteristic understanding and those characteristics enables us to do high precision interpretation. Therefore, This paper propose the new method which is adopted in extracting character features and recognizing characters using the Chaos Theory. Firstly, it gets features of mesh feature, projection feature and cross distance feature from input character images. And their feature is converted into time series data. Then using the modified Henon system suggested in this paper, it gets last features of character image after calculating Box-counting dimension, Natural Measure, information bit and information dimension which are meant fractal dimension. Finally, character recognition is performed by statistically finding out the each information bit showing the minimum difference against the normalized pattern database. An experimental result shows 99% character classification rates for 2,350 Korean characters (Hangul) using proposed method in this paper.

Path Following 에 의한 자모추출 한글인식 Algorithm (Hangul Recognition Using The Path Following Algorithm)

  • 황도찬;김성식
    • 산업공학
    • /
    • 제3권2호
    • /
    • pp.53-62
    • /
    • 1990
  • 본 연구는 컴퓨터에 의한 인쇄체 한글의 인식방법을 제안하고 있다. 일반적인 인식방법에서는 세선화과정 후의 이미지를 처리하고 있으나, 본 연구는 이 과정을 거치지 않고 원 이미지로부터 직업 패턴점들을 찾아내고, 이들을 이용하여 획을 결정하고 자모를 분리하였다. 문자 판별시에는 한글 의사 결정 나무(Decision-Tree)를 이용하여 자소를 분리하고 판별하였다. 본 연구는 자형에 관계없는 인식 방법을 제안 하였으므로 필기체 한글 인식에 기초를 제공하게 된다.

  • PDF

문자 인식을 이용한 한글 문서 검색 (Hangul Document Retrieval Using Character Recognition)

  • 안재철;오일석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.544-546
    • /
    • 2001
  • 이 논문은 OCR(Optical Character Reader)로 인식된 한글 문서에서의 오인식 경향을 분석하고, 이를 이용한 한글 단어 검색 방법을 제안한다. OCR로 인식된 많은 야의 한글 문서를 기반으로 자모별 인식 빈도수를 계산하고 이를 바탕으로 초성, 중성, 중성별 인식 혼동 행렬(confusion matrix)을 구성하였다. 또한 인식 정보를 적절히 이용하기 Bayes 정리를 이용하였다. 질의어에 대한 오인식 단어의 검색 방법을 제시하고 혼동 행렬과 이 검색 방법을 바탕으로 OCR 기반 단어 검색 시스템을 구축하였다.

  • PDF

온라인 한글 인식을 위한 HMM 상태 수의 최적화 (Optimization of Number of States in HMM for On-line Hangul Recognition)

  • 하진영;신봉기
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.372-374
    • /
    • 1998
  • 온라인 문자 인식을 위해 시도된 여러 방법 중 은닉 마르코프 모델(HMM)이 우수한 성능을 보이고 있다. 영숫자 인식은 물론 한글 인식에 있어서도 HMM은 최근 널리 사용되고 있는데, HMM을 이용해서 모델링 할 때 해결해야 할 문제 중의 하나는 HMM의 구조를 어떻게 최적화 하느냐이다. 본 논문에서는 HMM을 이용한 온라인 한글 인식 시스템에서 HMM의 최적화를 통해 인식률을 향상시키고자 한다. 특히 HMM의 상태(state)수를 어떻게 정할 것인가에 초점을 맞춰, 실험을 통해 최적의 HMM 상태 수를 찾고자 한다.

  • PDF

필기체 인식을 위한 한글 자소분리 (A Hangul Element Separation for the Hand-written Character Recognition)

  • 백남우
    • 한국ITS학회:학술대회논문집
    • /
    • 한국ITS학회 2004년도 제3회 정기총회 및 추계학술대회
    • /
    • pp.208-211
    • /
    • 2004
  • 본 연구는 필기체 한글 문자를 인식하기 위하여 한글 문자구조를 6개 기본구조로 분류한다. 각각의 한글 자음과 모음을 7-세크먼트, '/'(Left-Incline), '$\backslash$'(Right-Incline), '-'(Left-Right), '$\mid$'(UP-Down), 'c'(Circle), 'ㄱ'(Right-down), 'ㄴ'(Down-Right) 분리한다. 분리된 7-세크먼트에 대해 한글이 쓰여지는 위치에 따라 8개의 기본구조로 정의하여 세크먼트를 분리하여 레벨화한다. 따라서 본 연구는 문자를 자소(자음과모음)로 하여 7-세크먼트로 분리하는 필기체 자소분리 구조를 제시한다.

  • PDF

딥러닝을 이용한 한글 OCR 정확도 향상에 대한 연구 (A Study on Improvement of Korean OCR Accuracy Using Deep Learning)

  • 강가현;고지현;권용준;권나영;고석주
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 춘계학술대회
    • /
    • pp.693-695
    • /
    • 2018
  • 다음은 본 논문에서는 딥러닝을 통한 한글 OCR 정확도 향상을 제안한다. OCR은 인쇄되거나 손으로 쓴 문자를 광학적 방법으로 감지 인식하여 디지털로 인코딩하는 프로그램이다. 현재 가장 많이 쓰이는 tesseract OCR의 경우, 영문 인식의 정확도가 높다. 하지만 한글은 복잡한 구조에 비해 학습 데이터가 적어 정확도가 떨어진다. 따라서 이 연구에서는 이미지 프로세싱을 통해 원하는 이미지에서 글자 영역을 추출하고, 이를 학습 데이터로 활용한 딥러닝으로 한글 OCR의 정확도를 향상시키는 방법을 제안한다. 기존 영문과 숫자 및 몇 가지 언어에만 국한되어 발전해왔던 OCR을 다양한 언어에도 응용할 수 있을 것으로 기대된다.

  • PDF

인쇄된 한글 문서의 폰트 인식 (The Font Recognition of Printed Hangul Documents)

  • 박문호;손영우;김석태;남궁재찬
    • 한국정보처리학회논문지
    • /
    • 제4권8호
    • /
    • pp.2017-2024
    • /
    • 1997
  • 본 논문은 새로운 형태의 문서 통신 방식인 지적 커뮤니케이션 시스템(IICS : Intelligent Image Communication System)의 구현을 위하여 한글 문서를 대상으로 문서를 구성하는 문자의 서체와 문자의 크기 및 기울기를 인식하고 방법을 제안한다. 서체를 인식하기 위하여 문서에서 일정한 크기의 블럭을 추출하여 주파수 분석을 하였고, 단어의 외접 사각형의 수직 거리를 이용하여 문자의 크기를 인식하였다. 문자의 기울기를 인식하기 위하여 수직 방향의 투영 프로파일을 이용하였다. 서체 인식을 위한 인식기의 가변적인 히든 노드를 이용하여 오류 역전파 알고리즘으로 학습된 MLP(Multi-layer Perceptron)를 사용하였으며, 문자의 크기와 기울기를 분류하기 위하여 Mahalanobis distance를 이용하였다. 실험을 통하여 서체 분류는 10개의 서체에 대하여 평균 95.19%의 인식률을 얻었고, 문자의 크기 분류는 5가지의 문자 크기에 대하여 평균 97.34%의 인식률을 얻었으며, 문자의 기울기는 평균 89.09%의 인식률을 얻음으로써 제안된 방법의 유용성을 입증하였다.

  • PDF