• 제목/요약/키워드: 자소 조합

검색결과 30건 처리시간 0.029초

계층적 신경망을 이용한 주민등록증 성명인식 (Printed Name on ID Card recognition using a Hierachical Organized Neural Network)

  • 서원택;조범준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.325-327
    • /
    • 2003
  • 본 논문에서는 인쇄체 한글을 실용적으로 인식할 수 있는 계층적으로 구성한 신경망을 제안하고, 이를 이용해서 주민등록증의 성명을 인식하는데 적용하였다. 문자영상을 신경망을 이용하여 한글의 6가지 유형으로 먼저 분류한 후, 분류된 문자영상을 각 형식에 따라 자소단위로 분할해서 각 형식에 따른 신경망으로 인식하는 구조로 만들었다. 훈련용 데이터는 각 형식 별로 자소를 분리해서 얻은 영상들을 자소별 평균이미지로 만들어서 이를 조합하여 만든 글자로 사용하였다. 그래서 같은 형식의 같은 자음이라도 글자의 모양과 위치가 조금 다른것에 대해서 강인한 훈련을 할 수 있었다. 또한 입력단에서의 잡음을 줄이기 위해 히스토그램의 국부 평균을 적용하였다. 100명의 주민등록증을 컴퓨터 카메라를 이용하여 입력받아서 테스트한 결과 98.1%의 높은 인식률을 얻을 수 있었다.

  • PDF

한글 인식에 있어서의 자소추출 (A Method of the Extraction of Phonemes in Hangeul Recognition)

  • 최병욱
    • 대한전자공학회논문지
    • /
    • 제18권2호
    • /
    • pp.36-43
    • /
    • 1981
  • 본 논문은 한글 인식에 있어서 문제점으로 되어 있는 조합문자에서의 자소추출 방법의 제안에 관한 것이다. 한글의 구성원리에 입각하여 자소의 단치정보와 Stroke의 방향성을 고려하여 Top-down 적으로 한글의 구조를 분석하고, 이에 따른 3단계 처리에 의하여 자소가 순차적으로 추출되는 과정을 보였다. 일상 활동에서 사용되고 있는 문자중, 677자에 대한 자소의 추출실험결과, 96 %의 추출률을 얻어, 본 방식의 유효성을 확인할 수 있었다.

  • PDF

상태공간탐색을 이용한 한글패턴 인식방법 (A Recognition Method of HANGEUL Pattern Using a State Space Search)

  • 김상진;이병래;박규태
    • 한국통신학회논문지
    • /
    • 제15권4호
    • /
    • pp.267-277
    • /
    • 1990
  • 이 논문에서는 인공지능의 기본적인 문제풀이 기법인 상태공간 탐색을 이용하여 한글을 구성하는 기본자소를 분리하여 인식하는 방법을 제안하였다. 자소분리와 인식과정을 보다 밀접하게 결합하기 위하여 문제를 상태공간에 표현하고, 이 공간을 탐색하여 풀이하였다. 그리고 탐색효율을 향상시키기 위하여 한글의 조합규칙에 입각한 구조정보와 매트릭스 평면에서 각 자소가 갖는 위치정보를 이용하였으며, 컴퓨터실험을 통하여 그 유용성을 확인하였다.

  • PDF

낱자 특징 기반 자소 인식기를 이용한 인쇄체 한글 인식방법 (A Method of Machine-Printed Hangul Recognition using Grapheme Recognizer)

  • 장승익;남윤석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.351-354
    • /
    • 2004
  • 본 논문에서는 낱자에서 추출한 특징을 입력으로 사용하는 자소 인식기를 이용한 저해상도 인쇄체 한글 영상의 인식 방법을 제안하였다. 제안한 방법에서는 입력 문자를 한글 6 형식과 기타 형식의 문자, 총 7 종으로 분류한 뒤, 입력 문자를 인식 대상 문자의 수와 자소 복잡도에 따라 하나 또는 두 개의 인식 단위로 구분하여 인식한다. 각 HRU는 낱자에서 추출한 방향각 특징을 입력으로 사용하는 다층 신경망 인식기를 이용하여 인식한다. 다음으로, 각 다층 신경망 인식기의 신뢰도를 조합하여 최종 인식 결과를 도출한다. 제안한 방법을 사용한 실험에서 98.99%의 인식률을 얻을 수 있었으며, 이는 기존 방법에 비해 15.83%의 오류가 감소한 것이다.

  • PDF

한국어 자소 기반 Hybrid CTC-Attention End-to-End 음성 인식 (Hybrid CTC-Attention Based End-to-End Speech Recognition Using Korean Grapheme Unit)

  • 박호성;이동현;임민규;강요셉;오준석;서순신;;김지환
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.453-458
    • /
    • 2018
  • 본 논문은 한국어 자소를 인식 단위로 사용한 hybrid CTC-Attention 모델 기반 end-to-end speech recognition을 제안한다. End-to-end speech recognition은 기존에 사용된 DNN-HMM 기반 음향 모델과 N-gram 기반 언어 모델, WFST를 이용한 decoding network라는 여러 개의 모듈로 이루어진 과정을 하나의 DNN network를 통해 처리하는 방법을 말한다. 본 논문에서는 end-to-end 모델의 출력을 추정하기 위해 자소 단위의 출력구조를 사용한다. 자소 기반으로 네트워크를 구성하는 경우, 추정해야 하는 출력 파라미터의 개수가 11,172개에서 49개로 줄어들어 보다 효율적인 학습이 가능하다. 이를 구현하기 위해, end-to-end 학습에 주로 사용되는 DNN 네트워크 구조인 CTC와 Attention network 모델을 조합하여 end-to-end 모델을 구성하였다. 실험 결과, 음절 오류율 기준 10.05%의 성능을 보였다.

  • PDF

擴張된 DP 매칭법에 依한 흘림체 한글 온라인 認識 (On-Line Recognition of Cursive Hangeul by Extended DP Matching Method)

  • 이의동;김태균
    • 대한전자공학회논문지
    • /
    • 제26권1호
    • /
    • pp.29-37
    • /
    • 1989
  • 본 논문은 DP(dynamic programming) 매칭법을 확장하여 흘림체 한글을 온라인으로 인식하는 방법에 대하여 논한 것이다. 한글의 자소는 보다 간단한 자소에 선분이 점차로 추가되어 보다 복잡한 구조로 발전되는 특징이 있다. 자소의 조합에 의해 구성되는 한글에는 유사한 문자 패턴이 많다. 이러한 특성으로 인하여 한글에 대하여 DP매칭법을 적용하여도, 입력문자와 표준문자와의 패턴간 거리를 정확하게 구하는 것이 곤란하다. 본 방식에서는 DP매칭을 행하기 전에, 한글의 최초, 최후선분의 특성을 살린 대분류매칭을 행함으로써 DP매칭의 대상수를 줄였다. 본 방식은 DP매칭법에 자소패턴의 추출기능을 부가함으로써, DP매칭을 확장하여, 한글의 문자패턴간의 거리를 정확하게 측정하는 것을 시도한다. 자소패턴의 추출은, 자소패턴을 구성하는 선분의 ON/OFF, 방향코오드, 방향코오드의 변화, 배치 구조등을 조사함으로써 행한다. 이와같이 하므로써 필기운동 변화의 흡수와 비교적 안정된 스트로크의 분리가 가능함을 확인하였다.

  • PDF

트루타입의 합성 글립을 이용한 한글폰트의 중복성 최소화 방법 (Mnimizing Duplicates for Hangul Fonts using Composite Glyph of TrueType)

  • 김은희;정근호;최재영
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권10호
    • /
    • pp.1230-1236
    • /
    • 1999
  • 한글 폰트는 서로 상반된 장단점을 가진 조합형 폰트와 완성형 폰트로 구분된다. 완성형 폰트는 조합형과 비교하여 우수한 품질을 가지지만 폰트 제작에 더 많은 시간과 노력을 요구한다. 특히 완성형 폰트는 폰트내의 중복된 자소들의 정보를 중복해서 저장하므로 폰트 저장에 필요한 공간이 더 많이 필요하다. 본 논문에서는 트루타입의 합성 글립(Composite Glyph)을 이용하여 이들 중복된 자소를 최소화한 완성형 폰트를 구성하였다. 실험 결과 생성된 완성형 트루타입 폰트는 기존 완성형 폰트와 유사한 고수준의 품질을 유지하면서, 샘체의 경우 기존 폰트의 57.6%, 명조체의 경우 73.0%의 저장공간을 절약할 수 있었다.Abstract Hangul fonts are classified into 2 categories, complete type and combination type which have their own strength and weakness. The complete type shows a high quality of fonts, while the combination type takes less time, efforts, and storage space to develop. Since the Hangul makes a syllable by combining consonants with vowels, the complete type has many duplicates and requires a large storage space to save them. We present a method that minimizes the duplicates of the complete type of the Hangul using the composite glyph of TrueType. New fonts had high quality and saved storage space, for example Sam saved 57.6% and Myungjo saved 73.0% compared to old.

소형 정보통신 단말기를 위한 한글 입력 방법 (Hangul Input Method for Small Electronic Networking Devices)

  • 강승식;한광수
    • 한국멀티미디어학회논문지
    • /
    • 제8권2호
    • /
    • pp.287-295
    • /
    • 2005
  • 정보통신 단말기에서 한글을 쉽고 빠르게 입력 할 수 있는 방법을 모색하기 위해 한글 자음과 모음의 표기법 및 조합 원리를 분석하여 한글 자모 집합보다 작은 크기의 기본 자모 집합으로 한글을 입력하는 방법을 제시하였다 그 결과로 자음의 경우 기본 자음과 기능키를 이용하여 자음들을 조합하고, 모음은 8개의 기본모음으로부터 모음의 조합 원리 및 가획 원리에 의해 입력키가 할당되지 않은 모음을 조합하는 방식을 제안하였다. 특히, 유사 자소간의 에러 발생시에 지움 버튼을 사용하는 불편함을 해소하기 위해 자소간의 전환이 가능한 오류 수정 방식을 도입하였을 뿐만 아니라, 사용자가 입력 방식에 쉽게 익숙해질 수 있도록 입력방식을 다양화함으로써 사용자 편의 성 을 추구하였다 기존의 천지인, 나랏글 방식과 비교했을 때 사용자 편의성과 입력의 신속성, 에러 수정의 용이성 측면에서 매우 효율적임을 확인하였다.

  • PDF

훈민정음 원리에 기반한 자소형 최적 폰트 개발 (A Development of Optimized Jaso-Type Font based on Hunminjeongeum Principle)

  • 변정용;김경욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.690-693
    • /
    • 2007
  • 훈민정음 창제당시의 모든 한글 음절을 모두 표현함에 있어서 현재의 컴퓨터 환경은 표현방법과 폰트의 부족으로 입력 및 출력을 완전하게 할 수 없다. 본 연구에서는 훈민정음해례에서 정의한 약 399억 음절을 컴퓨터 위에서 표현할 수 있는 폰트를 제작함에 있어서 글꼴 설계의 경제적이고 효율적인 방법을 개발하는 데 초점을 둔다. 그렇게 하려면 완성형이 아닌 조합형 글꼴 설계가 요구되며, 자소들을 복자모를 뺀 오직 낱자소만으로 제작함으로써, 음절구성 형태에 따른 낱자소 8개 형식과 세 가지 타입으로 설계한다. 즉, 컴퓨터상에서는 모든 한글이 낱자소만 이용하여 풀어쓰기 형태로 입력되며, 화면에 출력할 때는 풀어쓰기 형태의 자소들을 모아쓰기로 표현하여 낱자소를 초성, 중성, 종성만으로 둘 또는 세 글자 복자모로 확장하여 표현한다. 그러므로 최소한의 폰트모양을 이용하여 훈민정음 창제 당시의 모든 한글 399억 음절을 컴퓨터에 표현할 수 있도록 한다.

  • PDF

한글의 구조적 특징을 이용한 인쇄체 한글인식을 위한 신경망 설계 (Neural Network design for Printed Hangul recognition using structural characteristic of Hangul)

  • 서원택;조범준
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 춘계학술발표대회논문집
    • /
    • pp.588-591
    • /
    • 2003
  • 본 논문에서는 한글의 구조적인 특징을 이용하여 이를 효과적으로 인식할 수 있는 신경망을 설계해보았고, 이를 이용하여 주민등록증에 있는 이름을 인식하는 시스템을 구성해 보았다. 본 시스템은 한글의 6형식에 따른 구조적인 특징을 효과적으로 구분하기 위해 형식을 구분하는 신경망을 먼저 구성하여 형식별로 분류한 뒤, 형식에 따라 자모음을 분리하여 각 형식에 따라 구성된 2차 신경망으로 입력을 하여 인식하는 구조로 설계되었다. 훈련용 데이터는 각 형식 별로 자소를 분리해서 얻은 영상들을 자소별 평균이미지로 만들어서 이를 조합하여 만든 글자로 사용하였다. 그래서 같은 형식의 같은 자음이라도 글자의 모양과 위치가 조금 다른 것에 대해서 강인한 훈련을 할 수 있었다. 또한 히스토그램의 국부 평균을 적용함으로써 잡음에 효과적으로 대응하였다. 100명의 주민등록증을 컴퓨터 카메라를 이용하여 입력 받아서 테스트한 결과 98.1%의 높은 인식률을 얻을 수 있었다.

  • PDF