• 제목/요약/키워드: 자소 조합

검색결과 30건 처리시간 0.02초

규칙적인 잡음을 이용한 인쇄체 한글 자소인식 개선 (Improvement of The Printed Korean Grapheme Recognition using Meaningful Noises)

  • 이진수;권오준;방승양
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1995년도 제7회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.143-147
    • /
    • 1995
  • 한글은 문자수가 많고 초성, 중성, 종성의 조합으로 이루어진 2차원적인 특성 때문에, 신경망을 이용한 한글 인식의 경우에는 자소를 분리한 후 자소별로 인식하는 방법이 많이 사용된다. 이러한 방법의 경우 분리된 자소영역에 원하는 자소 이외의 부분이 첨가되면 학습이 어려워 오인식의 주된 원인이 되기 때문에, 정확한 자소분리 알고리즘이나 전처리등을 통하여 그러한 잡음을 없애려는 시도가 많이 있었으나 아직도 원하는 자소부분 만을 정확히 분리하는 것은 어려운 문제로 남아있다. 본 논문에서는 그러한 잡음이 규칙적임을 이용하여, 필요한 자소영역만을 추출하려하기보다는 오히려 필요한 자소영역 외의 부분을 포함시킴으로써, 잡음이라고만 생각했던 부분을 하나의 정보로 역이용하여 이로 인한 여러 오인식 경우를 해결하였다. 또한 자소의 위치가 불규칙적인 부분에 있어서는, 그 위치를 고정시키는 알고리즘을 사용하여 인식률을 더욱 높였다.

  • PDF

낱자 인식기와 자소 조합 인식기를 혼용한 인쇄체 한글 인식방법 (A Method of Machine-Printed Hangul Recognition using Character and Combined-Grapheme Recognizers)

  • 장승익;임길택;김호연;정선화;남윤석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.244-246
    • /
    • 2003
  • 본 논문에서는 낱자 인식기와 자소 조합 인식기를 혼용한 저품질 인쇄체 한글의 고성능 인식 방법을 제안하였다. 제안한 방법에서는 입력 문자를 한글 6형식과 기타 형식의 문자, 총 7종으로 분류한, 입력문자를 인식 대상 문자의 수와 자소 복잡도에 따라 하나 또는 두 개의 인식 단위(HRU: Hangul recognition unit)로 분리하여 인식한다. 각 인식 단위 영상에서 추출한 방향각 특징을 다층신경망 인식기를 이용하여 인식한다. 다음으로, 각 다층신경망 인식기의 신뢰도를 조합하여 최종 인식 결과를 도출한다. 제안한 방법을 사용한 실험에서 98.80%의 인식률을 얻을 수 있었으며, 이는 기존 방법에 비해 23.61%의 오류가 감소한 것이다.

  • PDF

한글 활자체의 조합형 설계 가능성 연구 (The Posibility of Combination with Characters in Han-Gul Typeface Design)

  • 김진평
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
    • /
    • pp.293-300
    • /
    • 1992
  • 모아쓰기 원리에 의한 한글은 조합 가능한 글자수가 총 11,172자에 달한다. 오늘날 정보산업화 시대의 다양한 요구로 인해 과거와 달리 이제는 한 벌의 한글 활자체도 조합 가능한 글자를 모두 갖추어야 하는 시대가 되었다. 활자체 설계 방식에서 과거처럼 글자 한 자 한 자를 다듬어 내던 설계 방식인 완성형 설계방식으로는 글자수를 모두 수용하면서도 다양한 활자체를 신속하게 만들어 내기는 매우 힘들게 되었다. 이를 해결 할 수 있는 설계 방식은 한글의 모아쓰기 원리를 활용해서 자소를 조합하여 설계하는 조합형 설계 방식이다. 이러한 조합형 설계의 성공적인 결과를 위해서는, 활자체 설계 전문가의 합리적 조합 규칙 설정 및 자소설계와 함께 효율적 전산 프로그램이 뒷받침되어야만 한다.

  • PDF

조응구조의 지시사상 (mapping) 이론

  • 박영규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1990년도 제2회 한글 및 한국어정보처리 학술대회
    • /
    • pp.199-199
    • /
    • 1990
  • 입력된 문서 영상으로부터 분리 추출된 문자 영상을 올바르게 인식하는 것은 문서 인식에서 가장 핵심적인 부분이다. 스캐너를 통해 입력되고 분리된 실제의 문자 영상은 많은 문제점들을 가지고 있다. 한글의 경우 이 중 개별 문자 영상내의 각 자소간의 접촉은 올바른 인식을 저해하는 주요한 원인이다. 이런 접촉의 문제를 효율적으로 해결하기 위해 한글의 구조적 특성을 지닌 "방향 필터"를 정의하고, 이것을 이용하여 세선화된 문자 영상을 추적하면서 선소들을 뽑아낸다. 이렇게 하여 얻은 선소들과 선소들간의 지식을 조합하여 한글자소 획을 추출케 되고 결국에는 이런 획의 조합을 통해 문자 영상을 인식하는 방법을 제안한다.

  • PDF

계층적 신경망을 이용한 자소인식에 기초한 Off-Line 필기체 한글인식 : 자소간 섭동체거를 위한 High-Level Constraint 회로의 설계

  • 장주석;김명원;임채덕;송윤선
    • 정보와 통신
    • /
    • 제9권11호
    • /
    • pp.34-36
    • /
    • 1992
  • 여러 개의 문자(혹은 여러 개의 자소로 구성된 한개의 문자)를 인식할때에는 문자(혹은 자소) 상호간에 영향을 미쳐서 오인식이 발생할 가능성이 높다. 개개의 숫자인식에 기초한 숫자열 인식이나, 개개의 자소인식을 바탕으로한 필기체 한글인식이 그 좋은 보기일 것이다. 예를 들어 단순한 한글 '그'를 Neocognitron으로 인식한다고 생각해 보자, 조합 가능한 글자를 모두 기억시키려면 방대한 규모의 회로가 필요하므로 현실적으로 불가능하다. 따라서 기본 자소(자음 14개, 모음 10개)를 인식하도록 학습시키고 이를 바탕으로 한글을 인식하는 것이 효율적이다. 이때, 회로의 각 세포가 보는 receptive field가 유한하여 '?'의 끝 세로부분 'I'가 '?'에 영향을 미쳐서 '?'로 인식된다 즉, 자소간의 섭동에 의해 '그'가 '고'로 인식되는 것이다. 이와같은 예는 '니'가 '넉'으로, '41'이 '4H'로 인식되는 등 매우 많지만 그 해결에 대한 연구는 거의 없다. 이 논문에서는 필기체 한글 자소를 인식하는 Necognitron외에 자소간의 섭동현상을 제거하기 위한 high-level constraint 회로를 Lotka-Volterra동역학에 기초하여 설계하였다. 이로써 off-line필기체 한글인식을 보다 효과적으로 할 수 있음을 컴퓨터 시뮬레이션으로 보인다.

  • PDF

컴퓨터형 한글 서체 개발을 위한 자소 결합 알고리즘 연구 (A study on the combination algorithm of Korean alphabet to develope the Hangul fonts for computers)

  • 김윤식;엄정국;송만석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.341-344
    • /
    • 1998
  • 컴퓨터 상에서 모든 한글 음절을 구현하고자 하면 현대한글 11,172음절의 완성형 코드나 조합형 코드를 사용해야 하는데 조합형의 경우 글자의 미려도가 떨어지는 문제성이 발생되므로 자소 벌수를 늘려 그 문제점을 보완하려는 연구가 진행되어 왔다. 이는 메모리 및 코드처리상 비효율적인 요소가 많으므로 본 논문에서는 자소는 초 중 종성 각각 6벌씩만 제작한 후 자소의 어울림에 따라 자소의 이동과 변형으로 그 미려도를 추구할 수 있는 방안을 제시하고자 한다.

  • PDF

한글 인쇄체 문자의 형식 분류 및 비선형적 자소 분리에 관한 연구 (A Study on Korean Printed Character Type Classification And Nonlinear Grapheme Segmentation)

  • 박용민;김도현;차의영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2006년도 춘계종합학술대회
    • /
    • pp.784-787
    • /
    • 2006
  • 본 논문에서는 한글 인쇄체 문자의 자소를 비선형적으로 분리하는 방법을 제안한다. 자소 분리 대상 문자는 자소의 조합 방식에 따라 6개의 형식으로 분류한다. 인쇄체 한글의 6형식 분류를 위해 그레이 레벨의 문자 이미지로부터 망 특성과 수직 수평 투영 기법을 이용해 특징을 추출하고, 오류 역전파 기법을 이용하여 분류를 시도한다. 분류된 문자 형식을 기반으로 분리 후보 영역을 지정하고, 이 영역을 기반으로 다단식 그래프 탐색 알고리즘을 이용하여 최적의 비선형적 자소 분리 경로를 찾아낸다. 실험 결과, 제안한 방법은 한글의 6형식 분류에 적합하였으며, 자소가 서로 붙어 선형적으로 분리가 어려운 문자의 자소 분리에 좋은 성능을 나타내었다.

  • PDF

트루타입의 합성 글립을 이용한 새로운 한글 폰트 생성법 (A Generating Method of Hangul Fonts using Composite Glyph of TrueType)

  • 정근호;김은회;최재영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.368-374
    • /
    • 1999
  • 한글 폰트는 조합형 폰트와 완성형 폰트로 구분된다. 조합형 폰트는 폰트를 제작하는 시간과 노력이 적게 필요하지만 폰트의 품질이 완성형 폰트보다 뒤떨어진다. 완성형 폰트는 조합형과 비교하여 우수한 품질을 가지지만 폰트 제작에 더 많은 시간과 노력을 요구한다. 특히 완성형 폰트는 폰트내의 중복된 자소들의 정보를 중복해서 저장하므로 폰트 저장에 필요한 공간이 더 많이 필요하다. 본 논문에서는 트루타입의 합성 글립(Composite Glyph)을 이용하여 중복된 자소를 최소화한 완성형 폰트를 구성하였다. 중복성을 최소화한 완성형 폰트는 기존 완성형 폰트와 유사한 고수준의 품질을 유지하면서 조합형 폰트와 유사하게 폰트 저장 공간의 크기를 절약할 수 있다.

  • PDF

제한된 글자 디자인에 의한 한글 조합형 글꼴의 자동생성 (Automatic generation of Hangul Johap typeface using small character set)

  • 강상수;조환규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1994년도 제6회 한글 및 한국어정보처리 학술대회
    • /
    • pp.217-222
    • /
    • 1994
  • 한글 글꼴을 새롭게 만들려면 지금까지는 기본 글자인 자소를 디자인하든지 아니면 완성된 글자 전체를 디자인해야 했다. 조합형의 글자디자인의 경우, 전체 글자가 아니라 부분적인 한글 전자사전은 많은 양의 데이타를 저장할 수 있어야 하며, 빠른 검색 속도를 제공해야 한다. 기존의 트라이는 공통접두사만을 압축하기 때문에 사전의 크기가 방대하다는 단점이 있다. 본 논문에서는 DAWG(Directed Acyclic Word Graph)를 이용하여 공통접미사까지 압축하였고, 검색과 기억장소의 효율을 위하여, 링크드리스트 구조의 DAWG를 유형별 배열 구조로 바꾸었다. 전국의 각 학교 이름들을 대상으로 실험한 결과, 본 논문에서 제안한 DAWG를 이용한 배열 구조의 사전은 트라이와 비교하여 볼 때, 검색 연산의 성능은 동일하게 유지하면서 기억 장소의 효율과 압축율에서 효과적이었다. 또한, 트라이보다 주기억장치와 보조기억장치와의 블록 입출력횟수를 줄임으로써 전체 검색 시간을 낮출 수 있었다.소를 디자인하기 때문에 전체 글자의 모양이 좋지 않다는 단점이 있었고 완성형의 경우 완성된 글자 전체를 모두 디자인해야하는 단점이 있었다. 본 논문에서는 한글 글꼴 개발의 한 방법으로 제한된 글자의 디자인에 의한 전체 글꼴 생성에 관한 한 방법을 제시한다. 이 방법은 표준으로 설정된 몇 글자를 디자인하면 그 글자를 분석하여 자소들을 위한 글꼴 화일이 만들어지고 자소 글꼴 화일로부터 다른 모든 글자를 만들어 낸다.

  • PDF

METAFONT를 이용한 구조적 한글 폰트 생성기 (Structured Korean Font Generator Using METAFONT)

  • 권경재;손민주;최재영;정근호
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권9호
    • /
    • pp.449-454
    • /
    • 2016
  • 한글의 자소들은 몇 가지의 획으로 구성되어 있고, 완전한 글자들은 자소들의 조합으로 구성되어 있다. 획과 자소들을 조합하는 과정에서 그 구성들의 크기나 위치가 변화할 수 있으므로 폰트를 제작하는데 많은 노력이 필요하다. 이와 달리 METAFONT는 매개변수 값을 변경하면서 획과 자소의 크기와 위치를 쉽게 변환할 수 있는 시스템을 제공하여 폰트 제작 과정에 효율성을 높일 수 있다. 본 논문은 METAFONT를 기반으로 사용자가 매개변수를 수정하여 다양한 폰트를 자동으로 생성할 수 있는 구조적 한글 폰트 생성기를 제안한다. 본 논문에서 제안한 한글 폰트 생성기는 폰트 임베딩 분야와 폰트 편집기 분야에 적용할 수 있다.