• 제목/요약/키워드: 필기 문자

검색결과 164건 처리시간 0.03초

필기체 한글 문자 인식을 위한 획 추출에 관한 연구 (A Study on Stroke Extraction for Handwritten Korean Character Recognition)

  • 최영규;이상범
    • 정보처리학회논문지B
    • /
    • 제9B권3호
    • /
    • pp.375-382
    • /
    • 2002
  • 필기체 문자 인식은 온라인 필기체 문자 인식과 오프라인 필기체 문자 인식으로 나누어진다. 온라인 필기체 문자 인식은 타블렛과 같은 펜 기반의 전자식 입력 장치를 이용하여 필기의 순서와 획의 위치와 같은 동적인 필기 정보를 문자의 입력 시 획득할 수 있어 오프라인 필기체 문자 인식에 비해 큰 연구 성과를 이루었다. 그러나 오프라인 필기체 문자 인식은 온라인 필기체 문자 인식에서와 같이 동적인 정보를 입력받을 수 없고, 다양한 필기와 자소의 겹침이 심하며 획 사이의 잡영을 많이 가지고 있어 인식의 전처리 결과에 따라 인식 성능이 크게 달라진다. 본 논문에서는 오프라인 필기체 한글 문자 인식을 위해 문자의 동적인 정보를 포함하는 획을 효과적으로 추출하는 방법을 제안한다. 제안된 방법은 전처리 과정으로 먼저 Watershed 알고리즘을 이용하여 입력된 필기체 문자 영상의 향상 및 이진화를 수행한다. 이진화된 문자부를 변형된 Lu와 Wang의 세선화 알고리즘을 사용하여 세선화를 수행한 후 문자에서의 특징점을 추출하여 세그먼트 화소열을 추출하고, 최대 허용 오차법을 이용하여 벡터화한다. 벡터화의 수행으로 몇 개의 획이 하나의 세그먼트로 묶인 경우, 하나의 세그먼트 화소열은 2 또는 그 이상의 세그먼트 벡터로 분리된다. 추출된 세그먼트 벡터들을 완전한 획으로 재구성하기 위해서 오른손 필기 좌표계 시스템을 이용하여 벡터의 방향적인 성분을 인간의 필기 획의 방향에 알맞게 수정하고, 수정된 세그먼트 벡터의 방향성과 분기 정보를 이용하여 인접한 결합 가능한 세그먼트 벡터를 결합함으로써 문자 인식에 적합한 완전한 획으로 재구성한다. 실험 결과 제안된 방법이 필기체 한글 문자 인식에 적합함을 알 수 있었다.

필기 방향 변이를 수용하는 문자 인식 방법 (Character Recognition Method Admitting a Sequence Variation of Handwritten Direction)

  • 이도곤;김우생
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.843-846
    • /
    • 2005
  • 사용자마다 여러 필기 방식이 존재하기 때문에 입력된 문자가 획 순서를 달리하여 필기했을 경우 오인식 발생확률이 많다고 볼 수 있다. 따라서 본 논문에서는 사용자의 서로 다른 필기 방향을 처리하는 인식 방법을 제안한다. 하나의 문자라도 필기 모양에 따라 해당 모델에서 그 문자가 발생할 확률 값이 다르지만 임계 확률 값 즉, 다양한 필기 모양에 상관없는 최소한의 발생 확률 값을 구할 수 있다. 따라서 시스템이 입력 문자를 인식할 때 어떤 모델에서의 발생 확률이 그 모델에서의 임계 확률 값보다 낮을 경우는 훈련과는 다른 필기체로 쓴 것이라고 가정할 수 있으며, 이러한 정보를 통해서 다른 필기 방향의 문자를 인식할 수가 있다.

  • PDF

영문 대문자의 획간 조합 순서를 이용한 온라인 필기의 문자열 인식 (On-line word recognition of continuous English handwriting by mixture of stroke)

  • 조현철;김우생
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.452-454
    • /
    • 1999
  • 온라인 필기 문자의 경우에는 필기의 변형이 심하고 문자간의 분리가 힘들기 때문에 인식률이 낮은 실정이다. 본 논문에서는 영문 대문자의 자유로운 필기를 인식할 수 있는 방법으로 영문 대문자의 필기시에 발생하는 획간 조합의 특징을 사용하여 인식하는 알고리즘을 제안한다.

  • PDF

문자의 구조적 제약과 동적 격자 탐색을 이용한 필기 한글 문자 인식 (Handwritten Hangul Recognition by Dynamic Lattice Search with Structural Constraints)

  • 강경원;김진형
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.359-364
    • /
    • 2001
  • 필기 한글문자 인식은 다양한 필기 변형, 자모 간의 접촉과 같은 문제들을 내포하고 있다. 최근 이를 해결하기 위한 방법으로 랜덤 그래프를 이용한 필기 한글 모델링이 제안되었으나, 상향식 정보처리의 한계인 시간 복잡도 문제를 겪고 있다. 영어 단어인식에 관한 인지과학적 연구에서는 하향식 정보처리의 주요한 역할 중 하나로 인식 과정에서의 계산 중복을 없애는 필터링의 역할을 들고 있다. 본 논문에서는 랜덤 그래프를 이용한 필기 한글 모델링을 기반으로 하여 필기체에 나타나는 다양한 변형을 흡수하며, 시간 복잡도를 해결하기 위한 한글 문자의 구조에 바탕을 둔 하향식 정보처리 방법을 제안한다. 제안하는 방법은 모델 발화를 이용한 자모 후보 추출 DP 정합과 동적 격자 탐색을 이용한 문자 후보 탐색, 그리고 문자의 구조적 제약을 이용한 후보 제거 기법을 포함한다. 필기 한글 데이터베이스인 SERI-DB에 대한 예비 실험 결과, 제안한 방법은 인식률의 큰 저하 없이 상향식 정보 처리에 바탕을 둔 기존 방법에 비해 높은 속도 향상을 가져 왔다.

  • PDF

획 상대 위치 판별을 통한 온라인 필기체 한글 문자 인식에 관한 연구 (A Study on an On-line Handwritten Hangul Character Recognition by Identifying Relative Positions of Strokes)

  • 정진국;김수인;남궁재찬
    • 정보기술과데이타베이스저널
    • /
    • 제4권2호
    • /
    • pp.65-78
    • /
    • 1998
  • 본 논문에서는 획 상대위치 판별을 통한 온라인 필기체 한글 문자 인식에 관하여 연구하였다. 한글을 구성하는 획을 인식하기 위하여 각 획의 시작부분과 끝부분의 방향코드를 이용하였으며, 인식된 획들을 바탕으로 각 획들간의 상대위치 정보를 이용하여 자소를 인식하였다. 온라인 필기체 한글의 경우 획의 모양과 크기가 필기자에 따라 불규칙하게 변하므로 획의 모양보다는 획의 위치를 인식에 더 중요한 자료로 삼아 인식을 행하였다. 6,000자의 온라인 필기체 한글 문자에 대하여 실험한 결과, 문자당 평균인식속도 0.034초, 획 인식률 92.3%와 문자 인식률 94.6%를 보였다. 본 실험의 결과로서 온라인 필기체 인식시스템을 구성함에 있어서 획의 시작 부분과 끝부분의 진행방향이 획인식의 중요 요소임과 획들간의 상대적 위치가 한글 문자 인식에 있어서 중요한 요소임을 밝혔다.

자유 필기체 한글에서의 자모 추출 (Phoneme Extraction from Freely Hand Written Han Gul)

  • 오원근;신영건;안영경
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.142-147
    • /
    • 1989
  • 필기체 문자는 인쇄체 문자와는 달리, 복잡한 변형이 따르므로, 인식 하는데 많은 문제점이 따른다. 그렇기 때문에 일반적인 필기체 인식에 있어서는 필기 자체에 대한 제한을 두어 변형을 적게한 문자를 인식 대상으로 삼고 있다. 이러한 문자는, 설정된 조건만 확실하게 만족한다면, 비교적 간단하게 인식 할 수 있다. 반면에, 자유 필기체 문자는, 제한 필기체 문자와는 달리 변형이 크기 때문에, 그 인식에는 많은 연구가 필요하다. 본 연구에서는, 자유 필기체 한글의 자모를 추출하는데 있어 두개의 parameter space method를 이용했다. 화상내에서의 혼합은, 기본적으로 5 개의 element ($\mid,\;\setminus,\;/,\;-,\;o$)로 구성되어 있고, 이 element를 정의하는데는 최소한 4 개의 parameter, 즉 element의 위치 [x, y], 크기 [1] 및 type [T] 등이 필요하다. 입력 화상에서 추출된 직선 및 원의 성분은 [x, y, l] 과 [x, y, T]의 2 개의 3-D parameter space 에 누적되고, parameter space 상에서의 병합 분할 과정을 거쳐, element 가 형성된다. 추출된 element 들은, parameter space 상에서의 방향성 및 상호 위치 관계에 의한 조합 형태로서, 미리 기술되어진 자모 모델과 비교되어 인식된다. 본 방법의 특정은, 문자의 크기에 무관하고, 해석방법에 의해서는, 끊어진 element나 불필요한 element 등의 왜곡된 element 들의 처리가 가능한 점, 4 차원 parameter space를 두개의 3 차원 parameter space로 분리, 처리시간과 기억용량의 절약을 기한점 등을 들 수 있다.

  • PDF

한글 필기체 영상 데이터베이스 PE92의 소개 (An Overview of Hangul Handwritten Image Database PE92)

  • 김대환;방승양
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
    • /
    • pp.567-575
    • /
    • 1992
  • 한글 문자인식 시스템을 개발하기 앞서 생각해야 할 것이 인식실험에 사용될 문자 데이타를 수집하는 것이다. 이 논문에서는 연구 개발자들에게 문자인식 실험에 필요한 충분한 데이타를 제공하며 필기체 문자 데이타를 표준화하여 문자인식 시스템 상호간의 성능을 객관적으로 평가하기 위하여 한글 필기체 문자 데이터베이스 PE92를 개발하였다. 여기서는 PE92 데이타베이스의 소개로서 먼저 PE92를 수집하는데 있어 고려사항들, 즉 필기자, 수집문자의 수, 수집용지의 규격, 데이타베이스의 저장, 데이타의 압축에 대하여 알아본다. 다음 PE92 데이타베이스의 규격을 알아본다.

  • PDF

확장된 계층적 랜덤 그래프를 이용한 필기 한글 인식 (Handwritten Hangul Recognition using Extended Hierarchical Random Graph)

  • 김호연;김진형
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.200-207
    • /
    • 1997
  • 본 논문에서는 계층적 랜덤 그래프를 이용한 필기 한글 인식 방법론을 제안한다. 한글은 다른 문자와 달리 기본 자소의 조합으로 이루어진 문자로서 2차원 평면상에 표현된다. 이러한 한글의 특성과 필기된 한글에서 나타나는 다양한 변형을 통계적으로 모델링하기 위해서 계층 그래프를 이용하였다. 특히, 계층 그래프의 최 하위 계층에서는 필기된 획의 변형을 흡수할 수 있도록 확장된 랜덤 그래프를 적용하였다. 제안된 모델은 통계적 모델이기 때문에 필기 데이터베이스로부터 모델의 파라미터를 구할 수 있다는 장점이 있다. 실험에서 제안된 모델을 필기 한글 인식 문제에 적용하여 자소간 접촉된 문자나 어느 정도의 흘려 쓴 문자도 잘 인식할 수 있음을 보였다.

  • PDF

과다 분리 및 사전 후처리 기법을 이용한 한글이 포함된 무제약 필기 문자열의 오프라인 인식 (Off-Line Recognition of Unconstrained Handwritten Korean Words using Over-Segementation and Lexicon Driven Post-Processing Techniques)

  • 정선화;김수형
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권5호
    • /
    • pp.647-656
    • /
    • 1999
  • 본 논문에서는 오프라인 무제약 필기 한글 단어를 인식하기 위한 시스템을 제안한다. 제안된 단어 인식 시스템은 크게 다석가지 모듈-문자 분리,조합행렬생성, 특징 추출, 문자인식, 사전 후처리 -로 구성되어 있다. 문자 분리 모듈은 입력된 단어 영상을 하나의 문자보다 더 작은 이미지 조각으로 과다 분리하며 , 조합 행렬 생성모듈에서는 동적 프로그래밍 기법을 이용하여 분리된 이미지 조각들로부터 사전상의 모든 단어들과 대응되는 가능한 모든 조합을 생성한다. 문자인식모듈은 각 그룹에 대하여 일괄적으로 얻어진 특징과 유니그램을 이용하여 문자인식을 수행한다. 마지막으로 사전 후처리 모듈에서는 각 그룹에 대한 문자인식 결과와 단어 사전을 사용하여 입력단어에 대한 최종 인식 결과를 도출한다. 본 문에서 제안한 방법은 문자 분리, 문자 인식 및 후처리를 상호 보완적으로 결합함으로써 한글이 포함된 무제약 필기 문자열을 효과적으로 인식할 수 있다. 제안된 시스템의 성능을 평가하기 위하여 실제 우편 봉투 상에 쓰여진 필기 한글 단어 200개를 대상으로 실험을 하였다. 실험 결과 200개의 단어중 172개의 단어를 정인식하여 86%의 정확도를 얻을 수 있었으며 나머지 28개의 오인식된 단어들을 분석한 결과 대부분의 오류는 문자 인식기의 낮은 신뢰도 때문임을 알 수 있었다. 또한, 하나의 단어를 인식하기 위하여 약 2초가 소요되었다.

시각 신경계 반응 모델에 근거한 필기체 off-line 문자에서의 특징 추출 (Feature Extraction of Off-line Handwritten Characters Based on Optical Neural Field)

  • 홍경호;정은화;안병철
    • 한국정보처리학회논문지
    • /
    • 제6권12호
    • /
    • pp.3530-3538
    • /
    • 1999
  • 필기체 오프라인 문자 인식을 위한 특징 추출의 새로군 접근 방법으로, 인간의 시각 신경계의 반응모델에 근거한 특징 추출 방법을 제안한다. 필기체 문자의 특징 추출을 위한 신경망은 평활화 처리, 외곽선 제거, 특징 정보 추출의 3가지 단계로 나누어진다. 필기체 문자에서 발생하기 쉬운 매끄럽지 못한 화소들을 전처리 단계인 평활화 처리를 통해 제거한다. 다음 단계로 인식에 영향을 주지 않는 외곽선 정보를 추출하여 이를 제거한다. 그리고 마지막으로 문자 특징에 해당하는 정보를 추출한다. 제안된 특징 추출 시스템의 타당성을 확인하기 위한 실험은 필기체 오프라인 문자인 PE2 데이터를 사용하였다. 실험을 통해 시각 신경계 반응모델에 근거한 필기체 문자의 특징을 추출하는 시스템은 곡선이나 원, 사각형이 포함된 형태의 필기 문자에서도 특징 추출이 용이하다는 것을 확인할 수 있다.

  • PDF