• 제목/요약/키워드: 한글 필기체

검색결과 97건 처리시간 0.021초

획 상대 위치 판별을 통한 온라인 필기체 한글 문자 인식에 관한 연구 (A Study on an On-line Handwritten Hangul Character Recognition by Identifying Relative Positions of Strokes)

  • 정진국;김수인;남궁재찬
    • 정보기술과데이타베이스저널
    • /
    • 제4권2호
    • /
    • pp.65-78
    • /
    • 1998
  • 본 논문에서는 획 상대위치 판별을 통한 온라인 필기체 한글 문자 인식에 관하여 연구하였다. 한글을 구성하는 획을 인식하기 위하여 각 획의 시작부분과 끝부분의 방향코드를 이용하였으며, 인식된 획들을 바탕으로 각 획들간의 상대위치 정보를 이용하여 자소를 인식하였다. 온라인 필기체 한글의 경우 획의 모양과 크기가 필기자에 따라 불규칙하게 변하므로 획의 모양보다는 획의 위치를 인식에 더 중요한 자료로 삼아 인식을 행하였다. 6,000자의 온라인 필기체 한글 문자에 대하여 실험한 결과, 문자당 평균인식속도 0.034초, 획 인식률 92.3%와 문자 인식률 94.6%를 보였다. 본 실험의 결과로서 온라인 필기체 인식시스템을 구성함에 있어서 획의 시작 부분과 끝부분의 진행방향이 획인식의 중요 요소임과 획들간의 상대적 위치가 한글 문자 인식에 있어서 중요한 요소임을 밝혔다.

GoogLenet 기반의 딥 러닝을 이용한 향상된 한글 필기체 인식 (Improved Handwritten Hangeul Recognition using Deep Learning based on GoogLenet)

  • 김현우;정유진
    • 한국콘텐츠학회논문지
    • /
    • 제18권7호
    • /
    • pp.495-502
    • /
    • 2018
  • 딥 러닝 기술의 등장으로 여러 나라의 필기체 인식은 높은 정확도 (중국어 필기체 인식은 97.2%, 일본어 필기체 인식은 99.53%)를 보인다. 하지만 한글 필기체는 한글의 특성으로 유사글자가 많은데 비해 문자의 데이터 수는 적어 글자 인식에 어려움이 있다. 하이브리드 러닝을 통한 한글 필기체 인식에서는 lenet을 기반으로 하여 낮은 레이어를 가진 모델을 사용하여 한글 필기체 데이터베이스 PE92에서 96.34%의 정확도를 보여주었다. 본 논문에서는 하이브리드 러닝에서 사용하였던 데이터 확장 기법(data augmentation)이나 multitasking을 사용하지 않고도 GoogLenet 네트워크를 기본으로 한글 필기체 데이터에 적합한 더 깊고 더 넓은 CNN(Convolution Neural Network) 네트워크를 도입하여 PE92 데이터베이스에서 98.64%의 정확도를 얻었다.

딥러닝에 의한 한글 필기체 교정 어플 구현 (An Implementation of Hangul Handwriting Correction Application Based on Deep Learning)

  • 이재형;조민영;김진수
    • 한국산업정보학회논문지
    • /
    • 제29권3호
    • /
    • pp.13-22
    • /
    • 2024
  • 현재 디지털 기기의 확산과 함께 일상에서 손으로 쓰는 글씨의 비중은 점점 줄어들고 있다. 키보드와 터치스크린의 활용도 증가에 따라 한글 필기체의 품질 저하는 어린 학생부터 성인까지 넓은 범위의 한글 문서에서 관찰되고 있다. 그러나 한글 필기체는 여전히 개인적인 고유한 특징을 포함하면서 가독성을 제공하는 많은 문서 작성에 필요하다. 이를 위해 본 논문에서는 손으로 쓴 한글 필기체의 품질을 개선하고, 교정하기 위한 목적의 어플 구현을 목적으로 한다. 제안된 어플은 CRAFT(Character-Region Awareness For Text Detection) 모델을 사용하여 필기체 영역을 검출하고, 딥러닝으로서 VGG-Feature-Extraction 모델을 사용하여 필기체의 특징을 학습한다. 이때 사용자가 작성한 한글 필기체의 음절 단위로 신뢰도를 인식률로 제시하고, 또한, 후보 폰트들중에서 가장 유사한 글자체를 추천하도록 구현한다. 다양한 실험을 통해 제안한 어플은 기존의 상용화된 문자 인식 소프트웨어와 비교할만한 우수한 인식률을 제공함을 확인할 수 있다.

중심점을 이용한 무제약 필기체 한글 분할 (Segmentation of Unconstrained Handwritten Korean Characters using the Center of Gravity)

  • 박성호;조범준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.820-822
    • /
    • 2004
  • 현재까지도 대부분의 필기체 한글 인식은 완벽한 분할을 가정하여 개발되고 있으며 한글 분할 그 자체에 대한 관심은 매우 낮은 편이다. 본 논문에서는 무제약 필기체 한글을 분할하기 위하여 중심점을 이용한 분할방법을 제안한다. 제안된 방법은 기존의 분할 방법들이 갖는 직선화된 분할경로 뿐만 아니라, 문자내에 존재하는 여백의 정보를 활용하여 꺽은선 형태의 분할경로도 찾을 수 있다. 이를 위해 먼저, 한글 문자열에 대한 전처리 과정과 수직투영을 통해 분할대상을 결정한다. 그리고 문자에서 특징점을 찾고 인접한 특징점들 간의 중심점을 찾아서 가상의 분할 경로를 생성한 뒤 최적 분할 경로를 결정한다.

  • PDF

필기체 인식을 위한 한글 자소분리 (A Hangul Element Separation for the Hand-written Character Recognition)

  • 백남우
    • 한국ITS학회:학술대회논문집
    • /
    • 한국ITS학회 2004년도 제3회 정기총회 및 추계학술대회
    • /
    • pp.208-211
    • /
    • 2004
  • 본 연구는 필기체 한글 문자를 인식하기 위하여 한글 문자구조를 6개 기본구조로 분류한다. 각각의 한글 자음과 모음을 7-세크먼트, '/'(Left-Incline), '$\backslash$'(Right-Incline), '-'(Left-Right), '$\mid$'(UP-Down), 'c'(Circle), 'ㄱ'(Right-down), 'ㄴ'(Down-Right) 분리한다. 분리된 7-세크먼트에 대해 한글이 쓰여지는 위치에 따라 8개의 기본구조로 정의하여 세크먼트를 분리하여 레벨화한다. 따라서 본 연구는 문자를 자소(자음과모음)로 하여 7-세크먼트로 분리하는 필기체 자소분리 구조를 제시한다.

  • PDF

지능형 OCR 시스템을 위한 한글 필기체 생성 및 분류 모델에 관한 연구 (A Study on Hangul Handwriting Generation and Classification Mode for Intelligent OCR System)

  • 백진성;서지윤;정상중;정도운
    • 융합신호처리학회논문지
    • /
    • 제23권4호
    • /
    • pp.222-227
    • /
    • 2022
  • 본 논문에서는 다양한 산업분야에 적용 가능한 딥러닝 알고리즘 기반의 한글 필기체 생성 및 분류 모델을 구현하였다. 구현된 GAN 기반의 한글 필기체 생성 모델과 CNN 기반의 한글 필기체 분류 모델 2가지로 구성되어 있다. GAN 모델은 가짜 한글 필기체 데이터를 생성하기 위한 생성자 모델과 가짜 필기체 데이터를 판별하기 위한 판별자 모델로 구성된다. CNN 모델의 경우 'PHD08' 데이터세트를 활용하여 모델의 학습을 수행하였으며, 학습 결과 92.45% 정확도로 한글 필기체를 분류하는 것을 확인하였다. 구현된 GAN 모델을 통해 생성된 한글 필기체 데이터를 기존 CNN 모델의 학습 데이터세트와 통합하여 분류 모델의 성능평가를 진행한 결과 96.86%로 기존 분류 성능보다 우수하게 나타남을 확인하였다.

런 길이를 이용한 필기체 한글 자획의 교점 검출 (Detection of Intersection Points of Handwritten Hangul Strokes using Run-length)

  • 정민철
    • 한국산학기술학회논문지
    • /
    • 제7권5호
    • /
    • pp.887-894
    • /
    • 2006
  • 본 논문은 런 길이를 이용해 필기체 한글 문자에서 자획의 교점을 검출하는 새로운 방법을 제안한다 이를 위해 첫째로, 수평 런 길이와 수직 런 길이를 이용해 필기체 한글 문자의 자획 두께를 구하고, 둘째로, 자획 두께를 이용해 입력 문자의 자소를 수평 성분과 수직 성분으로 분리하며, 마지막으로, 자획의 수평 성분과 수직 성분을 이용해 자획의 교점을 구하는 기술을 제안한다. 수평 성분과 수직 성분 분석은 각도와 관계없이 자획 두께와 런 길이의 변화량만을 이용해 구한다. 자획의 교점은 오프라인 필기체 한글 인식을 위한 요소 기술 중 하나인 자소 분리를 위한 분리점 후보가 되며 분리된 자획은 필기체 한글 인식을 위한 특징을 나타낸다.

  • PDF

대용량 오프라인 한글 글씨 영상 데이터베이스 KU-1의 설계 및 구축 (Design and Construction of a Large-set Off-line Handwritten Hangul Character Image Database KU-1)

  • 김대인;김상엽;이성환
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.152-159
    • /
    • 1997
  • 최근 들어 인쇄체 문자 인식 기술의 발전에 힘입어 필기체 한글 인식에 관한 연구가 활발히 진행되고 있다. 인쇄체 문자와는 달리 자연스럽게 필기된 한글 글씨는 동일한 문자라 하더라도 같은 모양을 가지고 있다고 단정하는 것이 불가능할 정도로 필기자의 필기 유형에 따른 다양한 변형을 내포하고 있다. 따라서 효과적인 한글 글씨 인식기를 개발하기 위해서는 다양한 변형을 포함하는 대용량의 한글 글씨 영상 데이터베이스가 필수적이다. 본 논문에서는 시스템공학연구소 주관 국어 정보 베이스 개발 사업의 일환으로 고려대학교에서 구축 중인 오프라인 한글 글씨 영상 데이터베이스, KU-1에 대해 간략히 소개하고자 한다. 본 데이터베이스는 KS C 완성형 한글 사용 빈도순 상위 1,500자에 대하여 다양한 계층, 직업, 연령, 지역 분포를 고려한 1,000명 이상의 필기자가 정서체와 본인의 평소 자유 필체로 필기한 1,000벌의 명도 한글 글씨 영상으로 구성되어 있다.

  • PDF

런 길이를 이용한 필기체 한글 자획의 방향 성분 추출 (Extraction of Directional Strokes in Handwritten Hangul using Runlength)

  • 정민철
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2006년도 춘계학술발표논문집
    • /
    • pp.485-488
    • /
    • 2006
  • 본 논문은 수평 런 길이와 수직 런 길이를 이용해 필기체 한글 문자의 자획 두께를 구하고, 그 자획 두께를 이용해 입력 문자의 자소를 수평 성분과 수직 성분으로 분리하는 기술을 제안한다. 수평 성분과 수직 성분 분석은 각도와 관계없이 자획 두께와 수평 런 길이의 변화량만을 이용해 구한다. 분리된 수평 성분 자획과 수직 성분 자획은 오프라인 필기체 한글 인식을 위한 요소 기술 중 하나인 자소 분리를 위한 특징이 된다.

  • PDF

배경 세선화를 이용한 한글 필기체 글자 단위 분할 (Handwritten Korean Character Segmentation using Background thinning)

  • 서원택;조범준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.823-825
    • /
    • 2004
  • 본 연구에서는 필기체 한글의 글자단위의 분할을 위해 배경 세선화(Background thinning)라는 방법을 제안한다. 배경 세선화 방법은 글자와 글자 사이에 존재하는 배경의 정보를 세선화 처리하여 필기체 한글에서 많이 발생할 수 있는 중첩(Overlap)글자와 연결(Touched)글자를 서로 분할하는데 효과적인 성능을 보였다. 배경 세선화를 이용하여 글자를 분할하는 방법은 인식과정의 판단을 필요하지 않은 외적분할 방법으로 빠른 속도의 분할 성능을 보였다. 이 방법은 특히, 중첩된 글자의 분할에 탁월한 성능을 보였을 뿐만 아니라, 연결된 글자에 대해서도 좋은 성능을 보였다.

  • PDF