• 제목/요약/키워드: 한글폰트

검색결과 67건 처리시간 0.02초

한글 인식을 위한 CNN 기반의 간소화된 GoogLeNet 알고리즘 연구 (Streamlined GoogLeNet Algorithm Based on CNN for Korean Character Recognition)

  • 김연규;차의영
    • 한국정보통신학회논문지
    • /
    • 제20권9호
    • /
    • pp.1657-1665
    • /
    • 2016
  • CNN(Convolutional Neural Network)을 사용한 심화 학습이 다양한 분야에서 진행되고 있으며 관련 연구들은 이미지 인식의 많은 분야에서 높은 성능을 보이고 있다. 본 논문에서는 한글 인식을 위해 대규모 한글 데이터베이스를 학습할 수 있는 CNN 구조의 간소화된 GoogLeNet을 사용한다. 본 논문에 사용된 데이터베이스는 대규모 한글 데이터베이스인 PHD08로 총 2,350개의 한글 문자에 대해 각 2,187개의 샘플을 가져 총 5,139,450개의 데이터로 구성되어 있다. 간소화된 GoogLeNet은 학습의 결과로 학습 종료 시점에서 PHD08에 대해 99% 이상의 Top-1 테스트 정확도를 보였으며 실험의 객관성을 높이기 위해 PHD08에 존재하지 않는 한글 폰트로 이루어진 한글 데이터를 제작하여 상용 OCR 프로그램들과 분류 성능을 비교하였다. 상용 OCR 프로그램들은 66.95%에서 83.17%의 분류 성공률을 보인 반면, 제안하는 간소화된 GoogLeNet은 평균 89.14%의 분류 성공률을 보여 상용 OCR 프로그램들보다 높은 분류 성공률을 보였다.

딥러닝에 의한 한글 필기체 교정 어플 구현 (An Implementation of Hangul Handwriting Correction Application Based on Deep Learning)

  • 이재형;조민영;김진수
    • 한국산업정보학회논문지
    • /
    • 제29권3호
    • /
    • pp.13-22
    • /
    • 2024
  • 현재 디지털 기기의 확산과 함께 일상에서 손으로 쓰는 글씨의 비중은 점점 줄어들고 있다. 키보드와 터치스크린의 활용도 증가에 따라 한글 필기체의 품질 저하는 어린 학생부터 성인까지 넓은 범위의 한글 문서에서 관찰되고 있다. 그러나 한글 필기체는 여전히 개인적인 고유한 특징을 포함하면서 가독성을 제공하는 많은 문서 작성에 필요하다. 이를 위해 본 논문에서는 손으로 쓴 한글 필기체의 품질을 개선하고, 교정하기 위한 목적의 어플 구현을 목적으로 한다. 제안된 어플은 CRAFT(Character-Region Awareness For Text Detection) 모델을 사용하여 필기체 영역을 검출하고, 딥러닝으로서 VGG-Feature-Extraction 모델을 사용하여 필기체의 특징을 학습한다. 이때 사용자가 작성한 한글 필기체의 음절 단위로 신뢰도를 인식률로 제시하고, 또한, 후보 폰트들중에서 가장 유사한 글자체를 추천하도록 구현한다. 다양한 실험을 통해 제안한 어플은 기존의 상용화된 문자 인식 소프트웨어와 비교할만한 우수한 인식률을 제공함을 확인할 수 있다.

한글 로마자 자동 표기 시스템 설계 및 구현 ( 전사법(轉寫法) 기계적 변환에 관한 연구 ) (The design and implementation of automatic translation system for hangul's romanization ( A study on mechanic conversion using transcription ))

  • 김홍섭;박종섭;이현걸
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.437-447
    • /
    • 1993
  • 국제 협약에 따라 한글에 관한 정보는 로마자로 표기해야 한다. 우리나라는 1959년 2월 로마자 표기법'을 제정, 수차례 개정을 통해 1983년 6월 문교부(Ministry Of Education)안을 발표했으나, 표지판, 역명, 교과서, 공공문서들에서 활용되었지만, 영자신문, 외국 학술지등은 M-R( Mccune-Reishauer ) 표기법을, 인명, 신문 및 방송매체 등은 혼합표기방식을 사용함으로써 인(人). 지명(地名), ID, 대표어등 정보 검색시 혼란을 야기시켰고, 개정안에 따를 표기 정정으로 수백억원에 가까운 예산을 낭비하였으며, 최근 ISO(International Standard Organization)에서는 남북한 단일화 및 기계적 변환을 요구하고 있으나, 반달표 표기곤란, 편리성 결여, 북한의 주장등의 사유로 제정등을 거론하고 있는 실정에 있다. 잘 쓰지 않는 ASCII 코드 중에서 반달점 폰트를 제작하고 단어, 문장, 문서를 STRING으로 받아 알고리즘화된 음운법칙을 적용하여 소리글자로 변환하고 MOE테이블에서 대응글자를 참조하여 기계적 변환이 가능하도록 하였으며, 세련된 디자인, 풀다운 팝업방식을 채택, 2HD 1장으로 국내최초로 개발하였다.

  • PDF

인터넷에서의 개선된 벡터라이징 기법에 관한 연구 (A study of improve vectorising technique on the internet)

  • 김용호;이윤배
    • 한국정보통신학회논문지
    • /
    • 제6권2호
    • /
    • pp.271-281
    • /
    • 2002
  • 현재 대부분의 웹디자이너들은 비트맵 그래픽을 사용하여 고정된 포인트 사이즈로 하이 퀼리티를 보장하고 있지만 이는 파일 크기와 유연성에 결점을 가지고 있다. 특히 배너문자나 광고문자에 하이 퀼리티를 제공하기 위해서는 반드시 다른 비트맵 에디팅 프로그램을 사용해서 작업한 후, 비트맵 데이터로 HTML 문서에 첨가하는 방식을 따를 수 밖에 없다. 또한 HTML 문서 자체적으로 글꼴을 단순하게 출력하는 방법 이외에, 단순한 blink, underline, bold, italic을 제외한 글꼴을 직접 제어하는 HTML Tag 또한 가지고 있지 않기 때문이라고도 할 수 있다. 때문에 폰트의 아웃라인 데이터를 이용한 효과나 외곽선 패턴 분할 같은 작업을 위해서는 벡터에디팅 프로그램과 이미지 에디팅 프로그램, 그리고 최종적으로 HTML 문서에 삽입하는 번거로운 과정을 거쳐야만 하는 문제에 직면하게 된다. 따라서 본 논문에서는 HTML 문서의 폰트에 몇 가지 태그를 새롭게 제시함으로써, 폰트에 더욱 다양한 효과를 줄 수 있는 방법을 제안한다. 제안된 방법은 텍스트 정보 저장시 단순한 제어점과 외곽선 정보만을 가지고 화면 출력하기 때문에 웹브라우저 상에서 인쇄물과 동일한 품질의 한글 문자 표현이 가능하며, 이종의 플랫폼에 상관없이 정확한 문자 표현, 다양한 효과로 문자 표현이 가능하다.

투영 프로파일의 간략화 방법을 이용한 인쇄체 한글 문서 영상에서의 문자 분할 (Character Segmentation on Printed Korean Document Images Using a Simplification of Projection Profiles)

  • 박상철;김수형
    • 정보처리학회논문지B
    • /
    • 제13B권2호
    • /
    • pp.89-96
    • /
    • 2006
  • 본 논문에서는 한글 문서 영상에서의 문자 분할을 위한 2가지 알고리즘을 제안한다. 첫째는 투영 프로파일 기반 개선된 문자 분할 알고리즘이다. 이 알고리즘은 크게 문자수 추정, 분할 점 획득 및 문자 경계 탐색, 그리고 최적의 문자 분할 결과 선택으로 구성된다. 두 번째는 근접한 문자들이 서로 연결된 저 품질 문서 영상에 적합한 분할 알고리즘이다. 이 경우 연결요소를 제거하기 위해 투영 프로파일의 일부를 잘랐는데, 이를 ${\alpha}$-cut이라 한다. 그 후 전자의 방법을 변형하여 문자 분할을 수행한다. 다양한 폰트 속성을 갖고 품질이 낮은 43,572개의 한글 단어 영상을 대상으로 실험한 결과, 투영 프로파일 기반 개선된 문자 분할 알고리즘이 91.81%, 투영 프로파일에 ${\alpha}$-cut을 적용한 알고리즘이 99.57% 의 문자 분할 성공률을 나타내어 저 품질 한글 문서 영상에서 ${\alpha}$-cut을 이용한 문자 분할 알고리즘이 효과적임을 입증하였다.

근현대 한글 컴퓨터서체의 변화와 디지털폰트가 Caligraphy에 준 영향에 관한 연구 (Studies about Changes in Modern Korean Font and Effect of Digital Font to Caligraphy Design Thinking of Korea)

  • 이성수;최병묵
    • 한국인터넷방송통신학회논문지
    • /
    • 제8권6호
    • /
    • pp.159-163
    • /
    • 2008
  • 최근의 우리나라 타이포그래피의 트랜드가 다양해지고 있다. 그 중에서 2005년 이후에 나타난 트랜드가 캘리그라피인데 일반적인 담론은 우연의 현상으로 보고 있는 것이 현실이다. 그러나 한글캘리그래피의 태동은 한글타이포그라피에 관심이 있어 지켜보는 관점에서는 전혀 그렇지가 않다. 그 이유는 한글의 기계화가 미국이나 일본보다 늦어서이다. 우리나라는 일본에 병합되고 6.25민족동란을 겪으면서 경제적 자립이 늦어지고 그에 맞는 문화적인 발전도 늦어졌다. 우리글인 한글이 자립한 시점도 1990년 초반으로 컴퓨터의 도입과 함께 한글의 원도를 스캔하여 기본적인 기틀을 구축함과 시기를 같이한다. 80년대 후반부터 한글에 자주화에 많은 노력이 있었으나 소프트웨어적인 문제보다 한글은 하드웨어적인 부분의 어려움을 겪었다. 90년대 초반에는 주로 기본적인 글자생활을 하기위한 명조나 고딕체등 최정호의 서체를 컴퓨터라는 하드웨어에 끼워 맞추는 것이 전부였다면 그 이후 90년대 후반까지는 새로운 아이디어와 기획되어진 서체를 디자인적으로 양식화된 서체를 만들어 보급하는데 중점을 두었던 시대라 할 수 있다. 2000년대에 들어서서는 한국서체회사의 양대 메이저라고 할 수 있는 산돌글자은행과 윤디자인연구소가 새롭게 만들어 선보인 서체들이 산돌글자은행의 '옛멋글씨'(주로 한글개발이후 목판본)를 윤디자인연구소는 서예느낌이 나는 '필' 시리즈를 내놓음으로 손 글씨의 맛을 디자인 시장에 맛보였다. 이러한 반복된 과정은 지금의 캘리그래프로 나가는 자연스러운 원동력이 되었고 이 양대 메이저의 회사의 역할은 지금의 캘리그래피의 시대를 낳는 자연스러운 산파역할을 했다.

  • PDF

CKFont2: 한글 구성요소를 이용한 개선된 퓨샷 한글 폰트 생성 모델 (CKFont2: An Improved Few-Shot Hangul Font Generation Model Based on Hangul Composability)

  • 박장경;;최재영
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권12호
    • /
    • pp.499-508
    • /
    • 2022
  • 딥러닝을 이용한 한글 생성 모델에 대한 연구가 많이 진행되었으며, 최근에는 한글 1벌을 생성하기 위하여 입력되는 글자 수를 얼마나 최소화할 수 있는지(Few-Shot Learning)에 대하여 연구되고 있다. 본 논문은 28개 글자를 사용하는 CKFont (이하 CKFont1) 모델을 분석하고 개선하여 14개 글자만을 사용하는 CKFont2 모델을 제안한다. CKFont2 모델은 28글자로 51개 한글 구성요소를 추출하여 모든 한글을 생성하는 CKFont1 모델을, 24개의 구성요소(자음 14개와 모음 10개)를 포함한 14개의 글자만을 이용하여 모든 한글을 생성하는 모델로 성능을 개선하였으며, 이는 현재 알려진 모델로서는 최소한의 글자를 사용한다. 한글의 기본 자/모음으로부터 쌍자음(5), 복자음(11)/복모음(11) 등 27개를 딥러닝으로 학습하여 생성하고, 생성된 27개 구성요소를 24개의 기본 자/모음과 합한 51개 구성요소로부터 모든 한글을 자동 생성한다. zi2zi, CKFont1, MX-Font 모델 생성 결과와 비교 분석하여 성능의 우수성을 입증하였으며, 구조가 간결하고 시간과 자원이 절약되는 효율적인 모델로 한자나 태국어, 일본어에도 확장 적용이 가능하다.

한글 한자 비트 맵 폰트의 압축과 복원에 관한연구 (A study on compression and decompression of hanguel and chinese character bit map font)

  • 조경윤
    • 전자공학회논문지B
    • /
    • 제33B권4호
    • /
    • pp.63-71
    • /
    • 1996
  • In this paper, a variable length block code for real time compression and decompression of hanguel and chinese character bit map font is proposed. The proposed code shows a good compression ratio in complete form of hangeul myoungjo and godik style and chinese batang and doddum style bit map font. Besides, a compression and decompression ASIC is designed and simulated on CAD. The 0.8 micron CMOS sea of gate is used to implement the ASIC in amount of 5,200 gates, and it runs at simple hardware and compress and decompress at 33M bit/sec at maximum, which is ideal for real time applications.

  • PDF

최적선형변환에 의한 유사문자의 상세분류인식 (Detailed Recognition of Similar Characters Based on Optimum Linear Transform)

  • 김형원;김성원;양윤모
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.493-495
    • /
    • 2001
  • 본 논문에서는 문자 인식에서 두 단계의 식별과정을 통하여 인식률을 향상시키는 방법에 대하여 연구하였다. 한글 문자인식에서의 어려움은 인식대상 클래스가 많고 유사문자가 많은 반면, 여러 폰트의 글자를 하나의 글자를 하나의 클래스로 할 경우에는 그 문자의 분산이 더욱 커지게 되는 점이다. 따라서 본 연구에서는 문자의 분포를 고려하여 거리를 계산하는 Bayes에 의한 식별 함수를 1단계 인식과정에서 사용하여 1위 후보문자를 인식하였다. 2단계에서는 미리 준비된 1위 후부문자의 유사문자세트의 최적선형변환 공간에서 상세분류를 행하였다. 결과적으로 1단계의 Bayes거리반에 의한 인식률(91.1%)보다도, 또한 처음부터 모든 클래스에 대하여 최적선형변환에 의한 인식률(87.9%)보다 좋은 결과(92.9%)를 얻게되었다. 이로서 1단계의 대규모 문자세트에 대한 대분류에서는 문자의 분포를 고려하는 Bayes에 의한 인식이 유효하고, 2단계의 최적선형변환에 의한 인식은 소수의 유사문자들에 대한 변별력을 높이는데 유효함을 입증하였다.

  • PDF

날씨에 따른 한글 폰트 윤곽선 벡터 변형 알고리즘 (Hangul Font Outline Vector Modification Algorithm According to Weather Information)

  • 박동연;조세란;김남희;임순범
    • 한국멀티미디어학회논문지
    • /
    • 제25권9호
    • /
    • pp.1328-1337
    • /
    • 2022
  • Recently, research on various font designs has been actively conducted to deliver effective emotional information in a digital environment. In this study, we propose a Hangul font outline vector modification algorithm that effectively conveys sensitivity according to weather information and can be transformed immediately. The algorithm performs a series of transformations: sets outlines according to design pattern templates, calculates the glyph's position to reflect physical rules, splits outline segments into smaller sizes and deforms the outlines. Through this, we could create several vector font designs such as humidity, cloud, wind, and snow. The usability evaluation was close to good, so it can be used in diverse ways if we improve readability and effective design expression.