• 제목/요약/키워드: Character Extraction

검색결과 303건 처리시간 0.026초

오프라인 문서에서 개별 문자 추출과 한자 인식에 관한 연구 (A Study on the Extraction of an Individual Character and Chinese Characters Recognition on the Off-line Documents)

  • 김의정;김태균
    • 한국정보처리학회논문지
    • /
    • 제4권5호
    • /
    • pp.1277-1288
    • /
    • 1997
  • 본 논문에서는 인체 문서 인식을 위한 전처리 과정인 개별 문자 추출 방법과 인식 방법에 대하여 논한다. 전처리에서는 접촉 문자(touching charadcter) 또는 겹친 문자 (overlaapped character) 등과 같이 추출이 곤란한 문자를 개별 문자로 추출하는 것이다. 기존의 문자 분리 방법에서는 투영((projection)에 의한 방법과 외곽선(edge)추척에 의한 방법 등을 사용하여 왔으나, 제안된 방법은 문자열 추출 후 한번의 투영으로 연결 화소를 이용하여 개별 문자를 추출한다. 인식을 위해서는 최대불록화 방법(Maximum Block Mehtod:MBM)을 이용하여 특징 추출을 한다. 최대불록화는 문자를 투영 중 처음 찾아진 점에서부터 최대한 불록을 확정 시키는 방법이다. 문자를 이루는 최대불록들을 직선 불록과 사선 불록으로 분리후 골격화 시킨다. 특히 한자 인식에서 기존의 상용 문자 인식기와 비교하여 향상된 인식율을 얻을 수 있다.

  • PDF

딥러닝에 의한 한글 필기체 교정 어플 구현 (An Implementation of Hangul Handwriting Correction Application Based on Deep Learning)

  • 이재형;조민영;김진수
    • 한국산업정보학회논문지
    • /
    • 제29권3호
    • /
    • pp.13-22
    • /
    • 2024
  • 현재 디지털 기기의 확산과 함께 일상에서 손으로 쓰는 글씨의 비중은 점점 줄어들고 있다. 키보드와 터치스크린의 활용도 증가에 따라 한글 필기체의 품질 저하는 어린 학생부터 성인까지 넓은 범위의 한글 문서에서 관찰되고 있다. 그러나 한글 필기체는 여전히 개인적인 고유한 특징을 포함하면서 가독성을 제공하는 많은 문서 작성에 필요하다. 이를 위해 본 논문에서는 손으로 쓴 한글 필기체의 품질을 개선하고, 교정하기 위한 목적의 어플 구현을 목적으로 한다. 제안된 어플은 CRAFT(Character-Region Awareness For Text Detection) 모델을 사용하여 필기체 영역을 검출하고, 딥러닝으로서 VGG-Feature-Extraction 모델을 사용하여 필기체의 특징을 학습한다. 이때 사용자가 작성한 한글 필기체의 음절 단위로 신뢰도를 인식률로 제시하고, 또한, 후보 폰트들중에서 가장 유사한 글자체를 추천하도록 구현한다. 다양한 실험을 통해 제안한 어플은 기존의 상용화된 문자 인식 소프트웨어와 비교할만한 우수한 인식률을 제공함을 확인할 수 있다.

애니메이션 캐릭터 얼굴의 3차원 회전정보 측정 (Estimation of 3D Rotation Information of Animation Character Face)

  • 장석우;원선희;최형일
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권8호
    • /
    • pp.49-56
    • /
    • 2011
  • 최근들어 문화산업이 발전함에 따라 애니메이션 콘텐츠가 급속히 보급되고 있다. 본 논문에서는 사람의 얼굴 영상 대신 2차원의 애니메이션 캐릭터 영상을 효과적으로 분석하여 캐릭터의 얼굴을 추출한 후, 3차원적인 얼굴의 회전정보를 측정하고, 이를 3차원 얼굴 모델로 표현하는 방법을 제안한다. 제안된 시스템은 처음으로 입력되는 애니메이션 캐릭터 얼굴을 받아들여 얼굴과 얼굴의 주요 구성요소들의 주요 색상을 학습하고, 이를 주색상 모델로 생성한다. 그런 다음, 생성된 주색상 모델을 이용하여 새롭게 입력되는 애니메이션 캐릭터의 얼굴영역과 눈영역을 추출한 후, 추출된 영역으로부터 기준 좌표계와 대상 좌표계를 설정한다. 그리고 이 두 좌표계의 기하학적인 관계를 이용하여 애니메이션 캐릭터 얼굴이 3차원적으로 회전한 정보를 추출한다. 마지막으로, 추출된 3차원 회전정보를 시각적으로 용이하게 확인하기 위해서 3차원의 얼굴 모델에 회전정보를 반영하여 화면에 표현한다. 본 논문의 실험에서는 제안된 애니메이션 캐릭터 얼굴의 3차원 회전 정보 추출 방법의 성능을 평가하기 위한 실험결과를 보인다.

인쇄체 한글 및 한자의 인식에 관한 연구 (A Study on the Printed Korean and Chinese Character Recognition)

  • 김정우;이세행
    • 한국통신학회논문지
    • /
    • 제17권11호
    • /
    • pp.1175-1184
    • /
    • 1992
  • 본 논문에서는 한자를 포함하는 한글 문서 인식을 위한 인쇄체 한글, 한자의 구분과 인식 방법에 대하여 연구하였다. 제안된 한글, 한자 구분 방법은 한글의 수직모음과 수평모음의 구조적 특징을 이용하였다. 한글은 6가지 형태로 분류하고 분류된 각 형태에 대하여 세선화 과정을 거치지 않고 모음 우선추출에 의한 자모분리를 행하고 분리된 자음에 대하여 변형된 교차거리 특징을 이용하여 인식하였다. 한자에 대해서는 획교차수의 평균치를 이용하여 전체 한자 대상문자에 대해 분류를 하였으며, 문자의 획교차수와 흑점비율 특징을 이용하여 인식하였다. 한글과 한자의 구분에서는 90.5%의 분류율을 얻었다. 한글인식에 있어서는 대상문자 명조체 2512자에 대하여 90.0%의 형태 분류율을 얻었다. 인식 결과 실험 데이타 1278자에 대하여 92.2%의 인식율을 얻었다. 한자인식에 있어서는 대상문자 4585자에 대하여 분류한 결과 최대밀집 구간은 124자로서 약 1/40 정도로 분류되었음을 알 수 있었고, 인식실험 결과 89.2%의 인식율을 얻었다.

  • PDF

인쇄체 한자에서 Radical의 구조적 정보를 이용한 형식분류 및 부분패턴 추출에 관한 연구 (A Study on Type Classification and Subpattern Extraction Using Structural Information of Radical in Printed Hanja)

  • 김정한;조용주;남궁재찬
    • 한국통신학회논문지
    • /
    • 제16권3호
    • /
    • pp.232-247
    • /
    • 1991
  • 본 논문에서는 한자인식을 위한 전단계로서 인쇄체 한자를 대상으로 한자의 특성과 구조적 정보를 이용한 새로운 분류 알고리즘을 제안하였다. 한자는 자종이 많고 구조가 복잡하여 인식은 물론이고 분류하는 데에도 많은 어려움이 따른다. 이러한 문제점을 해결하기 위해, 본 연구에서는 한자패턴을 형식분류한 후 분류된 패턴에서 공통으로 존재하는 부분패턴을 추출하는 실험을 행하였다. 먼저 입력한 문자 패턴에 대해 전처리를 행한 후, 방향 세그먼트를 추출하여 4방향화면상에서 레이블링을 하고, 문자패턴의 부분패턴 존재 영역에 기초한 구조적 정보를 이용하여 12가지 형식으로 분류한 다음 그 부분패턴을 추출하였다. 중, 고교 교육용한자 1800자에 대해서 실험을 행한 결과 93.07%의 형식분류율을 얻었고, KS C5601표준 삼보 LBP 한자 폰트 4,888자에 대해서는 90.12%의 형식분류율을 얻었으며, 분류된 데이타로 부터 부분패턴을 추출하여 인식에의 적용가능성을 보였다.

  • PDF

골격을 이용한 문자 인식을 위한 지역경계 연산 (Regional Boundary Operation for Character Recognition Using Skeleton)

  • 유석원
    • 문화기술의 융합
    • /
    • 제4권4호
    • /
    • pp.361-366
    • /
    • 2018
  • 학습 데이터를 구성하는 각각의 문자들에 대해 서로 다른 글자체들을 픽셀 단위로 더해서 MASK를 만들고, 해당 MASK에 속하는 픽셀값들을 세 영역으로 나눈다. 실험 데이터를 골격 형태로 수정하고, 지역 경계 연산을 사용하여 수정된 실험 데이터의 배경 중에서 문자의 골격에 인접한 배경 영역을 구분하는 경계를 만든다. 수정된 실험 데이터와 MASK들 간의 불일치 정도를 계산해서 최소값을 가지는 MASK를 찾는다. 이 MASK가 해당 실험 데이터에 대해 최종적으로 인식된 학습 데이터 문자로 선택된다. 문자의 골격과 지역 경계 연산을 사용하는 인식법은 주어진 학습 데이터에 새로운 글자체를 추가해서 학습 데이터를 쉽게 확장할 수 있으며, 구현하기가 간단하면서도 높은 문자 인식률을 얻을 수 있다.

칼라지도영상에서의 벡터링 대상물 추출에 관한 연구 (A Study on the Extraction of Vectoring Objects in the Color Map Image)

  • 김종민;김성연;김민환
    • Spatial Information Research
    • /
    • 제3권2호
    • /
    • pp.179-189
    • /
    • 1995
  • 벡터링 도구를 이용하여 원판과 같은 양질의 도면이 없는 기존 지도를 수치화하기 위해서는 지도로부터 의미있는 벡터링 대상물(도로, 등고선, 해안선, filled-area, 문자, 기호 등)을 추출하는 방법이 필요하다. 본 논문에서는, 칼라지도로부터 추출해야 할 벡터링 대상물을 크게 곡선 미 직선, filled-area, 문자/기호로 분류하였으며, 대상물의 기하학적 특성과 칼라의 분포특성을 반영한 효율적인 벡터링 대상물 추출방법을 연구하였다. 곡선 및 직선 추출을 위해, 선의 연결성과 기하학적 특성을 반영한 방향성 마스크를 설계하고 이를 이용한 선추적 방법을 개발하였다. filled-area와 문자/기호의 경유에는 NxN 블럭간의 칼라분포 유사도 비교방법과 lical thresholding 방법을 각각 이용하여 벡터링 도구에서 수용할 수 있게 해줌으로써 소규모 지리정보 응용시스템을 보다 경제적으로 구축하는데 활용될 수 있을 것이다.

  • PDF

국내(國內) 문헌정보(文獻情報) 검색(檢索)을 위한 키워드 자동추출(自動抽出) 시스템 개발(開發) (Automatic Keyword Extraction System for Korean Documents Information Retrieval)

  • 예용희
    • 정보관리연구
    • /
    • 제23권1호
    • /
    • pp.39-62
    • /
    • 1992
  • 본(本) 연구(硏究)는 실제의 데이터 분석(分析)을 통하여 60여개의 조사(助詞)와 출현빈도는 높지만 검색(檢率)에 불필요한 320여개의 불용어(不用語)를 선정하여 좌우절단을 적용한 네 가지 유형으로 분류하고 조사(助詞)와 불용어 테이블을 구성하는 방법(方法)을 제시한다. 한글문헌에서 단어(單語)가 추출되면 조사의 효율적인 절단이 이러우지고, 한자어(漢字語)일 경우 한글로 변환되며, 2단계로 불용어제거(不用語除去) 과정을 거쳐 키워드를 선정하는 시스템을 개발한다. 여기서 추출된 키워드는 정보전문가(情報專門家)에 의해 추출된 색인어(索引語)와는 92.2%의 일치율을 보였다. 그리고 $4{\sim}6$글자로 구성된 복합어(複合語)의 경우 본(本) 연구(硏究)에서 제시한 분리방법에 의해 약 2배의 새로운 단어(單語)를 추가할 수 있었으며 그 중 58.8%가 키워드로 적합했다.

  • PDF

오미자(Schizandra Chinensis Bullion)의 휘발성 성분 (Volatile components of Schizandra Chinensis Bullion)

  • 김옥찬;장희진
    • Applied Biological Chemistry
    • /
    • 제37권1호
    • /
    • pp.30-36
    • /
    • 1994
  • 오미자(Schizandra Chinensis Bullion)를 simultanuous distillation 및 steam distillation으로 추출하여 정유의 관능적 특성을 조사하고, GC 및 GC-MS로 분석하여 47개 성분을 확인하였다. 오미자의 관능적 특성은 woody, camphorous하고 spicy, sour note이고 정유의 distillation extraction에 의한 수율은 0.64%, simultanous distillation extraction에 의한 수율은 0.88%이었다. 확인된 47개 성분 중에서 terpene계 화합물인 ${\alpha}-pinene$, camphene, limonene, ${\gamma}-terpinene$, p-cymene, ${\alpha}-ylangne$, ${\beta}-elemene$ 등이 많이 함유하고 있었다. 또 정유를 10개로 분획한 후 좋은 향기 특성을 갖고있는 4개의 분획물만을 선정하여 성분 분석하였다. 오미자 향기특성이 woody, camphorous하여 상쾌한 신맛을 느끼게 함으로 국산차 또는 음료용으로 개발전망이 밝다고 본다.

  • PDF

다중 프레임 병합을 이용한 스포츠 비디오 자막 영역 추출 (Caption Region Extraction of Sports Video Using Multiple Frame Merge)

  • 강오형;황대훈;이양원
    • 한국멀티미디어학회논문지
    • /
    • 제7권4호
    • /
    • pp.467-473
    • /
    • 2004
  • 비디오내에서의 자막은 비디오 내용을 전달하는 중요한 역할을 수행한다. 기존의 자막 영 역 추출방법들은 잡음에 민감하여 배경에서 자막 영역의 추출이 어려웠다. 본 논문에서는 다중 프레임 병합과 영역 최소 사각형을 이용하여 스포츠 비디오에서 자막 영역을 추출하는 방법을 제안한다. 전처리과정으로서 명암 대비 스트래칭과 Othu Method를 이용하여 적응적 임계치를 추출할 수 있다. 다중 프레임 병합에 의하여 자막 프레임 구간을 추출하고, 자막 영역은 미디언 필터링, 형태학적 불림, 영역 레이블링, 후보 문자영역 필터링, 영역 최소 사각형 검출에 의하여 효율적으로 추출된다.

  • PDF