• 제목/요약/키워드: 문자

검색결과 3,502건 처리시간 0.036초

모바일 영상에서 한글 문자의 기하학적 특징을 이용한 에지 기반 텍스트 검출 (Edge-based Text Localization Using Geometrical Features of Hangul Character in Mobile Images)

  • 박종천;오명관;전병민
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2012년도 춘계학술논문집 2부
    • /
    • pp.820-822
    • /
    • 2012
  • 최근 모바일 기기의 보급이 일반화됨으로서 모바일 영상을 다루는 많은 응용프로그램이 개발되고 있다. 모바일 영상을 분석하여 정보를 추출한 결과를 인터넷 검색의 키워드로 연계함으로서 직관적인 멀티미디어 검색을 가능하도록 한다. 본 연구는 모바일 영상에 포함된 한글 문자영역을 검출하는 방법을 제안하였다. 한글 문자의 기하학적인 특징을 추출하고 이를 분석함으로서 후보 한글문자 영역을 검출하고, 검출된 후보 문자영역을 한글 자소 병합 알고리즘을 이용하여 병합한다. 그리고 후보 문자 영역을 한글 6가지 한글 문자 유형 특징을 이용하여 한글 문자 영역을 판별함으로서 최종적인 한글 문자영역을 검출한다. 실험결과, 문자영역 검출률의 성능 평가 요소로서 재현률이 향상됨을 알 수 있었다.

  • PDF

문서 이미지에서 문자 추출과 3차원 면적-가중치 그래프를 이용한 단어 그룹핑 (Text Extraction and Word Grouping using 3D Area-Weighted Graph in Document)

  • 옥세영;박환철;조환규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.556-558
    • /
    • 1998
  • 이미지 분석이나 데이터 베이스 인덱싱 또는 종이 문서를 전자 문서화 하는 문제는컴퓨터 비젼 응용분야에서 중요 관심사가 되어왔다. 이러한 문제들을 처리하기 위해서는 제일 먼저 이미지와 문자가 혼합되어 있는 문서에서 자동으로 문자와 이미지들을 분리해 내는 과정이 필수 적이다. 본 논문에서는 신문이나 광고등에서 볼 수 있는 이미지, 음각 문자와 양각 문자가 섞여 있는 문서에서 문자만을 추출하는 알고리즘을 제안한다. 이 알고리즘은 Run-length code를 이용하여 문자나 이미지의 경계선(bound) 모양의 특징을 추출하여 음각 문자와 이미지, 양각 문자를 구분한다. 그리고 추출된 글자들을 3차원 공간상에 매핑한 후 3차원 면적 가중치 그래프를 이용하여 관련된 단어들로 묶어주는 3차원 그룹핑 알고리즘을 제시한다. 실험결과로는 추출된 문자와 그룹핑된 결과를 보여준다.

  • PDF

자연영상에서 한글 자소 구조 및 유형 특징을 이용한 문자 영역 검출 (Character Region Detection Using Hangul Character Structure and Class Feature in Natural Images)

  • 박종천;권교현;전병민
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2011년도 춘계학술논문집 1부
    • /
    • pp.396-399
    • /
    • 2011
  • 모바일 기기의 보급이 확대됨으로서 모바일 기기에 내장된 카메라로 획득한 영상을 처리하는 다양한 종류의 응용프로그램이 개발되어 사용되고 있다. 대표적인 응용프로그램은 카메라로 찍은 영상의 사물 검색결과를 인터넷 검색엔진과 연계함으로서 키워드 입력 없이 검색할 수 있도록 하는 것이다. 본 연구는 그 중에서 한글 문자가 포함된 영상을 대상으로 영상검색 수행하는 연구로서 영상에서 한글 문자 영역을 검출하는 방법을 제안하였다. 한글 문자 구조 특징으로 한글 자소를 병합하여 후보 문자 영역을 추출하고 병합된 후보 문자 영역을 한글 6가지 문자 유형 특징을 기반으로 문자 영역을 여부를 판별함으로서 최종적인 문자 영역을 검출한다. 실험결과 문자영역 재현률이 향상됨을 알 수 있었다.

  • PDF

캡션 내 문자와 배경의 명암값 결정 (Determing intensity value of characters and backgrounds on caption)

  • 안권재;김계영
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2010년도 제42차 하계학술발표논문집 18권2호
    • /
    • pp.125-127
    • /
    • 2010
  • 본 논문에서는 동영상에서 비교적 단일 색상의 배경과 문자를 갖는 캡션을 문자인식을 위하여 문자와 배경간의 명암값 결정에 관한 내용이다. 먼저 캡션에 대해 그레이 스케일로 전환을 한 후, Otsu 방법[1]을 이용하여 이진화를 수행한다. 이 후 이진화 영상에서 흰색영역 검은색영역에 대해 각각 최대 내접 정사각형을 산출한다. 다음으로 각각의 영역에서 산출된 최대 내접 정사각형의 분산의 대소를 비교하여 문자영역과 배경영역을 결정한다. 이후 전역적인 잡음을 제거하기 문자영역에 대해 Otsu 방법을 이용하여 최종 문자영역을 결정한다. 제안된 방법의 문자영역의 명암값 결정 정확도는 약 99%로 매우 우수한 성능을 보였다.

  • PDF

표준 문자 패턴과의 미적 평가를 통한 한글 문자 익히기 시스템 (Hanguel Character Learning System by Beauty Evaluation front Standard Character Pattern)

  • 한군희;조동욱;전병민
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (하)
    • /
    • pp.1653-1656
    • /
    • 2000
  • 필기체 서체 인식은 온라인 문자 인식 시스템에서 주로 사용되는 시스템이다. 또한 오프라인 문자 인식 시스템은 문자 인식에만 초점이 맞추어져 있는 상황이다. 본 논문에서는 오프라인 방식으로 기초의 문자 인식에만 머물던 시스템을 문자 익히기까지 행할 수 있는 시스템으로 확장하는 방법을 제안 하고자 한다. 이를 위해 신명조체 80포인트에 대한 표준문자패턴을 생성하고, 유사도함수를 정의하며 이를 통해 입력 문자 패턴과의 유사성을 계산하여 문자 익히기를 행하고자 한다.

  • PDF

한국 서체문자미술의 흐름과 디자인마케팅에 관한 고찰

  • 박종갑
    • 마케팅과학연구
    • /
    • 제4권
    • /
    • pp.241-260
    • /
    • 1999
  • 국제적 미술 양식이면서 동양적 요소를 갖추고 있는 서체 문자마술을 통하여 우리 미술문화의 현재와 새로운 가능성을 찾아보았다. 서체 문자미술을 이루고 있는 기호인 한자와 한글을 우리 조상들이 생활 속에서 계속 사용하여 왔으며 나아가 조선에 이르러서는 민화에서 문자그림을 나타내고 있다. 현대에 들어서면서 우리의 이름 있는 작가들과 후학들이 서체에서 나타나는 문자를 이용하여 작품세계를 빛내고 있다. 현대미술의 서체적인 문자그림들의 평가와 그 가능성을 밝히고 디자인마케팅에 있어서 시각적인 학습과 기억에의 서체문자 미술의 활용에 대해 고찰하며, 특히 한국미술에 있어 서체적인 문자그림의 전통성과 현대미술에서의 표현을 통하여 서체 문자그림이 동시대 한국 미술문화를 이루는데 한 축을 이루고 있음을 밝히면서, 한국 서체 문자미술이 디자인마케팅에의 시각적 표현활용에 대해 언급하고 있다.

  • PDF

과학 데이타베이스에서 부분 문자열의 발생 빈도 예측 (Frequency Estimation of Substring for Scientific Database)

  • 배진욱;이석호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.536-538
    • /
    • 2003
  • 대량의 짧은 문자열들에 대해 부분 문자열의 발생 빈도를 예측하는 문제는 카운트 서픽스 트리를 미리 생성한 후 이를 이용함으로써 처리될 수 있다. 카운트 서픽스 트리는 모든 부분 문자열의 발생 빈도를 저장한 뒤 가지치기를 함으로써, 제한된 트리 크기와 발생 빈도 예측이라는 두 가지 목표를 처리한다. 하지만, 염기서열에서 처럼 저장된 문자열의 길이가 길어질 경우 카운트 서픽스 트리를 생성하기가 대단히 어려워진다는 문제점이 발생한다. 이 논문에서는 선삽입, 후가지치기 방식의 카운트 서픽스 트리 대신 처음부터 길이가 q 이하인 문자열들만을 삽입하는 큐그램 트리를 제안한다. 큐그램 트리는 제한된 트리 크기에 따라 저장할 부분 문자열의 크기를 미리 결정할 수 있으며, 데이타베이스에 저장된 문자열의 전체 길이가 N일 때 O(N) 시간에 생성 가능하다. 실험 결과 제한된 부분 문자열을 가지고 있음에도 불구하고 긴 부분 문자열의 발생 빈도를 매우 정확하게 예측할 수 있음을 보였다.

  • PDF

웨이블릿 트리를 이용한 문자열 매칭 위치의 효율적인 히스토그램 계산 (Efficient Histogram Calculation for String Matching Occurrences Using Wavelet Trees)

  • 김성환;탁해성;조환규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.61-64
    • /
    • 2014
  • 문자열 매칭은 긴 텍스트 문자열 상에 짧은 질의 문자열이 나타나는 모든 위치를 찾는 문제이다. 텍스트 문자열이 고정되어 있는 경우에는 접미사 트리나 접미사 배열과 같은 자료구조를 이용하여 보다 효율적인 문자열 매칭을 수행할 수 있다. 이 때 사용자 인터페이스에 관련되어, 또는 다른 통계적 처리를 수행하기 위하여 주어진 질의 문자열의 출현 위치에 대한 히스토그램을 계산할 필요성이 있다. 그러나 질의 문자열의 출현 횟수가 많은 경우 각 출현 위치를 모두 순회하며 집계해야 하므로 시간적으로 매우 비효율적이다. 본 논문에서는 웨이블릿 트리를 이용하여 접미사 배열을 색인함으로써 히스토그램 계산에 있어서 질의 문자열의 출현 횟수와는 시간적으로 독립적인 집계 기법을 제안한다. 또한 실험을 통하여 질의 문자열의 출현 횟수가 많을수록 제안 기법의 성능이 우수함을 보인다.

신경망을 이용한 뇌졸중 환자의 재활치료 시스템 개발에 관한 연구 (Developing an Artificial Neural Network Based Rehabilitation System for Stroke Victims.)

  • 김충호;김병주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 춘계학술발표대회
    • /
    • pp.229-231
    • /
    • 2013
  • 본 논문은 신경망 알고리즘을 사용하여 사람의 필기체 문자를 인식하였고, 이를 바탕으로 뇌졸중 환자의 재활치료를 돕는 시스템을 구현하였다. 뇌졸중 환자의 재활치료에서는 단기간에 환자에게 반복적인 행동 및 학습하는 것이 효율적이라고 알려져 있다. 본 연구에서는 뇌졸중 환자에게 문자 템플릿을 보여주었고, 환자는 문자 템플릿을 인지하고 문자 템플릿과 같은 형태의 문자를 쓰게 하는 방식을 사용하였다. 뇌졸중 환자가 쓴 필기체 문자를 신경망 알고리즘을 사용하여 인식하고, 자주 틀리는 문자에 대해 추천시스템 방식을 사용하여 틀린 문자와 모양이 비슷하거나 같은 문자를 추천해줌으로써 문자 쓰기학습의 반복을 유도하였다. 실험을 통해 제안한 시스템은 뇌졸중 환자의 인지장애와 손 기능장애에 대한 재활치료의 효과를 상승시켰다.

과다 분리 및 사전 후처리 기법을 이용한 한글이 포함된 무제약 필기 문자열의 오프라인 인식 (Off-Line Recognition of Unconstrained Handwritten Korean Words using Over-Segementation and Lexicon Driven Post-Processing Techniques)

  • 정선화;김수형
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권5호
    • /
    • pp.647-656
    • /
    • 1999
  • 본 논문에서는 오프라인 무제약 필기 한글 단어를 인식하기 위한 시스템을 제안한다. 제안된 단어 인식 시스템은 크게 다석가지 모듈-문자 분리,조합행렬생성, 특징 추출, 문자인식, 사전 후처리 -로 구성되어 있다. 문자 분리 모듈은 입력된 단어 영상을 하나의 문자보다 더 작은 이미지 조각으로 과다 분리하며 , 조합 행렬 생성모듈에서는 동적 프로그래밍 기법을 이용하여 분리된 이미지 조각들로부터 사전상의 모든 단어들과 대응되는 가능한 모든 조합을 생성한다. 문자인식모듈은 각 그룹에 대하여 일괄적으로 얻어진 특징과 유니그램을 이용하여 문자인식을 수행한다. 마지막으로 사전 후처리 모듈에서는 각 그룹에 대한 문자인식 결과와 단어 사전을 사용하여 입력단어에 대한 최종 인식 결과를 도출한다. 본 문에서 제안한 방법은 문자 분리, 문자 인식 및 후처리를 상호 보완적으로 결합함으로써 한글이 포함된 무제약 필기 문자열을 효과적으로 인식할 수 있다. 제안된 시스템의 성능을 평가하기 위하여 실제 우편 봉투 상에 쓰여진 필기 한글 단어 200개를 대상으로 실험을 하였다. 실험 결과 200개의 단어중 172개의 단어를 정인식하여 86%의 정확도를 얻을 수 있었으며 나머지 28개의 오인식된 단어들을 분석한 결과 대부분의 오류는 문자 인식기의 낮은 신뢰도 때문임을 알 수 있었다. 또한, 하나의 단어를 인식하기 위하여 약 2초가 소요되었다.