• 제목/요약/키워드: 최소 문자 크기

검색결과 20건 처리시간 0.022초

계층적인 접근과 개선된 RBF 네트워크를 이용한 영문 명함 인식 (Recognition of English Calling Card by Using Hierarchical Approach and Enhanced RBF Networks)

  • 임은경;김광백
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 춘계 학술대회 학술발표 논문집
    • /
    • pp.141-146
    • /
    • 2003
  • 본 논문에서는 문자열 영역 추출을 위한 3배 축소 명함 영상, 개별 문자 추출을 위한 2배 축소 명함 영상, 정확한 인식을 위한 원본 영상으로 명함 영상을 분리하고, 분리된 영상들을 대상으로 각 영상 크기에 적합한 처리를 수행하고 각각의 결과들을 이용하여 정확한 문자를 추출할 수 있는 방법을 제안한다 그리고 추출된 개별 문자들의 인식을 위해서 ART1을 적용한 개선된 RBF 네트워크를 제안하여 적용한다 제안된 명함 추출 방법은 원 영상을 각각의 처리 방법에 적합하도록 하기 위해서 다해상도로 분리한다. 문자열의 추출은 문자들의 간격을 축소 시켜서 블록을 추출하기 쉬운 적절한 최소 크기의 영상에서 수행하고, 개별 문자의 추출은 문자들의 간격을 분리할 수 있는 적절한 영상의 크기에서 수행한다 개별 문자 인식은 문자의 형태학적 특성을 잘 나타내기 위해서 원본 영상에 적용한다 본 논문에서 제안한 추출 방법은 문자를 정확히 추출할 수 있으며 병렬 처리가 가능하여 처리시간을 단축할 수 있는 장점을 가진다. 그리고 정확히 추출된 개별 문자들을 개선된 R8F 네트워크를 이용하여 인식률을 향상시킨다. 제안된 명함 추출 및 인식 방법의 성능을 확인하기 위해서 실제 영문 명함 영상을 대상으로 실험한 결과, 기존의 방법보다 명함 추출 및 인식에서 우수한 성능이 있음을 확인하였다.

  • PDF

자연 영상에서 문자열 추출 (Text Location in Scene Images)

  • 최미화;김희승
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.389-391
    • /
    • 2000
  • 본 논문을 자연여상에서 문자열의 위치를 찾아내는데 모폴로지 연산인 WTH(white top-hats)과 BTH(black top-hars)을 사용하였다. 기존의 자연영상에서의 문자열추출은 칼라양자화방법 경우 각 칼라공간에서 문자열 추출과정을 반복 적용하거나 모델기반방법의 경우 문자열의 획의 크기나 특징에 따라서 하나의 영상을 여러 개로 분리 적용하여 추가적인 계산비용을 필요로 한다는 점을 개선하고 공간적 변화도를 이용하여 영상을 직접 처리하는 경우 최소 문자열 후보영역을 찾기 위한 프로세스를 다시 적용해야 한다는 점을 개선하였다. 자연영상에 문자열의 위치를 대략적으로 찾아내기 위해 WTH+BTH을 적용하여 그 결과로 문자열의 대략적 위치와 최소문자열후보영역을 동시에 얻을 수 있다. 문자열이 가지는 특성을 적용하여 문자열-비문자열 분류과정을 적용하고 후처리를 통해 완전한 문자열의 위치를 보여준다.

  • PDF

원형 패턴 벡터를 이용한 인쇄체 한글 인식 (Recognition of printed hangul text using circular pattern vectors)

  • 정지호;최태영
    • 대한전자공학회논문지SP
    • /
    • 제38권3호
    • /
    • pp.33-33
    • /
    • 2001
  • 본 논문에서는 단일 글꼴에 의존하는 원형 패턴 벡터(circular pattern vectors)를 이용하여 위치 이동, 크기 변화 그리고 회전에 무관한 새로운 인쇄체 한글 인식 알고리즘을 제안한다. 제안한 알고리즘은 2진 형태론(binary morphology)을 이용하여 입력 문자에 존재하는 잡음(noise)을 제거한 후, 원형 패턴벡터를 추출한다. 추출된 원형 패턴 벡터는 주어진 문자의 무게 중심을 원의 중심으로 하여 그린 여러 원주 상에 위치한 공간적인 분포 값을 나타내는 것이다. 마지막으로, 실험 문자는 기준 원형 패턴 벡터와 실험 원형 패턴 벡터간의 거리가 최소가 되는 기준 문자로 인식하게 된다. 제안한 알고리즘의 성능을 평가하기 위해, 크기 변화와 회전 변형이 있는 완성형 바탕체 한글 2,350자를 대상으로 모의 실험을 수행하였다. 제안한 알고리즘은 기존의 고리 투영 알고리즘보다 크기 변화와 회전 변형이 있는 한글 인식에 있어서 우수함을 보였다.

자유 필기체 한글에서의 자모 추출 (Phoneme Extraction from Freely Hand Written Han Gul)

  • 오원근;신영건;안영경
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.142-147
    • /
    • 1989
  • 필기체 문자는 인쇄체 문자와는 달리, 복잡한 변형이 따르므로, 인식 하는데 많은 문제점이 따른다. 그렇기 때문에 일반적인 필기체 인식에 있어서는 필기 자체에 대한 제한을 두어 변형을 적게한 문자를 인식 대상으로 삼고 있다. 이러한 문자는, 설정된 조건만 확실하게 만족한다면, 비교적 간단하게 인식 할 수 있다. 반면에, 자유 필기체 문자는, 제한 필기체 문자와는 달리 변형이 크기 때문에, 그 인식에는 많은 연구가 필요하다. 본 연구에서는, 자유 필기체 한글의 자모를 추출하는데 있어 두개의 parameter space method를 이용했다. 화상내에서의 혼합은, 기본적으로 5 개의 element ($\mid,\;\setminus,\;/,\;-,\;o$)로 구성되어 있고, 이 element를 정의하는데는 최소한 4 개의 parameter, 즉 element의 위치 [x, y], 크기 [1] 및 type [T] 등이 필요하다. 입력 화상에서 추출된 직선 및 원의 성분은 [x, y, l] 과 [x, y, T]의 2 개의 3-D parameter space 에 누적되고, parameter space 상에서의 병합 분할 과정을 거쳐, element 가 형성된다. 추출된 element 들은, parameter space 상에서의 방향성 및 상호 위치 관계에 의한 조합 형태로서, 미리 기술되어진 자모 모델과 비교되어 인식된다. 본 방법의 특정은, 문자의 크기에 무관하고, 해석방법에 의해서는, 끊어진 element나 불필요한 element 등의 왜곡된 element 들의 처리가 가능한 점, 4 차원 parameter space를 두개의 3 차원 parameter space로 분리, 처리시간과 기억용량의 절약을 기한점 등을 들 수 있다.

  • PDF

웨이브릿 변환과 모멘트를 이용한 문자인식에 관한 연구 (A Study on Character Recognition using Wavelet Transformation and Moment)

  • 조민환
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권10호
    • /
    • pp.49-57
    • /
    • 2010
  • 본 논문에서는 웨이브릿 변환을 이용한문자인식 방법 중 문자의 최소 단위인자음과 모음을 분리시켜 문자의 모멘트를 분석하여 산출되는 정보를 사전에 컴퓨터에 입력시켜 문서화된 수기 문자를 컴퓨터에 저장하고 인식시키는 방법에 접근 하였다. 연구는 획득한 문장 이미지에서 잡음을 없애고 줄 단위로 분리, 분리된 줄 단위 문장은 한 문자 단위로 다시 분리된 후 자음과 모음으로 분리 하였다. 분리된 자소는 CVIPtools를 사용하여 히스토그램 평활화와 침식 및 평균값 필터를 처리한 후 C++를 이용하여 세선화 처리하고 세선화된 자소는 팽창 및 크기 변환하여 모든 자소가 동일 굵기, 크기 이미지로 만들었다. 표준화 이미지는 이진화 이미지로 변환하여 3단계 웨이브릿 변환을 이용하여 데이터의 양을 1/64로 줄인 후 해밍거리를 조사하였다. 연구 결과 다양한 'ㄱ'상호간 및 'ㅅ'상호간의 일치도는 매우 높게 나타났고, 서로 상이한 'ㄱ'과 'ㅅ'을 비교 했을 때 상호간 일치도가 매우 낮게 나옴을 알 수 있었다. 이 연구 결과로 더 많은 수기 자소들에 대한 해밍거리조사가 이루어지면 각각의 자음과 모음의 모멘트 구분하여 수기 문자 인식에 중요한 정보를 알 수 있을 것으로 판단된다.

원형 패턴 벡터를 이용한 인쇄체 한글 인식 (Recognition of Printed Hangul Text Using Circular Pattern Vectors)

  • 정지호;최태영
    • 대한전자공학회논문지SP
    • /
    • 제38권3호
    • /
    • pp.269-281
    • /
    • 2001
  • 본 논문에서는 단일 글꼴에 의존하는 원형 패턴 벡터(circular pattern vectors)를 이용하여 위치 이동, 크기 변화 그리고 회전에 무관한 새로운 인쇄체 한글 인식 알고리즘을 제안한다. 제안한 알고리즘은 2진 형태론(binary morphology)을 이용하여 입력 문자에 존재하는 잡음(noise)을 제거한 후, 원형 패턴벡터를 추출한다. 추출된 원형 패턴 벡터는 주어진 문자의 무게 중심을 원의 중심으로 하여 그린 여러 원주 상에 위치한 공간적인 분포 값을 나타내는 것이다. 마지막으로, 실험 문자는 기준 원형 패턴 벡터와 실험 원형 패턴 벡터간의 거리가 최소가 되는 기준 문자로 인식하게 된다. 제안한 알고리즘의 성능을 평가하기 위해, 크기 변화와 회전 변형이 있는 완성형 바탕체 한글 2,350자를 대상으로 모의 실험을 수행하였다. 제안한 알고리즘은 기존의 고리 투영 알고리즘보다 크기 변화와 회전 변형이 있는 한글 인식에 있어서 우수함을 보였다.

  • PDF

문자 별 특징 모델을 이용한 한글 문서 영상에서 키워드 검색 (Keyword Spotting on Hangul Document Images Using Character Feature Models)

  • 박상철;김수형;최덕재
    • 정보처리학회논문지B
    • /
    • 제12B권5호
    • /
    • pp.521-526
    • /
    • 2005
  • 본 논문에서는 저 품질의 한글 문서 영상에서 OCR 기반 검색 시스템의 대안으로 키워드 검출 시스템(Keyword Spotting)을 제안하고 OCR 기반 문서 검색 시스템과 비교한다. 제안 시스템은 문자 분할, 키워드 특징 추출 그리고 단어 매칭으로 구성된다. 문자 분할 단계에서는 인접한 두 문자간의 연결을 효과적으로 분리하면서 문자 넓이 값의 분산이 최소가 되도록 하는 문자 분할 방법을 제안한다. 키워드 특징은 서체별 문자 모델의 결합으로 구성한다. 단어 매칭 단계에서는 문자 매칭에 기반한 단어 대 단어 매칭 방법을 적용한다. 본 논문에서 제안한 키워드 검출 시스템의 성능을 평가하기 위해 한글 문서 영상을 대상으로 OCR 기반 문서 검색 시스템과 비교하였다. 그 결과 한글 글자 크기가 작고 문서의 상태가 좋지 않은 경우 제안한 키워드 검출 시스템에 의한 검색 성능이 OCR 기반 검색 시스템 보다 우수함을 입증하였다.

DNA시퀀스 데이터베이스를 위한 저장-효율적인 Trie 인덱싱 기법 (A Storage-Efficient Trie Indexing Method . for DNA Sequence Databases)

  • 김강모;서남호;원정임;윤지희;박상현;김상욱
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.31-33
    • /
    • 2004
  • 대규모 DNA 시퀀스를 대상으로 하여 서브시퀀스를 고속으로 검색하기 위한 인덱싱 방법으로서 접미어 트리가 유용하다. 그러나 접미어 트리는 데이터 크기의 약 100배에 해당하는 방대한 저장 공간을 필요로 한파. 본 논문에서는 기존 접미어 트리의 검색 성능을 유지하며, 저장 공간을 획기적으로 감소시킬 수 있는 새로운 인덱스 구조를 제안한다. 제안된 인덱싱 방안에서는 DNA 시퀀스 내의 모든 염기 위치에 고정 길이의 슬라이딩 윈도우를 위치시켜, 윈도우 크기에 해당하는 연속된 서브시퀀스를 추출한 후, 이들을 대상으로 트라이를 구성한다. 트라이는 저장 공간 감소를 위하여 각 문자를 최소 비트 정보로 표현하며, 저장 구조로서 포인터를 사용하지 않는 디스크 기반의 이진 트라이 구조를 사용한다. DNA 서브시퀀스 검색을 효율적으로 처리하기 위한 인덱스 기반의 질의 처리 알고리즘을 제안하고 실험을 통하여 그 유용성을 보인다. 제안된 인덱스는 접미어 트리의 약 10분의 1의 저장 공간을 필요로 하며, 데이터 크기 증가에 거의 영향을 받지 않는 안정된 고속 검색 성능을 지원한다.

  • PDF

방향성분 특징과 Fisher Measure를 이용한 간판영상 한글인식 (Recognition of Korean Text in Outdoor Signboard Images Using Directional Feature and Fisher Measure)

  • 임준식;김수형;이귀상;양형정;이명은
    • 정보처리학회논문지B
    • /
    • 제16B권3호
    • /
    • pp.239-246
    • /
    • 2009
  • 본 논문은 모바일 폰 기반의 간판 영상내 한글 문자인식에 관한 연구로써 인식 대상은 간판영상에서 추출된 상호명으로 하였고 인식대상 문자 수는 상호명 빈도수 기반 808자로 한정하였다. 인식과정은 특징 추출, 대분류, 상세 분류로 구성되고 특징 추출과정에서는 문자영상의 크기, 잡음 및 왜곡에 강건한 비선형 방향성분 특징을 이용하였고 대분류 과정에서는 추출된 특징과 인식 대상문자에 대하여 최소거리 분류를 수행하고 10순위까지의 후보 문자를 추출하였다. 상세 분류 과정에서는 Fisher discriminant measure 이용하여 대분류에서 발생 할 수 있는 오인 식 결과를 보완하였다. 실험결과 1순위 인식률은 80.45%이고 5순위까지의 누적 인식률은 93.51%를 보였다.

2-D Conditional Moment for Recognition of Deformed Letters

  • Yoon, Myoong-Young
    • 한국산업정보학회논문지
    • /
    • 제6권2호
    • /
    • pp.16-22
    • /
    • 2001
  • 본 논문에서는 화상자료의 특성인 이웃 화소간의 종속성을 표현하는데 적합한 깁스분포를 바탕으로 특징벡터를 추출하여 변형된 글자를 인식하는 새로운 방법을 제안하였다. 추출된 특징벡터는 이미지의 크기, 위치, 회전에 대하여 불변한 특성을 갖는 2차원 조건부 모멘트로 구성된다. 변형된 글자 인식을 위한 알고리즘은 특징벡터 추출하는 과정과 패턴을 인식하는 과정으로 구성하였다. (i) 특징벡터는 하나의 이미지에 대하여 추정된 조건부 깁스분포를 바탕으로 2차원 조건부 모멘트를 계산하여 추출한다. (ii) 변형된 문자 인식은 제안된 판별거리함수를 계산하여 최소거리를 산출한 미지의 변형된 문자를 원형문자로 인식한다. 제안된 방법에 대한 성능평가를 위하여, 생성된 훈련 데이터를 만들어 Workstation에서 실험 한 결과 96%이상의 인식성능이 있음을 밝혔다.

  • PDF