• 제목/요약/키워드: Hangul recognition

검색결과 150건 처리시간 0.023초

퍼지 멤버쉽 함수로 최적화된 LVQ를 이용한 패턴 분류 모델 (Pattern Classification Model using LVQ Optimized by Fuzzy Membership Function)

  • 김도현;강민경;차의영
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권8호
    • /
    • pp.573-583
    • /
    • 2002
  • 패턴인식은 전처리 과정에서 패턴들의 특징을 추출하고 이를 학습을 통하여 유사한 패턴들끼리 클러스터링을 한 다음 식별 과정을 거쳐 인식하게 된다. 본 연구에서는 OCR 시스템에서의 패턴 인식을 위한 패턴 분류 모델로서 퍼지 멤버쉽 함수를 도입하여 LVQ 학습 알고리즘을 최적화한 F-LVQ(Fuzzy Learning Vector Quantization)를 제안한다 본 논문의 효율성을 검증하기 위하여 한글 및 영어 22종의 글꼴에 대한 숫자 데이타 220개 패턴을 학습한 후 이를 다양한 형태로 변형시킨 4840개의 테스트 패턴에 대하여, 기존의 여러 가지 패턴 분류 모델과의 비교 분석을 통해 그 유효성과 강인성을 증명하였다.

한글 문장의 자동 띄어쓰기를 위한 어절 블록 양방향 알고리즘 (Eojeol-Block Bidirectional Algorithm for Automatic Word Spacing of Hangul Sentences)

  • 강승식
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권4호
    • /
    • pp.441-447
    • /
    • 2000
  • 자동 띄어쓰기는 띄어쓰기가 무시된 한글 문서의 자동색인이나 문자인식 시스템에서 줄바꿈 문자에 대한 공백 삽입 문제 등을 해결하는데 필요하다. 이러한 문서에서 공백이 삽입될 위치를 자동으로 찾아주는 자동 띄어쓰기 알고리즘으로 문장 분할 기법과 양방향 최장일치법을 이용한 어절 인식 방법을 제안한다. 문장 분할은 한글의 음절 특성을 이용하여 어절 경계가 비교적 명확한 어절 블록을 추출하는 것이며, 형태소 분석기를 이용한 양방향 최장일치법에 의해 어절 블록에 나타난 각 어절들을 인식한다. 4,500여 어절로 구성된 두 가지 유형의 문장 집합에 대하여 제안한 방법의 띄어쓰기 정확도를 평가한 결과 '공백 재현율'이 97.3%, '어절 재현율'이 93.2%로 나타났다.

  • PDF

오프라인 한글 문자 인식을 위한 효율적인 오인식 단어 교정 방법 (An Efficient Correction Method for Misrecognized Words in Off-line Hangul Character Recognition)

  • 이병희;김태균
    • 한국정보처리학회논문지
    • /
    • 제3권6호
    • /
    • pp.1598-1606
    • /
    • 1996
  • 문자 인식 과정을 거치고 난 후에 발생하게 되는 오인식된 문자들을 언어적 지식 을 이용하여 교정하는 문자 인식 후처리 과정이 반드시 필요하다. 본 논문에서는 한 국어의 형식 측면에서 품사를 재분류하고 사전을 구성하며 한글 어절의 상태 전이도 를 구성하고 형태소 분석을 위해 Head-tail구분법을 적용해 단어를 분리하였다. 또한 본 논문에서는 효율적인 단어분리와 교정을 위해 여러 문서와 책들로부터 새롭게 조 사의 결합형으로 900여개를, 규칙 어미의 활용형으로 800여개를 수집하였다. 그리고 불규칙 용언의 활용형을 위해 국어학에 나오는 9개의 불규칙을 조사하여 활용형을 구 축하였고 자동적 교체와 불구동사의 활용형도 사전에 등록하여 어절을 분석하는데 이 용하였다. 어느 인식 시스템을 가지고 문서를 인식한 결과 93.7%의 인식률을 보인 것 을 본 단어교정방법을 적용한 결과 97% 인식률을 향상시킬 수 있었다.

  • PDF

증강현실을 이용한 한글의 색상 인식과 자소 패턴 분리 (Color Recognition and Phoneme Pattern Segmentation of Hangeul Using Augmented Reality)

  • 신성윤;최병석;이양원
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권6호
    • /
    • pp.29-35
    • /
    • 2010
  • 증강현실은 저렴한 장비의 보급으로 영상의 사용이 다양화 되면서, 실세계의 영상에 추가적인 이미지 및 영상을 출력할 수 있다. 최근 많은 증강현실 기법이 등장해 있으나 아직까지 정확한 문자 인식을 수행하지는 않고 있다. 본 논문에서는 시각적으로 글자로 표시된 마커를 인식하고, 마커의 글자의 색상과 일치하는 색을 찾아낸다. 그리고 그 글자를 인식하여 화면에 나타내 주는데, 본 논문에서는 수평 프로젝션에 의한 자소 패턴 분리 알고리즘을 적용하여 한글 표현의 6형식에 맞도록 자소를 분리하는 방법을 제시한다. 또한 증강 현실을 이용한 자소 패턴 분리를 실험 예제를 통하여 각 단계별로 진행되는 결과를 보여주었고, 실험 결과 검출률이 90% 이상임을 알 수 있었다.

한국어 음가의 표기 복원을 위한 표기 후보 생성 및 감소에 관한 연구 (A Study On Generation and Reduction of the Notation Candidate for the Notation Restoration of Korean Phonetic Value)

  • 이상범;박성현
    • 정보처리학회논문지B
    • /
    • 제11B권1호
    • /
    • pp.99-106
    • /
    • 2004
  • 음절 복원은 음성 인식 장치에서 인식된 음가열을 발성 이전의 표기 형태로 복원하는 과정이다. 본 논문에서는 음절 복원 과정을 위하여 표준 발음법을 기반으로 음절 복원 규칙을 작성하였다. 음절 복원 규칙을 이용하여 표기 후보 집합의 생성 방법을 연구하였다. 또한 생성된 표기후보의 수를 감소시키기 위하여, 비 표기 음절을 포함한 표기 후보 감소, 비 어휘 음절을 포함한 표기 후보 감소, 비어간 음절을 포함한 표기 후보 감소의 3단계 감소 과정을 제안하였다. 제안된 방법을 통하여 실험한 결과 평균 74%의 표기 후보 감소율을 나타내었다.

필기체 문자 인식에서 특징 추출을 위한 공간 필터링 신경회로망 (A Spatial Filtering Neural Network Extracting Feature Information Of Handwritten Character)

  • 홍경호;정은화
    • 전자공학회논문지CI
    • /
    • 제38권1호
    • /
    • pp.19-25
    • /
    • 2001
  • 공간 필터링 신경회로망을 이용한 필기체 문자 인식의 특징 추출 방법을 제안한다. 필기체 문자의 특징 추출을 위한 신경망은 먼저, 불규칙한 화소를 제거하는 전처리를 수행한다. 그 후, 윤곽선 검출 및 제거를 통해 외곽선 정보들을 소거한다. 그리고 문자의 특징에 해당하는 정보를 추출한 후 잡음을 제거한다. 제안된 시스템은 시각영역에서 나타나는 여러 가지 세포들의 수용 영역에 대응하는 공간 필터를 활용한 것이다. 제안된 시스템의 타당성을 확인하기 위한 실험은 PE2 데이터를 사용하였다. 실험을 통해 공간필터링 신경회로망을 이용한 필기체 문자의 특징 추출 시스템은 곡선이나 원, 사각형이 포함된 형태의 필기 문자에서도 특징 추출이 용이하다는 것을 확인할 수 있다.

  • PDF

수정된 Neocognitron을 사용한 필기체 한글인식 (Study on the Neural Network for Handwritten Hangul Syllabic Character Recognition)

  • 김은진;백종현
    • 인지과학
    • /
    • 제3권1호
    • /
    • pp.61-78
    • /
    • 1991
  • 본 논문은 역행 통로(backward path)를 가진 수정된 Neocognitron 을 한글 음절 인식을 위해 적용한 결과에 관한 것이다. Fukushima의 논문에서 Neocognitron이 $19{\times}19$ 크기의 필기체 숫자를 인식할 수있다고 논술하였다. 본 논문에서는 스캐너 또는 마우스를 이용하여 필기체 한글 문자 또는 그 일부의 $61{\times}61$ 영상을 입력하였다. 수정된 Neocognitron은 3쌍의 Us, Uc층으로 구성되어있다. 본 신경회로망에서 마지막 인식층인 Uc층은 $5{\times}5$ 크기의 세포로 된 24개의 명(plane)으로 구성되어 있는데, 각각의 세포들은 동시에 주의력(attention)을 받아들이느 자소(grapheme)의 존재와 입력층에서의 상대적 위치를 구별할 수 있다. 본 신경회로망은 10개의 단모음 자소, 14개의 단자음 자소와 그들의 공간적 특징을 가지고 학습시켰다. 쉽게 학습되지 않는 패턴들은 여러번 학습시켰다. 왜곡, 잡음, 크기변화, 변형, 회전 등을 갖는 개개의 자소를 분류할 수 있도록 학습된 신경망을 한글 음절의 인식을 위해 사용하였으며, 음절자내의 영상 분할 작업을 위해 선택적 주의력 기법을 사용하였다. 입력문자에 대한 초기 표본 실험에서 본 모형은 필기체 한글 음절자의 시험패턴중 79%를 정확하게 인식하였다. 이 연구결과는 Neocognitron이 입력 영상을 인식가능한 부분으로 분할함으로써 큰크기의 분자 집합을 갖는 필기체 문자를 인식할수 있는 강력한 모형임을 시사해준다. 똑같은 접근 방법이 구조나 자소가 아주 복잡한 한자의 인식에도 적용될 수 있다고 본다. 그러나, 모의실험에서 처리시간에 있어 매우 심한 병목현상을 보여 주었다. 모형의 실질적인 사용을 위해서는 신경칩으로서의 구현이 선결되어야 할 것이다. 또, 복모음, 복자음으로 구성된 한글 음절자 인식을 위하여 모형에 대한 더 깊은 연구가 수행되어질 필요가 있다. 두개의 단자모사이의 이웃지역을 정확히 인식하는 것은 이렇나 작업을 위해 매우 중요한 일이 될 것이다.

필기체 문자 영상의 이진화에 관한 연구 (A Study on Binarization of Handwritten Character Image)

  • 최영규;이상범
    • 한국컴퓨터산업학회논문지
    • /
    • 제3권5호
    • /
    • pp.575-584
    • /
    • 2002
  • 온라인 필기체 문자 인식은 필기의 순서와 획의 위치를 알 수 있어 신경망을 이용한 자소의 효과적인 분할로 큰 성과를 이루었다. 그러나 오프라인 필기체 문자 인식은 동적인 정보와 시간적인 정보를 가지고 있지 않고, 다양한 필기와 자소의 겹침이 심하며 획 사이의 잡영을 많이 가지고 있어 불완전한 전처리를 수행하여야 하는 어려움을 가지고 있다. 따라서 오프라인 필기체 문자 인식은 다양한 방법의 연구가 필요하다. 본 논문에서는 Watershed 알고리즘을 오프라인 필기체 한글 문자 인식 전처리에 적용하였다. 여기서 Watershed 알고리즘의 수행 시간과 결과 영상의 품질을 고려해 Watershed 알고리즘 4단계에서 효과적인 적용방법을 제시하였다. 효과적으로 구성된 Watershed 알고리즘을 전처리에 적용함으로써 영상 향상과 이진화에 좋은 결과를 얻었다. 실험에서는 기존의 방법과 본 논문 방법을 수행 시간과 품질로써 평가했다. 실험 결과 기존의 방법은 평균 2.08초, 본 논문 방법은 평균 0.86초의 수행 시간이 걸렸다. 결과 영상의 품질은 본 논문 방법이 기존의 방법에 비하여 문자의 획 사이의 잡영을 효과적으로 처리하였다.

  • PDF

조명 정규화 및 하이브리드 분류기를 이용한 계량기 숫자 인식 (Meter Numeric Character Recognition Using Illumination Normalization and Hybrid Classifier)

  • 오한글;조성원;정선태
    • 한국지능시스템학회논문지
    • /
    • 제24권1호
    • /
    • pp.71-77
    • /
    • 2014
  • 본 논문에서는 저조도 및 음영이 생기는 조명 환경하에서 성능이 개선된 계량기 숫자 인식 방법을 제안한다. 저조도 및 음영 문제를 해결하기 위해 LN(Local Normalization) 처리 기법을 이용한 조명 정규화를 수행한 후, 계량기 숫자 영역 검출과 3단계 계량기 숫자 분할이 이루어진다. 마지막으로 분할된 숫자 데이터를 분류하기 위한 하이브리드 숫자 분류기가 적용된다. 제안된 하이브리드 숫자 분류기는 역전파 신경망과 템플레이트 매칭의 연속 결합으로 이루어지고, 계량기 숫자 분류에 보다 강인한 휴리스틱 규칙에 의해 최종적으로 숫자를 분류한다. 저조도 및 음영 조명 환경하의 다양한 계량기 종류에 대해 직접 촬영하여 자체 제작한 계량기 이미지 데이터베이스에 기반한 실험을 통해 본 논문에서 제안한 숫자 인식 방법을 평가하고, 제안된 계량기 숫자 인식 방법이 효과적으로 잘 동작함을 확인하였다.

기울어진 신규차량번호판 인식을 위한 FE-MCBP (The FE-MCBP for Recognition of the Tilted New-Type Vehicle License Plate)

  • 구건서
    • 한국컴퓨터정보학회논문지
    • /
    • 제12권5호
    • /
    • pp.73-81
    • /
    • 2007
  • 본 논문은 문자의 특징을 추출하여 다중연결 인식기를 통해 신규 자동차 번호판을 인식하는 방법을 제안한다. 이를 위해 영상 전처리과정과 번호판 영역 추출을 위한 과정과 개별문자 추출 과정을 통해 얻어진 개별문자를 인식을 위해 FE-MCBP를 제안하였다. FE-MCBP는 차량 번호판처럼 한글과 숫자가 혼용된 문자열을 인식할 때는 문자의 특징을 기반으로 하는 인식기로서 기존 역전파 인식기에 비해 인식률 면에서 9.7%가 향상되었다. 아울러 기울어진 번호판 영상을 정규화하기 위하여 직선 성분 검출 및 영역 좌표 생성기술을 이용하였다. 시스템 운용 면에서 볼 때 신규차량번호판 인식 시스템은 번호판 영역이 기울진 영상도 인식이 가능하기 때문에 비스듬하게 획득된 번호판 영상이나, 훼손된 번호판의 경우도 인식이 가능한 것으로 연구결과 나타났다.

  • PDF