• 제목/요약/키워드: 혼합 문자 인식

검색결과 17건 처리시간 0.037초

통계적 기법에 의한 한-영 문자열의 자동 전환 (Statistical Approach to the Automatic Korean-English String Conversion)

  • 안영훈;강승식
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.205-208
    • /
    • 2001
  • 한글 혹은 영어 문자열을 입력할 때 입력 모드를 수동으로 전환하지 않더라도 입력된 문자열이 한글인지, 영어인지를 자동으로 판단하여 해당 문자열로 변환하는 방법을 제안한다. 한글 문자열일 확률을 계산하기 위해 음절 구성 요건과 음절 빈도 정보를 이용하고, 영어 문자열일 확률을 계산하기 위해 영어 bigram 및 trigram 정보를 이용한다. 또한, 한글과 영어가 혼합된 문자열은 한글일 확률과 영어일 확률이 교차되는 경계 위치를 인식함으로써 혼합 문자열을 생성한다.

  • PDF

다중 인식기 및 검증기를 갖는 거버문자 인식 시스템 (A Gerber-Character Recognition System with Multiple Recognizers and a Verifier)

  • 오혜원;박태형
    • 한국지능시스템학회논문지
    • /
    • 제14권1호
    • /
    • pp.20-27
    • /
    • 2004
  • 인쇄회로기판 제작에 사용되는 국제표준규격의 거버 파일로부터 부품 위치 이름을 자동으로 추출하기 위한 문자인식 시스템을 제안한다. 거버 파일은 벡터형식의 그림파일로서, 각종도형 및 기호가 문자와 혼합되어 있으며, 가로쓰기와 세로쓰기 및 역 세로쓰기가 병용된다. 거버문자인식 시스템은 거버 파일에서 문자패턴을 추출하여 분리하는 전 처리 단계와 추출된 패턴을 인식하는 인식단계 및 인식된 문자와 숫자를 조합하여 부품위치이름을 구성하는 후 처리단계로 구성된다. 특히 인식률 향상을 위하여 신경회로망에 의한 다중인식기 및 구조적 특징을 이용한 검증기를 개발한다. 본 논문에서 개발된 거버문자 인식시스템은 인쇄회로기판 조립 및 검사 장비를 위한 자동 프로그래밍 시스템에 사용되어, 전자제품 제조시스템의 생산성 향상에 기여할 수 있다.

음성 문자 공용인식기를 위한 SSMS 기반 가변 파라미터 모델 (A Variable Parameter Model based on SSMS for an On-line Speech and Character Combined Recognition System)

  • 석수영;정호열;정현열
    • 한국음향학회지
    • /
    • 제22권7호
    • /
    • pp.528-538
    • /
    • 2003
  • 음성 문자 공용 인식 시스템은 PDA (Personal Digital Assistants)와 같은 휴대용 모빌 환경에서 음성인식과 문자인식을 적용하기에 적합하도록 개발되었다. 공용 인식 시스템은 특징 파라미터 추출에 있어서는 음성과 문자부분이 독립적으로 수행되나, 인식 과정은 단일 엔진으로 수행된다. CHMM (Continuous Hidden Markov Model)을 이용하는 인식엔진은 고정 파라미터 모델 구조 대신에 동일한 인식률을 유지하면서 모델의 파라미터의 수를 효과적으로 줄일 수 있는 가변 파라미터 모델 구조를 사용하는 것이 유리하다. 본 논문에서는 문맥 독립 가변 파라미터 모델을 생성하기 위해 SSMS (Successive State and Mixture Splitting) 방법을 제안한다. SSMS 알고리즘은 시간 방향 분할과 혼합수 방향분할을 통해 적절한 상태수와 각 상태당 적절한 혼합수를 가지는 모델을 생성한다. 음성 인식 실험 결과 동일한 인식성능을 나타내는 경우 SSMS 기반 가변 파라미터 모델이 고정 파라미터 모델에 비해 GOPDD (Gaussian Output Probability Density Distribution)의 수가 40% 감소함을 확인할 수 있었다.

다중 해상도 병합을 이용한 수정된 적응 공명 이론 신경망: 혼합 문자 인식 적용 (The Modified ART1 Network using Multiresolution Mergence : Mixed Character Recognition)

  • 최경현;김민제
    • 정보처리학회논문지B
    • /
    • 제14B권3호
    • /
    • pp.215-222
    • /
    • 2007
  • 최근 정보기술의 발달과 함께 문자 인식의 중요성이 높아지고 있다. 특히, 유비쿼터스 시대가 도래하면서 개인휴대용 정보 단말기, 태블릿 PC 등 유비쿼터스 컴퓨팅 장비가 급속도로 대중화 되고 있다. 이에 사람마다 다양한 필체로 인한 문제가 발생하고 있으며, 인식률을 높일 수 있는 문자 인식에 대한 연구가 필요한 실정이다. 본 연구에서는 다중 해상도 병합을 이용한 수정된 적응 공명 이론 신경망을 제안한다. 이는 자율 학습 신경망과 다중 해상도의 관점에서 접근하여 문자 인식 문제에 적용시켜 본 것이다. 노이즈와 문자 특성 정보를 구별하고 인식률을 높이기 위해 고해상도와 저해상도 정보를 같이 이용하는 다중 해상도 병합 방법을 제안한다. 또한, 다중 해상도 병합 방법의 효과를 극대화할 수 있는 적응 공명 이론 신경망의 유사도 측정 방법을 제안하여 기존의 방법보다 우수한 실험 결과를 제시하였다.

필기체 혼합 문서 인식에 관한 연구 (A Study on the Recognition of Handwritten Mixed Documents)

  • 심동규;김인권;함영국;박래홍;이창범;김상중;윤병남
    • 한국통신학회논문지
    • /
    • 제19권6호
    • /
    • pp.1126-1139
    • /
    • 1994
  • 본 논문에서는 그래픽을 포함한 필기체 한글화 영숫자로 구성된 혼합문서 인식시스팀을 제안하였다. 전처리 과정에서 제안한 국부적응 이진화 알고리듬으로 이진화를 수행하며, 연결요소와 체인코드를 이용하여 그래픽 영역을 분리하고 한글의 문자유형, 크기 그리고 수직모음의 부분적인 인식을 이용하여 개별문자를 분리한다. 인식단계에서는 DP 정합 비용함수값에 따른 brach and bound 알고리듬을 이용하여 한글 문자를 인식하며, 또한 몇 개의 안정한 특징값을 이용하여 영숫자를 인식하였다. 또한 인식단계에서의 정보와 단어사전의 정합을 통하여 인식기의 오류를 정정하였다. 컴퓨터 모의실험을 통하여 제안한 시스팀이 그래픽을 포함한 필기체 한글과 영숫자를 효과적으로 인식함을 보였다.

  • PDF

자유 필기체 한글에서의 자모 추출 (Phoneme Extraction from Freely Hand Written Han Gul)

  • 오원근;신영건;안영경
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.142-147
    • /
    • 1989
  • 필기체 문자는 인쇄체 문자와는 달리, 복잡한 변형이 따르므로, 인식 하는데 많은 문제점이 따른다. 그렇기 때문에 일반적인 필기체 인식에 있어서는 필기 자체에 대한 제한을 두어 변형을 적게한 문자를 인식 대상으로 삼고 있다. 이러한 문자는, 설정된 조건만 확실하게 만족한다면, 비교적 간단하게 인식 할 수 있다. 반면에, 자유 필기체 문자는, 제한 필기체 문자와는 달리 변형이 크기 때문에, 그 인식에는 많은 연구가 필요하다. 본 연구에서는, 자유 필기체 한글의 자모를 추출하는데 있어 두개의 parameter space method를 이용했다. 화상내에서의 혼합은, 기본적으로 5 개의 element ($\mid,\;\setminus,\;/,\;-,\;o$)로 구성되어 있고, 이 element를 정의하는데는 최소한 4 개의 parameter, 즉 element의 위치 [x, y], 크기 [1] 및 type [T] 등이 필요하다. 입력 화상에서 추출된 직선 및 원의 성분은 [x, y, l] 과 [x, y, T]의 2 개의 3-D parameter space 에 누적되고, parameter space 상에서의 병합 분할 과정을 거쳐, element 가 형성된다. 추출된 element 들은, parameter space 상에서의 방향성 및 상호 위치 관계에 의한 조합 형태로서, 미리 기술되어진 자모 모델과 비교되어 인식된다. 본 방법의 특정은, 문자의 크기에 무관하고, 해석방법에 의해서는, 끊어진 element나 불필요한 element 등의 왜곡된 element 들의 처리가 가능한 점, 4 차원 parameter space를 두개의 3 차원 parameter space로 분리, 처리시간과 기억용량의 절약을 기한점 등을 들 수 있다.

  • PDF

컬러 영상의 조명성분 분석을 통한 문자인식 성능 향상 (Improved Text Recognition using Analysis of Illumination Component in Color Images)

  • 치미영;김계영;최형일
    • 한국컴퓨터정보학회논문지
    • /
    • 제12권3호
    • /
    • pp.131-136
    • /
    • 2007
  • 본 논문에서는 컬러영상에 존재하는 문자들을 효율적으로 추출하기 위한 새로운 접근 방법을 제안한다. 빛 또는 조명성분의 영향에 의해 획득된 영상 내에 존재하는 반사성분은 문자 또는 관심객체들의 경계가 모호해 지거나 관심객체와 배경이 서로 혼합 되었을 경우, 문자추출 및 인식을 함에 있어서 오류를 포함시킬 수 있다. 따라서 영상 내에 존재하는 반사성분을 제거하기 위해 먼저. 컬러영상으로부터 Red컬러 성분에 해당하는 히스토그램에서 두개의 pick점을 검출한다. 이후 검출된 두 개의 pick점들 간의 분포를 사용하여 노말 또는 편광 영상에 해당하는지를 판별한다. 노말 영상의 경우 부가적인 처리를 거치지 않고 문자에 해당하는 영역을 검출하며, 편광 영상에 해당하는 경우 반사성분을 제거하기 위해 호모모픽필터링 방법을 적용하여 반사성분에 해당하는 영역을 제거한다. 이후 문자영역을 검출하기 위해 최적전역임계화방식을 적용하여 전경과 배경을 분리하였으며 문자영역 추출 및 인식의 성능을 향상시켰다. 널리 사용되고 있는 문자 인식기를 사용하여 제안한 방식 적용 전과 후의 인식결과를 비교하였다. 편광영상에서 제안된 방법 적용 후, 문자인식을 한 경우 인식률이 향상되었다.

  • PDF

서포트벡터머신과 정칙화판별함수를 이용한 비디오 문자인식의 분류 성능 개선 (Video character recognition improvement by support vector machines and regularized discriminant analysis)

  • 임수열;백장선;김민수
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권4호
    • /
    • pp.689-697
    • /
    • 2010
  • 본 연구에서는 비디오이미지로부터 추출된 텍스트영역으로부터 문자인식을 수행하였다. 비디오영상으로부터 추출된 문자열은 한글, 영어, 숫자, 특수문자 등으로 혼합되어 있거나, 또는 다양한 폰트와 크기, 그래픽 형태의 글자 존재, 영상의 기울어짐, 끊김, 잡영, 접촉, 저해상도의 글자 등으로 인하여 일반적인 문자인식에 비해 많은 어려움이 존재한다. 이와 같은 어려움을 극복하기위해 본 연구에서는 모든 글자에 대해서 인식하지 않고 가장 빈번하게 등장하는 글자만을 인식하고 나머지는 버리는 방법을 사용하였으며 지지도벡터기계와 정칙화판별분석의 2단계 문자인식 방법을 이용하여 인식률을 개선하였다. 또한 인식률이 좋지 못한 4형식과 5형식 글자에 대해 모음별로 중분류를 실시하였다. 실험결과 지지도벡터기계와 정칙화판별분석을 동시에 사용하는 방법이 다른 문자인식의 방법들보다 인식률이 우수하였으며, 부분적인 중분류의 방법을 이용한 경우 향상된 인식 성능을 나타냈다.

한글 문서 인식을 위한 문서 영상에서의 문자와 그림의 분리 추출 (A study on the segmentation and extraction of the pictures and characters in korean document)

  • 이인동;강태호;권오석;김태균
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.50-53
    • /
    • 1989
  • 한글 문서를 인식하기 위하여 문서 영상에서 문자와 그림을 분리 추출하기 위한 방법에 대하여 논하였다. 분리 추출 방법으로는 실시간으로 입력되는 영상 데이타로부터 문자와 그림 의 경계 위치를 알아내는 방법을 사용하였다. 한글, 영문, 한자, 기호 등의 문자와 그림이 혼합된 A4 크기의 문서 영상을 300 DPI의 해상도로 입력받아 실험하였다. 단 한번의 주사만으로 모든 문자와 그림이 정보 gm름의 순서에 따라 분리 추출되었다. 실험 결과 본 방법은 최소한의 시간과 최소한의 기억 용량으로 완벽한 분리 추출이 가능함을 보였다.

  • PDF

일반화 수단으로서 매개변수의 인식과 오류에 대한 연구 -중학교 2학년 학생들과 예비교사들의 인식과 오류를 중심으로- (A Comparison of Pre-Service Teachers' and Students' Understanding of the Concept of Parameters as Means of Generalization)

  • 지영명;유면주
    • 대한수학교육학회지:학교수학
    • /
    • 제16권4호
    • /
    • pp.803-825
    • /
    • 2014
  • 대수학습의 초기부터 사용되고 있는 문자기호 중 한 문자내 부정성(변수)과 고정성(상수)을 동시에 내포하고 있는 매개변수개념은 그 모호성 때문에 소극적 암묵적으로 다루어지고 있다. 본 연구의 목적은 우리나라 대수 학습에서 매개변수에 대한 학생들의 인식 및 오류 양상을 살펴봄으로써 매개변수개념의 지도에 대한 시사점을 살펴보고자한다. 이를 위해, 학생들이 매개변수에 대해 어떻게 인식하고 있는지를 초보적인 학습자와 예비교사들을 대상으로 설문지 조사로부터 수집된 자료를 분석함으로써 그 결과를 제시하고, 그 결과에 대한 논점을 바탕으로 현 대수교육에 시사점을 제공하고자 하였다. 실제로, 본 연구자는 A중학교 2학년 한 교실의 35명의 학생들과 B대학교 학부과정에 있는 예비교사 73명을 대상으로 문자기호에 관한 동일한 설문지를 실시하여 그 결과에 대해 혼합적 방법으로 분석하였다. 두 집단의 문자기호에 관한 인식양상을 분석한 결과, 매개변수개념의 이해에 관한 여러 가지 어려움이 확인되었다. 특히, 문자기호의 인식의 동질성에 관한 통계적 처리결과 두 집단 간의 문자기호의 인식양상은 뚜렷하게 변화되지 않는다는 것이 확인되었다.

  • PDF