• 제목/요약/키워드: Mixed Character Recognition

검색결과 24건 처리시간 0.023초

서포트벡터머신과 정칙화판별함수를 이용한 비디오 문자인식의 분류 성능 개선 (Video character recognition improvement by support vector machines and regularized discriminant analysis)

  • 임수열;백장선;김민수
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권4호
    • /
    • pp.689-697
    • /
    • 2010
  • 본 연구에서는 비디오이미지로부터 추출된 텍스트영역으로부터 문자인식을 수행하였다. 비디오영상으로부터 추출된 문자열은 한글, 영어, 숫자, 특수문자 등으로 혼합되어 있거나, 또는 다양한 폰트와 크기, 그래픽 형태의 글자 존재, 영상의 기울어짐, 끊김, 잡영, 접촉, 저해상도의 글자 등으로 인하여 일반적인 문자인식에 비해 많은 어려움이 존재한다. 이와 같은 어려움을 극복하기위해 본 연구에서는 모든 글자에 대해서 인식하지 않고 가장 빈번하게 등장하는 글자만을 인식하고 나머지는 버리는 방법을 사용하였으며 지지도벡터기계와 정칙화판별분석의 2단계 문자인식 방법을 이용하여 인식률을 개선하였다. 또한 인식률이 좋지 못한 4형식과 5형식 글자에 대해 모음별로 중분류를 실시하였다. 실험결과 지지도벡터기계와 정칙화판별분석을 동시에 사용하는 방법이 다른 문자인식의 방법들보다 인식률이 우수하였으며, 부분적인 중분류의 방법을 이용한 경우 향상된 인식 성능을 나타냈다.

텍스트와 그래픽으로 구성된 혼합문서 인식에 관한 연구 (A Study on the Recognition of Mixed Documents Consisting of Texts and Graphic Images)

  • 함영국;김인권;정홍규;박래홍;이창범;김상중;윤병남
    • 전자공학회논문지B
    • /
    • 제31B권7호
    • /
    • pp.76-90
    • /
    • 1994
  • In this paper, an efficient algorithm is proposed which recognizes the mixed document consisting of the printed Korean/alphanumeric texts and graphic images. In the preprocessing step an input document is aligned if necessary by rotating it. We obtain the rotation angle using the Hough transform and align the input document horizontally. Then we separate graphic image parts from text parts by considering chain codes of connected components. We further separate each character using vertical and horizontal projections. In the recognition step Korean and alphanumeric characters are classified and each of them is recognized hierarchically using several features. In summary an efficient recognition algorithm for mixed documents is proposed and its performance is demonstrated via computer simulations.

  • PDF

붙은 글자들이 포함된 인쇄체 한.영 혼용 문서에서의 효과적인 문자 인식 알고리즘 (An Efficient Character Recognition Algorithm in Printed Korean/English Documents Including Touching Characters)

  • 김규경;김진호;진성일;최흥문
    • 전자공학회논문지B
    • /
    • 제33B권11호
    • /
    • pp.116-126
    • /
    • 1996
  • In this paper, we present a character recognition algorithm in printed korean and english documents including touching characters. We derived two rules to segment and recognize touching characters in the bilingual documents, one from the shape characteristics of korean and english characters of the writing blocks defined in this paper, and the other from the RF (reliability factor) values generated from the classifiers. Overall classification accuracy for the KITE paper of the proposed algorithm was about 96.8% for the english abstract, and about 97.8% for the bilingual parts. Also we confirmed the proposed algorithm significantly improves the accuracy of character segmentation of the actual mixed korean and english documents including touching characters.

  • PDF

한영 혼용 문서에서의 효과적인 문자 분할을 위한 언어 인식에 관한 연구 (Language Recognition for Effective Character Segmentation in the mixed Korean-English Documents)

  • 최원효;양병석;성기준;강재우;하진영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.439-444
    • /
    • 2008
  • 본 논문은 한영 혼용 문서에서의 문자 분할을 위한 효율적인 언어 인식기를 고안하였다. 한영 혼용 문서를 스캔한 후, OCR(광학 문자 판독, Optical Character Recognition)을 할 때, 문자 분할의 중요성은 상당히 크다. 인식 없이 문자를 분할하는 external segmentation 방법에서는, 인식할 언어가 한글 혹은 영어인가에 따라 문자 분할 방법이 달라진다. 그러므로, 한영 혼용 이미지를 인식하기 위해서 문자 분할을 하기 전에 언어를 미리 결정해야 한다. 본 논문에서는 문자 분할 방법을 효율적으로 하기 위한 언어 인식기를 제안하고 그 방법을 적용하였다. 그 결과 한영 혼용된 책 이미지에서 94.09%의 문자 분할 성공률을 보였다.

  • PDF

휴대형 정보기기의 한글 및 영숫자 필기 입력 방안 (The input method of the Hangul and Alphanumeric characters for the PDAs)

  • 홍성민;국일호;조원경
    • 전자공학회논문지T
    • /
    • 제35T권3호
    • /
    • pp.53-60
    • /
    • 1998
  • 본 논문에서는 키보드를 사용하지 않는 PDA 등 휴대형 컴퓨터에서 입력의 수단으로 사용하는 온-라인 문자 인식기를 위한 문자 필기글꼴을 제안하였다. 제안된 필기글꼴은 키보드를 통하여 입력 가능한 수준의 한글 자소와 영숫자이며, 필기글꼴의 정의를 위하여 한글의 풀어쓰기 글꼴과 영문자의 PDA용 필기 패턴인 그래피티 문자를 분석하여, 한글과 영숫자 입력 모드 전환이나 필기 영역의 구분 없이 연속 필기하여도 인식 가능하도록 중복되는 글꼴을 갖지 않도록 하면서 최대한 원형을 유지하도록 하였다. 본 논문에서 제안한 필기글꼴의 타당성을 고찰하기 위하여 그래피티 문자를 알고 있는 PDA 사용자 그룹과 일반인들을 대상으로 인지도와 만족도를 조사하였다. 두 피실험 그룹의 영숫자 및 한글의 자음의 인지도 및 만족도는 98% 이상이었고 한글 모음의 경우 95% 이상의 긍정적인 반응을 얻었다.

  • PDF

캐릭터 활용 패션브랜드에 대한 소비자행동 분석 (An Analysis of the Consumer's Behavior on the Fashion Brands Applying the Characters)

  • 유지헌
    • 한국의상디자인학회지
    • /
    • 제9권1호
    • /
    • pp.173-187
    • /
    • 2007
  • The purposes of this study were to examine the consumer's behavior on the brands applying the characters by gender, age and residential district, and then to propose the future planning of brands applying the characters and distribution strategies. From Junior on middle school to forty-year olds were selected for this study and areas were grouped to five for comparing the residential distinction. The questionnaire was consisted with 25 questions. Nominal scale and 5-interval scale were used for analysis. The SPSS 12.0 was used to analyze the technical statistics such as average, frequency, t-test, ANOVA, and $x^2$. The results of this study were as follows : 1) The characters influenced on remembering the brand's name regardless gender, agen and residential district. 2) When consumer bought the brand with character, the most important factor is the brand name recognition. 3) It would be desirable to use the one or two mixed methods which express the characters on the clothes. 4) When they distribute the character brands, they would supply more feminine characters in 3rd district, more manly one in 4th district and less quantities in the 3rd and 4th district for lowering inventory. The next must be follow to succeed the character using strategy of fashion brands. It is needed to segment the target for new character creation of specific generation, and to grasp the point of the trend which oriented by the target, and to reflect what they like and what they feel sympathy on character image and brand concept.

  • PDF

Hough Transform과 부분 그래프 패턴을 이용한 한글 인식에 관한 연구 (A Study on the Hangul Recognition Using Hough Transform and Subgraph Pattern)

  • 구하성;박길철
    • 한국정보통신학회논문지
    • /
    • 제3권1호
    • /
    • pp.185-196
    • /
    • 1999
  • 본 논문에서는 부분 그래프 패턴과 신경망을 이용한 새로운 한글 오프라인 인식 시스템을 제안하였다. 문자를 입력으로 받아 세선화를 행한 후 위치에 관한 잡음 제거 기능을 갖는 균형화를 수행하고 인식단의 첫번째 단계에서 순환 성분을 추출하고 인식한다. 부블럭 HT 공간에서 끝점, 굴곡점, 분기점의 특징점을 추출하고 추출된 특징점 사이의 관계를 조사하여 부분 그래프 패턴을 구성한다. 종모음이 올 수 있는 구역을 할당하고 종모음 후보점을 추출하여 미리 조사된 부분 그래프 패턴 사전과 비교하여 종모음을 추출한다. 같은 방법으로 횡모음을 추출한 후 간단한 구조 해석적 방법으로 모음을 인식한다. 본 논문의 성능비교를 위하여 실험은 활자체의 경우 가장 많이 쓰이는 명조체와 고딕체 그리고 필기체를 대상으로 한다. 고딕체의 경우 인식율 98.9%, 명조체의 경우 인식율 98.2%, 필기체의 경우 92.5% 이었다. 다중 자형 인식을 위하여 필기체와 활자체의 구분 없이 구한 전체 시스템의 인식율은 94.8% 이었다.

  • PDF

한영 혼용문서 인식을 위한 다중 폰트 이미지로부터 한글과 영어의 구별 (Distinction of Korean and English Characters from Multi-font Images for the Recognition of Mixed Document Composed of Korean and English)

  • 전일수
    • 한국산업정보학회논문지
    • /
    • 제4권3호
    • /
    • pp.52-58
    • /
    • 1999
  • 본 논문에서는 한\ulcorner영 혼용문서인식을 위해 다중 크기, 다중 활자체에 적용 가능한 한글과 영어를 구별하는 알고리즘을 제안한다. 제안된 방법에서는 글자의 종횡비, 연결요소의 수, 좌상단의 획이미지 존재 여부, 그리고 바(bar)를 입력 이미지에 대해 좌상우하의 순서로 진행해 가면서 바를 검출하고, 이들을 이용하여 한글과 영어를 구별한다. 제안된 방법을 문서 작성 시 널리 사용되는 ?글의 명조체, 신명조체, 고딕체, 궁서체에 대해 실험하여 그 성능의 우수성을 입증하였다.

  • PDF

문서 영상 내의 테이블 벡터화 연구 (Research on the Table Vacuolization in the Document Image)

  • 김우성;심진보;박용범;문경애;지수영
    • 한국정보처리학회논문지
    • /
    • 제3권5호
    • /
    • pp.1147-1159
    • /
    • 1996
  • 본 논문에서는 문서인식 시스템에서 정확한 문서 인식의 기본이 되고 인식 결과에 중요한 영향을 미치는 전처리 알고리즘 중 테이블 입력의 효율적인 처리 방법을 연구 한다. 테이블 내의 문자를 인식하기 위해서는 테두리선과 문자 부분을 먼저 분리하는 작업이 필요하다. 왜냐하면, 테이블을 인식하기 위해서는 테두리선에 의해 블록화된 테두리선 안의 문자를 인식해야 하며 또한 테두리선을 효율적으로 벡터화하는 방법이 필요하다. 테이블을 벡터화하는 방법으로 8방향 체인 코드를 이용하여 테이블 선 성분을 추출하는 방법과 히스토그램을 이용하여 테이블의 수행, 수직 성분을 추출 하여 얻어진 교차점을 이용하여 대각선 성분을 찾아내는 방법 및 화소의 Run-length를 이용하여 수평선 성분과 수직선 성분을 추출하여 얻어진 교차점을 이용해 대각선성분 을 찾아내는 방법이 있다. 또한 규칙성을 이용한 테이블 추출 방법은 테이블을 구성하는 수직선 성분과 수평선 성분의 규칙성을 찾아내 이를 이용하여 테이블을 벡터화 시킨다. 본 논문에서는 문서 영상 내의 테이블을 효율적으로 벡터화하기 위한 방법으로 규칙성을 이용한 방법을 제안한다.

  • PDF

패턴인식용 VLSI 펄스형 디지탈 다계층 신경망의 구조및 동작 특성 (A VLSI Pulse-mode Digital Multilayer Neural Network for Pattern Classification : Architecture and Computational Behaviors)

  • 김영철;이귀상
    • 전자공학회논문지B
    • /
    • 제33B권1호
    • /
    • pp.144-152
    • /
    • 1996
  • 대규모 병렬처리가 가능하고 칩당 뉴론 집적도가 높은 펄스형 디지털 다계층 신경망 구조를 제안하였다. 제안된 신경망에서는 대수적인 신경망연산이 의사-랜덤 펄스 시퀀스(pseudo-random pulse sequences)와 단순 디지털 논리 게이트를 이용하여 확률적 프로세스로 대치되었다. 확률적 프로세스의 결과로 나타나는 신경망 연산의 통계적 모델을 제시하였으며 이를 바탕으로 랜덤잡음의 영향과 연산의 정확도를 분석하였다. 이진인식 문제를 적용하여 제안된 신경망의 성능을 평가하고 제시한 통계적 분석결과의 정당성을 검증하였다. Gate 레벨과 register transfer 레벨로 기술된 신경망의 VHDL 모델의 시뮬레이션 결과는 개발된 통계적모델로 예측된 인식추정치와 실제 인식률이 거의 일치함을 보였으며, 또한 숫자인식률에 있어서도 일반 Back-Propagation 신경망의 인식률과 거의 차이가 없음을 보였다.

  • PDF