• 제목/요약/키워드: 문자 분할

검색결과 218건 처리시간 0.032초

블록의 속성과 질감특징을 이용한 문서영상의 블록분류 (Block Classification of Document Images by Block Attributes and Texture Features)

  • 장영내;김중수;이철희
    • 한국멀티미디어학회논문지
    • /
    • 제10권7호
    • /
    • pp.856-868
    • /
    • 2007
  • 본 논문에서는 블록의 속성과 질감특징을 이용하여 효과적인 블록 분류 방법을 제안하였다. 제안한 방법에서는 먼저 명암도 문서영상을 이진화한 후, 평활화 기법을 적용하여 블록의 위치정보와 본 논문에서 사용할 특징 중에 하나인 각 블록의 내부에 있는 작은 블록들의 최대 높이 값을 구하였다. 이 위치정보들을 이용하여 문서영상을 각 블록으로 분할한다. 이 블록의 명암도 블록영상에서 문서의 속성이 잘 반영된 (0,1) 방향의 공간 명암도 의존 행렬을 구하여 7가지 질감특징을 구하였다. 먼저 블록의 속성을 최소거리 규칙(Nearest Neighbor Rule)에 입력하여 문자와 비문자 영역으로, 상세분류를 위하여 7가지 질감특징을 이용하여 큰 문자, 작은 문자, 표, 그래픽 및 사진 등으로 구분함으로써 문서인식을 위한 구조 해석뿐만 아니라 다양한 응용 분야에 효과적으로 이용될 수 있도록 하였다.

  • PDF

TFT-LCD 패널 검사를 위한 지역적 분별에 기반한 결함 영역 분할 알고리즘 (Segmentation of Defective Regions based on Logical Discernment and Multiple Windows for Inspection of TFT-LCD Panels)

  • 정건희;정창도;윤병주;이준재;박길흠
    • 한국멀티미디어학회논문지
    • /
    • 제15권2호
    • /
    • pp.204-214
    • /
    • 2012
  • 본 논문은 비전장비의 결함 검사 시스템을 위한 불균일한 휘도분포를 가지는 TFT-LCD 영상에서 결함 영역을 분할하는 방법을 다룬다. 불균일한 휘도분포 때문에 결함의 영역을 찾기 어려우며 이를 위해 많은 방법들이 제안되었다. Kamel과 Zhoa는 문자 및 그래픽의 분할을 위해 논리적 단계화 방법을 제안하였고, 이 방법은 공간상에서 수행되어지는 지역적 분할 방법으로 불균일한 분포 상에서도 문자가 잘 분할되는 장점이 있다. TFT-LCD의 저해상도 영상도 배경의 분포가 불균일하여 본 논문에서는 Kamel과 Zhoa의 방법을 답습하여 새로운 결함 영역 분할 방법을 제안한다. 제안한 방법은 결함주위에 발생하는 과검출(Ghost object)이 적은 장점이 있으며 제안 방법의 성능을 증명하기위해 실제 결함이 존재하는 TFT-LCD 영상을 이용하여 실험하고, 주파수상에서 많이 사용되는 FFT의 밴드패스 필터를 이용한 분할 방법과 비교하였다.

동측성 반맹시 환자의 재활치료용 시분할 장치 개발에 관한 연구 (Study on Developing the Equipment of the Time Division System for Rehabilitation in People with Homonymous Hemianopia)

  • 서재명;박근호;허민영;정주현
    • 한국안광학회지
    • /
    • 제19권3호
    • /
    • pp.407-412
    • /
    • 2014
  • 목적: 시분할 장치가 동측성 반맹시 환자의 재활치료용 프레넬 프리즘으로 인한 복시 현상을 최소화하고 안정적인 시야를 확보할 수 있는지 알아보고자 하였다. 방법: 소형 모터와 마분지를 사용하여 시분할 장치를 제작했다. 시분할 장치의 효율성을 검증하기 위해 시분할 장치 전후 걷는 방향과 문자에 대한 인식을 비교 분석했다. 결과: 공간의 이등분할 실험에서 시분할 장치 전 피검자의 방향각은 $+18.14^{\circ}$였으며 장치 후의 방향각은 $+8.91^{\circ}$로 나타났다. 시분할 장치 후 $4{\times}4$시표의 문자 인식 실험에서는 정답률이 9%P, $6{\times}6$시표에서는 15%P가 증가했다. 특히 정답률이 낮은 군에서 효과가 더 뛰어났다. 결론: 시분할 장치는 동측성 반맹시 환자의 방향성이나 운동성에도 좋은 결과를 보였다.

오류 역전파 알고리즘을 이용한 영문자의 폰트 분류 방법에 관한 연구 (Front Classification using Back Propagation Algorithm)

  • 정민철
    • 지능정보연구
    • /
    • 제10권2호
    • /
    • pp.65-77
    • /
    • 2004
  • 본 연구에서는 영문 단어로부터 폰트를 분류하기 위해 연역적이고 국부적인 폰트 분류 방법을 제안한다. 이는 문자 인식 전에 한 단어에서 폰트를 분류하는 것을 말한다. 폰트 분류를 위해 활자 특성인 어센더(ascender), 디센더(descender)와 세리프(serif)가 사용된다. 입력 단어로부터 어센더(ascender), 디센더(descender)와 세리프(serif)가 추출되어 경사도 특징 벡터가 추출되고, 그 특징 벡터는 인공 신경망에 의해 입력 단어에 대한 2가지 폰트 스타일, 3가지 폰트 그룹, 7가지 폰트 이름이 분류된다. 제안된 연역적이고 국부적인 폰트 분류 방법은 폰트 정보가 문자 분할기와 문자 인식기에 사용될 수 있게 한다. 나아가, 특정 폰트에 따른 Mono-Font 문자 분할기와 Mono-Font문자 인식기로 구성되는 OCR시스템을 구성할 수 있는 것을 가능하게 한다. 실험 결과는 평균 95.4 퍼센트의 높은 폰트 분류율을 보였다. 본 논문에서 7가지 폰트분류를 위해 제안된 방법은 그 외 다른 폰류 분류에도 적용될 수 있다.

  • PDF

음성 문자 공용인식기를 위한 SSMS 기반 가변 파라미터 모델 (A Variable Parameter Model based on SSMS for an On-line Speech and Character Combined Recognition System)

  • 석수영;정호열;정현열
    • 한국음향학회지
    • /
    • 제22권7호
    • /
    • pp.528-538
    • /
    • 2003
  • 음성 문자 공용 인식 시스템은 PDA (Personal Digital Assistants)와 같은 휴대용 모빌 환경에서 음성인식과 문자인식을 적용하기에 적합하도록 개발되었다. 공용 인식 시스템은 특징 파라미터 추출에 있어서는 음성과 문자부분이 독립적으로 수행되나, 인식 과정은 단일 엔진으로 수행된다. CHMM (Continuous Hidden Markov Model)을 이용하는 인식엔진은 고정 파라미터 모델 구조 대신에 동일한 인식률을 유지하면서 모델의 파라미터의 수를 효과적으로 줄일 수 있는 가변 파라미터 모델 구조를 사용하는 것이 유리하다. 본 논문에서는 문맥 독립 가변 파라미터 모델을 생성하기 위해 SSMS (Successive State and Mixture Splitting) 방법을 제안한다. SSMS 알고리즘은 시간 방향 분할과 혼합수 방향분할을 통해 적절한 상태수와 각 상태당 적절한 혼합수를 가지는 모델을 생성한다. 음성 인식 실험 결과 동일한 인식성능을 나타내는 경우 SSMS 기반 가변 파라미터 모델이 고정 파라미터 모델에 비해 GOPDD (Gaussian Output Probability Density Distribution)의 수가 40% 감소함을 확인할 수 있었다.

인터넷에서의 개선된 벡터라이징 기법에 관한 연구 (A study of improve vectorising technique on the internet)

  • 김용호;이윤배
    • 한국정보통신학회논문지
    • /
    • 제6권2호
    • /
    • pp.271-281
    • /
    • 2002
  • 현재 대부분의 웹디자이너들은 비트맵 그래픽을 사용하여 고정된 포인트 사이즈로 하이 퀼리티를 보장하고 있지만 이는 파일 크기와 유연성에 결점을 가지고 있다. 특히 배너문자나 광고문자에 하이 퀼리티를 제공하기 위해서는 반드시 다른 비트맵 에디팅 프로그램을 사용해서 작업한 후, 비트맵 데이터로 HTML 문서에 첨가하는 방식을 따를 수 밖에 없다. 또한 HTML 문서 자체적으로 글꼴을 단순하게 출력하는 방법 이외에, 단순한 blink, underline, bold, italic을 제외한 글꼴을 직접 제어하는 HTML Tag 또한 가지고 있지 않기 때문이라고도 할 수 있다. 때문에 폰트의 아웃라인 데이터를 이용한 효과나 외곽선 패턴 분할 같은 작업을 위해서는 벡터에디팅 프로그램과 이미지 에디팅 프로그램, 그리고 최종적으로 HTML 문서에 삽입하는 번거로운 과정을 거쳐야만 하는 문제에 직면하게 된다. 따라서 본 논문에서는 HTML 문서의 폰트에 몇 가지 태그를 새롭게 제시함으로써, 폰트에 더욱 다양한 효과를 줄 수 있는 방법을 제안한다. 제안된 방법은 텍스트 정보 저장시 단순한 제어점과 외곽선 정보만을 가지고 화면 출력하기 때문에 웹브라우저 상에서 인쇄물과 동일한 품질의 한글 문자 표현이 가능하며, 이종의 플랫폼에 상관없이 정확한 문자 표현, 다양한 효과로 문자 표현이 가능하다.

모폴로지을 이용한 비디오 영상에서의 자동 문자 추출 (Automatic Text Extraction in Video Images using Morphology)

  • 장인영;고병철;김길천;변혜란
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.418-420
    • /
    • 2001
  • 본 논문에서는 뉴스 비디오의 정지 영상에서 뉴스 자막과 배경 문자를 추출하기 위한 새로운 방법을 제안한다. 본 논문에서는 일차적으로 입력 컬러 영상을 그레이 영상으로 변환한 후 입력 영상의 명암 대비를 강화시키기 위해 명암 대비 스트레칭을 적용한다. 이후 명암 대비 스트레칭된 영상의 분할을 위해 적응적 임계값을 적용하고 다음 단계에서 문자와 유사한 영역들을 적당한 크기 의 structuring element를 이용하여 제거하는 1차 하부 단계와 모폴로지 녹임(erosion)을 적용한 영상과 모폴로지(열림닫힘[OpenClose]+닫힘열림[CloseOpen])/2가 적용된 영상 사이의 차이 영상을 구하는 2차 하부 단계를 적용시킨다. 마지막 단계에서 각 후보 영역들 중 실제 자막 영역을 추출해내기 위해, 후보 문자 영역의 화소수 비율과 외곽선의 화소수의 비율, 그리고 장축과 단축간의 비율 등에 대해 필터링을 적용한다. 본 논문에서는 임의의 300개의 뉴스영상을 입력 값으로 실험한 결과 93.6%의 우수한 인식률을 얻을 수 있었다. 또한 본 논문에서 제안한 방법은 structuring element의 크기 조절을 통해 크기가 다른 다양한 이미지에서도 좋은 성능을 거둘 수 있다.

  • PDF