• 제목/요약/키워드: 문자 분리

검색결과 233건 처리시간 0.038초

Fuzzy ARTMAP 신경망을 이용한 차량 번호판 인식에 관한 연구 (Vehicle Plate Recognition Using Fuzzy-ARTMAP Neural Network)

  • 김동호;강은택;김현주;이정식;최연성
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2001년도 춘계종합학술대회
    • /
    • pp.625-628
    • /
    • 2001
  • 본 논문은 차량 번호판 영상을 안정적으로 추출하여 인식하는 방법으로 Fuzzy-ARTMAP 신경회로망을 이용하여 인식하는 시스템을 제안한다. 입력 영상에서 칼라정보를 이용하여 휘도값을 추출하고, 추출된 영상에서 히스토그램을 이용하여 번호판을 배경영상에서 분리하는 작업을 수행한 후, X축 영역에 축적 히스토그램을 적용하여 글자를 분리하고, Y축 영역에 축적 히스토그램을 이용하여 글자를 완전 분리하여 번호판의 문자를 분리시킨 후, 추출된 문자 영역을 Fuzzy-ARTMAP 신경망에 입력하여 문자를 인식하였다. Fuzzy-ARTMAP을 이용한 결과 기존의 다른 신경망을 이용한 것보다 문자인식 처리 시간을 단축시키고 인식률을 향상시킬 수 있었다.

  • PDF

투영 프로파일, GaP 및 특수 기호를 이용한 텍스트 영역의 어절 단위 분할 (Decomposition of a Text Block into Words Using Projection Profiles, Gaps and Special Symbols)

  • 정창부;김수형
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권9호
    • /
    • pp.1121-1130
    • /
    • 2004
  • 본 논문에서는 인쇄체 텍스트 영상에 대한 문자열 분리 방법과 어절 분리 방법을 제안한다. 문자열 분리 방법은 수평 투영 프로파일을 분석하고, 오분리된 문자열에 대하여 재귀적 투영 프로파일 (Recursive Projection Profile) 분석을 수행한다. 어절 단위 분리는 문자열에 대한 연결요소 분석을 통하여 gap을 검출한 후, 계층적 군집화 기법에 의해 어절과 어절 사이에 존재하는 gap을 판별하여 어절 분리점을 결정한다. 또한 어절과 어절 사이에 존재하는 특수기호를 검출하여 어절 분리점을 추가하기 위해서, 연결요소의 종횡비와 골격선(skeleton)의 형태적 특징을 고려한다. 제안 방법의 성능 평가를 위하여 총 84 개의 텍스트 영상에 대하여 실험하였고, 국내 상용 OCR 소프트웨어인 아르미와 성능 비교하였다. 최종 어절 분리에 대하여 제안 방법과 아르미가 각각 99.92%와 97.58%의 성능으로 측정됨으로써 제안 방법이 아르미에 비해 우수함을 보였다.

스미어링 기법과 윤곽선 추적 알고리즘을 이용한 영문 명함 영상에서의 문자 추출 (The Extraction of Character from an English Name Card by Using Smearing Method and Contour Trucking Algorithm)

  • 조아현;이혜현;류재욱;김광백
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2002년도 춘계학술대회 논문집
    • /
    • pp.410-413
    • /
    • 2002
  • 본 논문에서는 영문 명함 영상에서 개별 문자 추출 방법을 제안한다. 30개의 원본 명함 영상을 대상으로 스미어링 기법과 윤곽선 추적 알고리즘을 이용하여 영문 명함의 개별 문자들 추출하였다. 본 논문에서는 3$\times$3 마스크를 이용하여 가장 작은 값으로 3 배 축소하는 방법을 적용하여 스미어링하는 시간을 단축시키고 문자들간의 간격을 제거하여 윤곽선 추적 알고리즘을 이용하여 문자열 후보 영역을 추출하였다 그리고 추출된 후보 영역의 가로 및 세로의 비율과 면적을 이용하여 문자열과 비 문자열로 분리하고, 문자열 영역에서 4 방향 윤곽선 추적 알고리즘을 이용하여 개별문자를 추출하였다. 30개의 명함 영상을 실험한 결과, 309개의 문자열 중에서 280개가 추출되었고 개별 문자는 4504개중에서 4110개가 추출되었다

  • PDF

자연 영상에서 문자열 추출 (Text Location in Scene Images)

  • 최미화;김희승
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.389-391
    • /
    • 2000
  • 본 논문을 자연여상에서 문자열의 위치를 찾아내는데 모폴로지 연산인 WTH(white top-hats)과 BTH(black top-hars)을 사용하였다. 기존의 자연영상에서의 문자열추출은 칼라양자화방법 경우 각 칼라공간에서 문자열 추출과정을 반복 적용하거나 모델기반방법의 경우 문자열의 획의 크기나 특징에 따라서 하나의 영상을 여러 개로 분리 적용하여 추가적인 계산비용을 필요로 한다는 점을 개선하고 공간적 변화도를 이용하여 영상을 직접 처리하는 경우 최소 문자열 후보영역을 찾기 위한 프로세스를 다시 적용해야 한다는 점을 개선하였다. 자연영상에 문자열의 위치를 대략적으로 찾아내기 위해 WTH+BTH을 적용하여 그 결과로 문자열의 대략적 위치와 최소문자열후보영역을 동시에 얻을 수 있다. 문자열이 가지는 특성을 적용하여 문자열-비문자열 분류과정을 적용하고 후처리를 통해 완전한 문자열의 위치를 보여준다.

  • PDF

런 길이를 이용한 필기체 한글 자획의 방향 성분 추출 (Extraction of Directional Strokes in Handwritten Hangul using Runlength)

  • 정민철
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2006년도 춘계학술발표논문집
    • /
    • pp.485-488
    • /
    • 2006
  • 본 논문은 수평 런 길이와 수직 런 길이를 이용해 필기체 한글 문자의 자획 두께를 구하고, 그 자획 두께를 이용해 입력 문자의 자소를 수평 성분과 수직 성분으로 분리하는 기술을 제안한다. 수평 성분과 수직 성분 분석은 각도와 관계없이 자획 두께와 수평 런 길이의 변화량만을 이용해 구한다. 분리된 수평 성분 자획과 수직 성분 자획은 오프라인 필기체 한글 인식을 위한 요소 기술 중 하나인 자소 분리를 위한 특징이 된다.

  • PDF

오프라인 문서에서 개별 문자 추출과 한자 인식에 관한 연구 (A Study on the Extraction of an Individual Character and Chinese Characters Recognition on the Off-line Documents)

  • 김의정;김태균
    • 한국정보처리학회논문지
    • /
    • 제4권5호
    • /
    • pp.1277-1288
    • /
    • 1997
  • 본 논문에서는 인체 문서 인식을 위한 전처리 과정인 개별 문자 추출 방법과 인식 방법에 대하여 논한다. 전처리에서는 접촉 문자(touching charadcter) 또는 겹친 문자 (overlaapped character) 등과 같이 추출이 곤란한 문자를 개별 문자로 추출하는 것이다. 기존의 문자 분리 방법에서는 투영((projection)에 의한 방법과 외곽선(edge)추척에 의한 방법 등을 사용하여 왔으나, 제안된 방법은 문자열 추출 후 한번의 투영으로 연결 화소를 이용하여 개별 문자를 추출한다. 인식을 위해서는 최대불록화 방법(Maximum Block Mehtod:MBM)을 이용하여 특징 추출을 한다. 최대불록화는 문자를 투영 중 처음 찾아진 점에서부터 최대한 불록을 확정 시키는 방법이다. 문자를 이루는 최대불록들을 직선 불록과 사선 불록으로 분리후 골격화 시킨다. 특히 한자 인식에서 기존의 상용 문자 인식기와 비교하여 향상된 인식율을 얻을 수 있다.

  • PDF

한글 문서 영상에서의 문자와 비문자의 분리 추출

  • 이종국;김항준
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1990년도 제2회 한글 및 한국어정보처리 학술대회
    • /
    • pp.219-219
    • /
    • 1990
  • 본 논문에서는 국제 컴퓨터 망을 통하여 한글 정보를 전송할 수 있는 한 방안을 제안하였다. 한글 문서를 서구 문자로 바꾸어 서구문만의 전송이 가능한 컴퓨터 망에서도 전송이 가능하도록 하였고 한글과 영문이 혼용된 문서를 서구 문자로 전자하는데 한/영 구분기호를 사용하였으며 전자된 한글이 포함되어 있음을 표현하는 통신문 서식을 만들어 사용하였다. 또한 한글을 서구문자로 전자하고 복원하는 소프트웨어를 작성하였다.

  • PDF

영문 대문자의 획간 조합 순서를 이용한 온라인 필기의 문자열 인식 (On-line word recognition of continuous English handwriting by mixture of stroke)

  • 조현철;김우생
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.452-454
    • /
    • 1999
  • 온라인 필기 문자의 경우에는 필기의 변형이 심하고 문자간의 분리가 힘들기 때문에 인식률이 낮은 실정이다. 본 논문에서는 영문 대문자의 자유로운 필기를 인식할 수 있는 방법으로 영문 대문자의 필기시에 발생하는 획간 조합의 특징을 사용하여 인식하는 알고리즘을 제안한다.

  • PDF

비디오에서 프로젝션을 이용한 문자 인식 (Identification of Korea Traditional Color Harmony)

  • 백정욱;신성윤;이양원
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2009년도 추계학술대회
    • /
    • pp.196-197
    • /
    • 2009
  • 비디오에서 우선 장면 전환 검출을 통해 생성된 키 프레임을 대상으로 프로젝션을 통하여 문자 인식을 수행하도록 한다. 텍스트의 자간 분리를 수직 프로젝션에 의해 분리 한다. 자소는 초성, 중성, 종성으로 분리하고 6가지 유형으로 분리한다. 자소 패턴 분리는 수평 프로젝션을 통하여 6가지 유형에 맞도록 분리한다. 자소는 수평, 수직, 사선, 역사선 방향으로 분리한다. 자소의 인식은 4-방향 프로젝션과 위치정보를 이용하여 인식하도록 한다.

  • PDF

문서 이미지에서 문자 추출과 3차원 면적-가중치 그래프를 이용한 단어 그룹핑 (Text Extraction and Word Grouping using 3D Area-Weighted Graph in Document)

  • 옥세영;박환철;조환규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.556-558
    • /
    • 1998
  • 이미지 분석이나 데이터 베이스 인덱싱 또는 종이 문서를 전자 문서화 하는 문제는컴퓨터 비젼 응용분야에서 중요 관심사가 되어왔다. 이러한 문제들을 처리하기 위해서는 제일 먼저 이미지와 문자가 혼합되어 있는 문서에서 자동으로 문자와 이미지들을 분리해 내는 과정이 필수 적이다. 본 논문에서는 신문이나 광고등에서 볼 수 있는 이미지, 음각 문자와 양각 문자가 섞여 있는 문서에서 문자만을 추출하는 알고리즘을 제안한다. 이 알고리즘은 Run-length code를 이용하여 문자나 이미지의 경계선(bound) 모양의 특징을 추출하여 음각 문자와 이미지, 양각 문자를 구분한다. 그리고 추출된 글자들을 3차원 공간상에 매핑한 후 3차원 면적 가중치 그래프를 이용하여 관련된 단어들로 묶어주는 3차원 그룹핑 알고리즘을 제시한다. 실험결과로는 추출된 문자와 그룹핑된 결과를 보여준다.

  • PDF