• 제목/요약/키워드: 문자 분할

검색결과 218건 처리시간 0.022초

자유 필기체 한글에서의 자모 추출 (Phoneme Extraction from Freely Hand Written Han Gul)

  • 오원근;신영건;안영경
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.142-147
    • /
    • 1989
  • 필기체 문자는 인쇄체 문자와는 달리, 복잡한 변형이 따르므로, 인식 하는데 많은 문제점이 따른다. 그렇기 때문에 일반적인 필기체 인식에 있어서는 필기 자체에 대한 제한을 두어 변형을 적게한 문자를 인식 대상으로 삼고 있다. 이러한 문자는, 설정된 조건만 확실하게 만족한다면, 비교적 간단하게 인식 할 수 있다. 반면에, 자유 필기체 문자는, 제한 필기체 문자와는 달리 변형이 크기 때문에, 그 인식에는 많은 연구가 필요하다. 본 연구에서는, 자유 필기체 한글의 자모를 추출하는데 있어 두개의 parameter space method를 이용했다. 화상내에서의 혼합은, 기본적으로 5 개의 element ($\mid,\;\setminus,\;/,\;-,\;o$)로 구성되어 있고, 이 element를 정의하는데는 최소한 4 개의 parameter, 즉 element의 위치 [x, y], 크기 [1] 및 type [T] 등이 필요하다. 입력 화상에서 추출된 직선 및 원의 성분은 [x, y, l] 과 [x, y, T]의 2 개의 3-D parameter space 에 누적되고, parameter space 상에서의 병합 분할 과정을 거쳐, element 가 형성된다. 추출된 element 들은, parameter space 상에서의 방향성 및 상호 위치 관계에 의한 조합 형태로서, 미리 기술되어진 자모 모델과 비교되어 인식된다. 본 방법의 특정은, 문자의 크기에 무관하고, 해석방법에 의해서는, 끊어진 element나 불필요한 element 등의 왜곡된 element 들의 처리가 가능한 점, 4 차원 parameter space를 두개의 3 차원 parameter space로 분리, 처리시간과 기억용량의 절약을 기한점 등을 들 수 있다.

  • PDF

Emgu CV를 이용한 자동차 번호판 자동 인식 프로그램 구현에 관한 연구 (Study on the panorama image processing using the SURF feature detector and technicians.)

  • 김남우;허창우
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 춘계학술대회
    • /
    • pp.830-833
    • /
    • 2016
  • 자동차 번호판 인식은 대중적인 감시 기술 중의 한 종류로서, 주어진 비디오나 영상 내 광학문자 인식을 수반한다. 고속도로나 국도 상에 과속 단속 시스템, 재형 건물이나 유통센서 및 주차장 등에서 주차 정산 시스템, 고속도로 톨 게이트에서 hi-pass 에러 및 불법 도주 차량 잔속 시스템, 전국 주요 도로 불법 주 정차 단속 시스템, 공공기관, 기업 출퇴근 시간 확인 및 외부 차양 안내 시스템 등의 지능형 교통 시스템(ITS)이나 국도 상에 범위 차량 검거 시스템, 사건 발생 시 주요 도로상에 설치된 CCTV를 통해 용의 차량 이동 추적 시스템, 이동식 범죄 차량 조회, 버스에 탑재된 버스 전용차선 위반 단속들의 지능형 방범 시스템 등에 활용하고 있다. 번호판 인식은 자동차 번호판 국부화, 번호판의 크기, 차원, 명암대비, 밝기를 조정하는 정규화, 개별문자를 얻어내는 문자 분할, 문자를 인식하는 광학 문자 인식, 번호판의 형태, 크기, 위치 들이 연도별, 지역별로 차이가 있는 번호판들의 데이터베이스를 비교하여 구문 분석을 하는 절차를 거친다. 본 논문에서는 EmguCV를 이용하여 구현한 번호판 감지를 수행하여 위치를 찾아내고, 오픈 소스 광학 문자 인식 엔진으로 잘 알려져 있는 테서렉트 OCR을 이용하여 번호판의 문자를 인식하는 자동 인식 프로그램을 구현하고 기술하였다.

  • PDF

주파수 특성과 역전파 신경망 알고리즘을 이용한 문자 영역 분할 방법 (A method for Character Segmentation using Frequence Characteristics and Back Propagation Neural Network)

  • 전병태;송치양
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권4호
    • /
    • pp.55-60
    • /
    • 2006
  • 문자 영역 추출을 위해서 FFT와 신경망을 이용한 방법을 본 논문에서 제안하고자 한다. 일반적으로 문자 영역은 고주파 영역에서 발견되므로 FFT를 이용하여 이 특징을 추출할 수 있다. 문자(고 주파) 영역과 비 문자(저 주파) 영역을 신경망에 학습을 시킨다. 신경망에 고주파 영역을 입력으로써 후보 영역을 추출한다. 그리고 최종 문자 영역은 후보 영역 검증을 통하여 추출된다. 실험 결과 후보 영역 추출은 학습된 경우 100% 추출율을 보여주고 있으며, 검증을 통한 후보 영역 추출율은 95%임을 알 수 있었다. 제안된 알고리즘의 장점은 알고리즘의 단순성과 실시간 처리에 있다.

  • PDF

Watershed 변환을 이용한 효율적인 문자 영상 향상 및 영역 분할 (An Efficient Character Image Enhancement and Region Segmentation Using Watershed Transformation)

  • 최영규;이상범
    • 정보처리학회논문지B
    • /
    • 제9B권4호
    • /
    • pp.481-490
    • /
    • 2002
  • 오프라인 필기체 문자 인식은 동적인 정보를 가지고 있지 않고, 다양한 필기와 자음과 모음의 겹침이 심하며, 획 사이의 잡영을 많이 가지고 있어 불완전한 전처리를 수행하여야 하는 어려움이 있다. 따라서 오프라인 필기체 문자 인식은 다양한 방법의 전처리 즉 이진화 및 세선화에 대한 연구가 필요하다. 본 논문에서는 오프라인 필기체 한글 문자 인식의 전처리로서 워터쉐드 알고리즘의 수행 시간과 결과 영상의 품질을 고려해 그레이 레벨 문자 영상에서의 문자 영역과 배경 영역의 분할을 위한 효과적인 워터쉐드 알고리즘의 적용 방법과 추출된 워터쉐드 영상을 이진화하는 분할 함수를 제안한다. 또한 수행 시간과 골격선의 품질을 고려한 조건 검사 마스크를 통해서 효과적으로 골격선을 추출하는 세선화 방법을 제안하고 기존의 방법과 본 논문 방법을 수행 시간과 품질로써 성능을 평가한다. 실험 결과 기존의 방법은 평균 2.16초, 본 논문 방법은 평균 1.72초의 수행 시간이 걸렸다. 또한 결과 영상의 품질은 본 논문 방법이 문자 획 사이의 잡영을 효과적으로 처리함을 알 수 있었다.

1차원 메디안 필터 기반 문서영상 영역해석 (The Region Analysis of Document Images Based on One Dimensional Median Filter)

  • 박승호;장대근;황찬식
    • 대한전자공학회논문지SP
    • /
    • 제40권3호
    • /
    • pp.194-202
    • /
    • 2003
  • 인쇄문서를 전자문서로 자동변환하기 위해서는 문서영상 영역해석과 문자인식 기술이 필요하다. 이들 중 영역해석은 문서영상을 세부 영역으로 분할하고, 분할한 영역을 문자, 그림, 표 등의 형태로 분류한파. 그러나 문자와 그림의 일부는 크기, 밀도, 화소분포의 복잡도가 비슷하여 정확한 분류가 어렵다. 따라서 영역해석에서의 오 분류는 자동변환을 어렵게 만드는 주된 원인이 된다. 본 논문에서는 분서영상을 문자와 그림영역으로 분할하는 영역해석 방법을 제안한다. 문자와 그림의 분류는 1차원 메디안 필터링을 기반으로 한 방법을 이용하여 언급한 문제점을 해결한다. 또한 메디안 필터링에 의해 발생하는 볼드체 문자와 그래프나 표와 같은 그림영역의 오 분류 문제를 표피 제거 필터와 문자의 최대크기를 이용하여 해결한다. 따라서 상용제품을 포함한 기존의 영역해석 방법보다 그 성능이 우수하다.

Hough 변환을 이용한 오프라인 필기 한글 문자열의 기울기 추정 및 교정 (Slant Estimation and Correction for the Off-Line Handwritten Hangul String Using Hough transform)

  • 이성환;이동준
    • 인지과학
    • /
    • 제4권1호
    • /
    • pp.243-260
    • /
    • 1993
  • 일반적으로 필기자의 습관이나 필기방향 등의 원인으로 종종 필기 문자열에서 기울어짐이 발생한다.이러한 문자열의 기울어짐은 문자 단위 분할시 분할 알고리즘을 복잡하게 만들고 결과적으로 문자인식 성능에도 큰영향을 미친다. 본연구에서는 선 성분의 검출 및 기울기 측정에 유용한 Hough 변환을 이용하여 단어내 수직획의 기울기를 추정하는 방법을 제안한다. 제안된 방법은 입력 필기 문자열 영상의 윤곽선을 Hough 변환에 적용하여 신 성분을 검출하고 기술어진 가도를 추정한다.실제로는 수직획이 아닌 점들이 모여 선 성분으로 검출된 경우을 제거하기 위해 임계치 이하의 길이를 갖는 선 성분은 기울기 추정 대상에서 제외한다.기울기 교정은 x좌표 값만 변환시키는 밀림 변환을 사용한다.제안된 방법의 성능을 검증하기 위해 실제 우편봉투에서 얻은 주소 영상에 대해 실험한 결과 오프라인 필기 한글 문자열의 기울기 추정 및 교정에 있어서 제안된 방법이 기존의 방법보다 우수함을 알수 있었다.

뉴스 비디오의 내용기반 검색을 위한 자동 인덱싱 (Automatic Indexing for the Content-based Retrieval of News Video)

  • 양명섭;유철중;장옥배
    • 한국정보처리학회논문지
    • /
    • 제5권5호
    • /
    • pp.1130-1139
    • /
    • 1998
  • 본 논문은 내용에 기반한 뉴스 비디오의 인덱싱과 검색을 위한 통합된 해결책을 제안한다. 핸재 일반적인 비디오의 자동 인덱싱은 불가능하지만 뉴스 비디오와 같은 구조가 명확한 경우는 가능하다. 이러한 뉴스의 구조화된 지식을 이용하여 키 프레임들을 자동 추출하기 위해서 제안된 우리의 모델은 뉴스사건 분할, 자막 인식, 검색 브라우저 모듈로 구성되어 있다. 첫 번째로 뉴스사건의 분할 모듈은 얼굴인식에 기반하여 사건의 중심인 앵커 장면을 인식하고 앵커 장면의 공간적 정보를 이용하여 뉴스사건을 분할한다. 다음으로 뉴스아이콘을 추출한다. 자막인식 모듈은 먼저 자막의 특성을 이용하여 자막 프레임을 검출하고 분리병합 방법을 이용하여 문자열을 추출한다. 다음으로 문자인식기(OCR)를 이용하여 문자인식을 한다. 마지막으로 검색 브라우저 모듈은 다양한 검색 방법이 가능하도록 하였다.

  • PDF

적응적 탬플릿 마스킹과 패턴 벡터 기법을 이용한 일본 차량 번호판 인식 (Japanese License Plate Recognition Using Adaptive Template Masking and Pattern Vector Method)

  • 김미진;김국성;이응주
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 춘계학술발표대회논문집
    • /
    • pp.635-640
    • /
    • 2003
  • 본 논문에서는 일본 차량 번호판 인식에 적응적 탬플릿 마스킹 방법을 이용하여 번호판 문자, 숫자를 분할하고 패턴벡터기법을 이용하여 인식하는 방법을 제안하였다 주, 야간과 거리에 따른 일본 차량 번호판 영상을 입력받아 전처리 과정을 수행한 후 에지 정보와 명도값 변화의 빈도수를 이용하여 번호판 영역을 검출하였다 검출된 번호판 영역에서 각 문자 및 숫자의 위치정보와 적응적 탬플릿을 이용하여 분할하고 번호판의 지역문자를 무게중심 패턴으로 분류 한 다음 크기와 이동에 무관한 특실을 가지는 패턴 벡터를 적용하여 문자를 인식하였으며, 숫자는 Four Segment Pattern을 이용하여 인식하도록 하였다 본 논문에서 제안한 방법을 실제 일관 차량 번호판 인식에 적용한 결과 98.8% 추출율과 96.6%의 인식율을 나타내었다.

  • PDF

SSD-Mobilenet과 ResNet을 이용한 모바일 기기용 자동차 번호판 인식시스템 (Vehicle License Plate Recognition System using SSD-Mobilenet and ResNet for Mobile Device)

  • 김운기;;조성원
    • 스마트미디어저널
    • /
    • 제9권2호
    • /
    • pp.92-98
    • /
    • 2020
  • 본 논문은 고성능의 서버 없이 안드로이드 스마트폰 단독으로 동작할 수 있도록 경량화 딥러닝 모델을 사용하여 구현한 자동차 번호판 인식 시스템을 제안한다. 자동차 번호판 인식시스템은 [번호판검출]-[문자영역 분할]-[문자인식]으로 3단계의 과정으로 구성되며, 번호판검출은 SSD-Mobilenet, 문자영역 분할은 ResNet에 localization을 추가하여 사용하였고 문자인식은 ResNet을 이용하여 구현하였다. 테스트한 기기는 삼성 갤럭시 S7, LG Q9이며 정확도는 약 85.3%, 실행속도는 약 1.1초가 소요된다.

일반화된 문자 및 비디오 자막 영역 추출 방법 (A Generalized Method for Extracting Characters and Video Captions)

  • 전병태;배영래;김태윤
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권6호
    • /
    • pp.632-641
    • /
    • 2000
  • 기존의 문자 영역 추출 방법은 전체 영상에 대하여 컬러 축소(color reduction), 영역 분할 및 합병(region split and merge), 질감 분석(texture analysis)등과 같은 방법을 이용하여 문자 영역을 추출했다. 이 방법들은 많은 휴우리스틱(heuristic) 변수와 추출하고자 하는 문자의 사전 지식에 의해 임계치 값을 설정함으로서 알고리즘을 일반화하기 어렵다는 문제점이 있다. 본 논문에서는 문자의 지형학적 특징점 추출 방법과 점-선-면 확장법을 이용하여 문자 영역을 추출함으로서 기존 문자 영역 추출의 문제점인 휴우리스틱 변수의 사용을 최소화하고 임계치 값을 일반화함으로 서 일반화된 문자 영역 추출 방법을 제안 하고자 한다. 실험결과 일반화된 변수와 임계값을 사용함으로서 문자의 사전 지식 없이도 문자 영역을 추출함을 볼 수 있었다. 비디오 영상의 경우 후보 영역 추출율 100%, 검증을 통한 자막 영역 추출율은 98% 이상임을 볼 수 있었다.

  • PDF