• 제목/요약/키워드: 문자영상

검색결과 796건 처리시간 0.033초

서포트벡터머신과 정칙화판별함수를 이용한 비디오 문자인식의 분류 성능 개선 (Video character recognition improvement by support vector machines and regularized discriminant analysis)

  • 임수열;백장선;김민수
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권4호
    • /
    • pp.689-697
    • /
    • 2010
  • 본 연구에서는 비디오이미지로부터 추출된 텍스트영역으로부터 문자인식을 수행하였다. 비디오영상으로부터 추출된 문자열은 한글, 영어, 숫자, 특수문자 등으로 혼합되어 있거나, 또는 다양한 폰트와 크기, 그래픽 형태의 글자 존재, 영상의 기울어짐, 끊김, 잡영, 접촉, 저해상도의 글자 등으로 인하여 일반적인 문자인식에 비해 많은 어려움이 존재한다. 이와 같은 어려움을 극복하기위해 본 연구에서는 모든 글자에 대해서 인식하지 않고 가장 빈번하게 등장하는 글자만을 인식하고 나머지는 버리는 방법을 사용하였으며 지지도벡터기계와 정칙화판별분석의 2단계 문자인식 방법을 이용하여 인식률을 개선하였다. 또한 인식률이 좋지 못한 4형식과 5형식 글자에 대해 모음별로 중분류를 실시하였다. 실험결과 지지도벡터기계와 정칙화판별분석을 동시에 사용하는 방법이 다른 문자인식의 방법들보다 인식률이 우수하였으며, 부분적인 중분류의 방법을 이용한 경우 향상된 인식 성능을 나타냈다.

카메라 획득 문서영상에서의 글자모양 왜곡보정 (Character Shape Distortion Correction of Camera Acquired Document Images)

  • 장대근;김의정
    • 한국정보통신학회논문지
    • /
    • 제10권4호
    • /
    • pp.680-686
    • /
    • 2006
  • 스캐너로 획득한 문서영상을 대상으로 문자인식을 하는 경우와 달리 카메라로 획득한 문서 영상을 대상으로 문자인식을 수행할 경우 카메라 렌즈의 특성과 카메라와 피사체간의 위치와 각도의 불일치에 의해 글자모양의 왜곡이 발생한다. 따라서 이러한 왜곡들로 인해 실제로 사용이 가능한 카메라 문자인식 기술의 개발이 쉽지 않았다. 본 논문에서는 문서 영상을 카메라로 획득할 때 발생하는 3차원의 비선형적 왜곡을 2차원의 선형 변환을 이용하여 근사화함으로써 왜곡된 글자모양을 교정한다. 또한 변환과정에서 글자와 글자줄을 추출하여 상하로는 글자줄의 배열방향을, 좌우로는 문자획의 기울어진 각도를 측정함으로써 왜곡으로 인해 사변형 형태로 변형된 글자영역 즉 변환영역을 자동으로 설정함으로써 부가적인 정보의 획득 없이 문서영상 자체만으로 기하하적 왜곡보정이 가능하다.

대용량 오프라인 한글 글씨 영상 데이터베이스 KU-1의 설계 및 구축 (Design and Construction of a Large-set Off-line Handwritten Hangul Character Image Database KU-1)

  • 김대인;김상엽;이성환
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.152-159
    • /
    • 1997
  • 최근 들어 인쇄체 문자 인식 기술의 발전에 힘입어 필기체 한글 인식에 관한 연구가 활발히 진행되고 있다. 인쇄체 문자와는 달리 자연스럽게 필기된 한글 글씨는 동일한 문자라 하더라도 같은 모양을 가지고 있다고 단정하는 것이 불가능할 정도로 필기자의 필기 유형에 따른 다양한 변형을 내포하고 있다. 따라서 효과적인 한글 글씨 인식기를 개발하기 위해서는 다양한 변형을 포함하는 대용량의 한글 글씨 영상 데이터베이스가 필수적이다. 본 논문에서는 시스템공학연구소 주관 국어 정보 베이스 개발 사업의 일환으로 고려대학교에서 구축 중인 오프라인 한글 글씨 영상 데이터베이스, KU-1에 대해 간략히 소개하고자 한다. 본 데이터베이스는 KS C 완성형 한글 사용 빈도순 상위 1,500자에 대하여 다양한 계층, 직업, 연령, 지역 분포를 고려한 1,000명 이상의 필기자가 정서체와 본인의 평소 자유 필체로 필기한 1,000벌의 명도 한글 글씨 영상으로 구성되어 있다.

  • PDF

골프 동영상에서의 강건한 선수명 인식 (Robust Recognition of a Player Name in Golf Videos)

  • 정철곤;김중규
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 1부
    • /
    • pp.659-662
    • /
    • 2008
  • 스포츠의 경기에서 비디오 문자는 득점이나 선수명과 같은 중요한 정보를 제공한다. 본 논문에서는 골프 동영상에서 선수명 정보를 강건하게 인식하는 방법을 제안한다. 골프 경기의 경우, 원하는 선수의 플레이 장면을 검색하고자 하는 요구가 많은 스포츠 종목이다. 이러한 기능을 구현하기 위해 골프 동영상에 포함된 문자 정보를 이용한다. OCR 에 의해 검출된 문자 정보를 인식한 후, 사전 등록된 선수명 DB 를 이용해 선수명 정보를 인식한다. 이렇게 획득된 선수명 정보를 이용해 원하는 선수의 플레이 장면을 검색할 수 있도록 하였다. 다양한 골프 동영상에 대하여 실험을 수행한 결과, 본 논문에서 제안한 방법이 강건하게 선수명을 인식하는 것을 확인하였다.

  • PDF

윈도우 기반의 광학문자인식을 이용한 영상 번역 시스템 구현 (An Implementation of a System for Video Translation on Window Platform Using OCR)

  • 황선명;염희균
    • 사물인터넷융복합논문지
    • /
    • 제5권2호
    • /
    • pp.15-20
    • /
    • 2019
  • 기계학습 연구가 발달함에 따라 번역 분야 및, 광학 문자 인식(Optical Character Recognition, OCR) 등의 이미지 분석 기술은 뛰어난 발전을 보였다. 하지만 이 두 가지를 접목시킨 영상 번역은 기존의 개발에 비해 그 진척이 더딘 편이다. 본 논문에서는 기존의 OCR 기술과 번역기술을 접목시킨 이미지 번역기를 개발하고 그 효용성을 검증한다. 개발에 앞서 본 시스템을 구현하기 위하여 어떤 기능을 필요로 하는지, 기능을 구현하기 위한 방법은 어떤 것이 있는지 제시한 뒤 각기 그 성능을 시험하였다. 본 논문을 통하여 개발된 응용프로그램으로 사용자들은 좀 더 편리하게 번역에 접근할 수 있으며, 영상 번역이라는 특수한 환경으로 한정된 번역기능에서 벗어나 어떠한 환경에서라도 제공되는 편의성을 확보하는데 기여할 수 있을 것이다.

복잡한 영상 내의 문자영역 추출을 위한 텍스춰와 연결성분 방법의 결합 (Hybrid Approach of Texture and Connected Component Methods for Text Extraction in Complex Images)

  • 정기철
    • 대한전자공학회논문지SP
    • /
    • 제41권6호
    • /
    • pp.175-186
    • /
    • 2004
  • 본 논문은 복잡한 컬러 영상에서의 문자 추출을 위한 텍스춰와 연결성분 방법의 결합된 방법을 제안한다. 자동 학습 방법으로 구축된 다층 신경망(multilayer perceptron)은 부트스트랩 학습 방법을 사용함으로써 별도의 특징값 추출 단계 없이 다양한 환경의 입력 영상에 대한 검출률(recall rate)을 향상시키며, 검출률을 향상함으로써 발생되는 정확도(precision rate) 저하 문제는, NMF(Non-negative matrix factorization)를 이용한 연결 성분 방법을 사용함으로써 극복한다. 문자의 존재 비율이 낮은 입력영상에 대하여 CAMShift 알고리즘을 이용한 영역 마킹 방법을 사용함으로써, 두 방법을 결합함으로써 야기되는 속도 저하 문제의 해결을 시도하였다. 이와 같이 텍스춰와 연결성분 방법을 결합함으로써 강건하고 효율적인 시스템을 구성할 수 있었다.

PDA 응용을 위한 명함 영상의 회전 보정 (Skew Correction of Business Card Images for PDA Application)

  • 박준효;장익훈;김남철
    • 한국통신학회논문지
    • /
    • 제28권12C호
    • /
    • pp.1225-1238
    • /
    • 2003
  • 본 논문에서는 PDA에 장착된 카메라를 사용하여 획득한 명함 영상에 대한 회전 보정 알고리듬을 제안한다. 제안된 방법은 크게 블록적응 이진화부, 스트라이프 생성부, 회전각 계산부, 그리고 영상 회전부로 구성된다. 블록적응 이진화부에서는 입력 영상의 불균일한 조명이나 그림자의 영향을 감소시키기 위하여 입력 영상을 블록별로 이진화한다. 스트라이프 생성부에서는 인접한 문자와 이들로 이루어진 문자열들을 병합하여 문자열 클러스터를 생성하고, 생성된 클러스터 중에서 회전각 계산에 유용한 것들을 스트라이프로 분류한다. 회전각 계산부에서는 스트라이프들의 방향각을 중심 모멘트를 이용하여 계산하고 이들 방향각을 평균하여 입력 영상의 회전각으로 결정한다. 영상 회전부에서는 입력 영상을 계산된 회전각 만큼 회전시킨다. 실험결과 제안된 방법은 여러 종류의 명함을 다양한 주변 여건에서 PDA로 획득한 시험 영상에 대하여 약 93%의 회전 보정률을 보였다.

변형된 면적기반영역선별 기법에 의한 문자영상분할 (Handwritten Image Segmentation by the Modified Area-based Region Selection Technique)

  • 황재호
    • 대한전자공학회논문지SP
    • /
    • 제43권5호
    • /
    • pp.30-36
    • /
    • 2006
  • 변형된 면적기반영역선별 기법으로 문자영상 속에 내재되어 있던 영역 분할을 회복하는 새로운 기법을 제안한다. 정보영역과 바탕영역으로 양분되어 있는 이진 원영상에 비해 오염 및 훼손으로 관측영상은 얼룩점과 잡음이 전체 영상에 섞여 다수의 크고 작은 영역들이 혼재된 그레이스케일 형태가 된다. 이러한 영상을 종래의 문턱치 처리나 확률적 기법으로 영역 분할하려면 이진영상으로 전환시킴에 의한 영역 형태 변형 문제가 발생한다. 이 문제를 최소화하기 위해 마름모꼴 블록을 채택한 반복조건부양식(iterated conditional mode, ICM) 기법으로 이진 영상을 구현하여 일차적으로 영역들의 집합으로 분류하였다. 그 다음 현재고려중인 화소에서 화소의 영역형성 판별과 영역의 면적을 산출하였다. 이를 전체 화소에 걸쳐 순차적으로 확산하여 해당영역들의 정보영역으로의 귀속 여부를 선택적으로 판정 분할함으로 정보영역 본래 형태를 복원하였다. 이 때 지정 영역들의 산출 면적들은 하나의 집합으로 배속 정렬되며 확률처리로 얻은 판별 파라미터 값에 의해 선별된다. 그레이스케일 탁본영상을 대상으로 종래의 문턱치 영역분할 기법과 ICM 기법도 함께 실험하였다. 그 결과 종래의 기법에 비해 우수한 영역분할 효과를 얻을 수 있었다.

필기영상의 동적 정보 추출 및 인식을 위한 통계적 모형 (An Accurate Stochastic Model for the Pen Trajectory-Based OCR)

  • 신봉기
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.395-397
    • /
    • 2003
  • 온라인 필기 인식기의 필기 모델을 응용하여 오프라인 한글 필기의 필기 궤적을 추적하고 인식하는 방법을 제안한다. 사용한 온라인 모델은 HMM의 망으로 구성한 조합형 한글 필기 모델 BongNet이다. 그리고 시계열 신호의 길이에 대한 모델이 전혀 없는 표준 HMM 대신 동적인 연속 출력 nonstationary HMM 을 이용한 방법을 기술하였다. 획 추적 계산 과정에는 프레임 동기 알고리즘을 적용한다 HMM의 각 상태는 가능한 필기 궤적상의 위치에 대한 정보를 기록한다. 매 시각마다 최종 상태의 후보 중에서 모든 획을 완전히 지나는 경로가 있는지를 조사한다. 본 방법은 문자영상에서 온라인 시계열 코드를 만들어 가는 과정이며 코드와 동시에 인식결과를 출력한다.

  • PDF

컨테이너 영상 전처리 및 식별자 인식 시스템의 설계 (Design of Container Image Preprocessing And Identifier Recognition System)

  • 박준표;이주표;황대훈
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 추계학술발표논문집
    • /
    • pp.786-791
    • /
    • 2002
  • 오늘날 컨테이너의 과다한 물동량 증가로 인하여 수작업으로 이루어지는 컨테이너를 처리하는데 어려움을 겪고 있다. 따라서 식별자로 컨테이너를 자동 인식하고 그 결과를 항만 물류처리 자동화 시스템에 적용하고자 하는 필요성이 대두되고 있다. 이에 본 논문에서는 항만 물류처리 자동화 시스템을 사용하기 위하여 컨테이너의 인식 처리를 자동화하는데 그 방안으로 컨테이너의 RGB를 이용하여 바탕색과 문자색을 검출하고 바탕색과 문자색의 차를 이용해 가장 큰 차이를 보이는 RGB 값 중 하나로 영상을 이진화 하였다. 컨테이너의 식별자를 인식하기 위해서 신경망 알고리즘의 하나인 Back-propagation을 적용하여 기존의 식별자 인식 방법보다 신속하고 정확한 처리가 가능하도록 구현하였다.

  • PDF