• Title/Summary/Keyword: 문자영역 추출

검색결과 288건 처리시간 0.029초

모바일 이미지 기반의 문자인식 시스템 (The Character Recognition System of Mobile Camera Based Image)

  • 박영현;이형진;백중환
    • 한국산학기술학회논문지
    • /
    • 제11권5호
    • /
    • pp.1677-1684
    • /
    • 2010
  • 최근 모마일 폰의 발달과 스마트 폰의 보급으로 인해서 많은 콘텐츠들이 개발되어지고 있다. 특히, 모바일 휴대장치에 소형 카메라가 탑재되면서부터 카메라로부터 입력되어지는 영상 기반 콘텐츠 개발은 사람들의 흥미뿐만 아니라 활용 면에서도 중요한 부분을 차지하고 있다. 그중 문자인식 시스템은 시각 장애인 보행 보조 시스템, 로봇 자동 주행 시스템, 비디오 자동 검색 및 색인 시스템, 텍스트 자동 번역 시스템 등과 같은 활용영역에서 매우 광범위하게 쓰일 수 있다. 따라서 본 논문에서는 스마트 폰 카메라로 입력되는 자연 영상에 포함되어 있는 텍스트를 추출 및 인식하고 음성으로 출력해주는 시스템을 제안하였다. 텍스트 영역을 추출하기 위해 Adaboost 알고리즘을 이용하고 추출된 개별 텍스트 후보영역의 문자 인식에는 오류 역전파 신경망을 이용하였다.

연결요소와 색상정보를 이용한 실제적 문서영상 분할 (Practical Page Segmentation using Connected Components and Color Information)

  • 김병기
    • 한국정보처리학회논문지
    • /
    • 제7권1호
    • /
    • pp.273-285
    • /
    • 2000
  • 문서영상의 분할은 문서인식의 전 과정 중에서 인식률에 큰 영향을 미치는 단계이지만 국내에서는 양적${\cdot}$질적으로 이에 대한 실제적인 연구가 부족한 것이 사실이다. 그 결과, 구조가 복잡하거나 칼라로 인쇄된 문서의 분할은 여전히 개선할 점이 많다. 본 논문에서는 불규칙한 다단, 점선, 그래픽, 사진 등의 다양하고 복잡한 요소로 구성된 문서의 실제적인 분할문제들을 살펴보고, 연결요소와 색상정보를 이용하여 이들을 효율적으로 분할하는 실제적 문서영상 분할 기법을 제안한다. 윤곽선 추출을 이용하여 다양한 형태의 모든 연결요소를 추출하고, 추출된 연결요소별 유형판정 및 연결요소 병합기준을 이용함으로써 정확한 문서영상 분할이 가능하다. 또한 색상문서의 경우, 정확한 문서분할과 처리시간 개선을 위하여 먼저 이진화된 문서에 대해서 문자와 비문자 영역으로 분할한 후, 필요에 따라 비문자 영역에 대하여 별도의 칼라별 영역분할을 수행한다. 제안된 방법의 성능을 확인하기 위하여 다양한 구조와 내용을 갖는 180장의 문서영상을 대상으로 문서분할 실험을 수행하였다. 아울러, 6가지 국내외 상용 문서인식 소프트웨어의 문서영상 분할 결과와 비교함으로써 제안한 방법이 복잡한 문서영상의 실제적 분할에 우수한 성능을 보임을 확인하였다.

  • PDF

CCD 기반 바코드 관심대상영역 고속 추출에 관한 연구 (A Study on the High-Speed Extraction of Bar Code ROI based on the CCD)

  • 박문성;최호석;김진석;김혜규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (하)
    • /
    • pp.1103-1106
    • /
    • 2002
  • 현재, 컨베이어 벨트시스템에 소포를 직재하고, 우편번호를 운영자가 입력하여 구분한다. 구분된 소포 중에서 기록관리 대상의 경우에는 바코드를 판독하여 처리하고 있다. 이에 따라, 본 논문에서는 2m/sec 이내로 이송되는 소포를 라인 CCD(Charged Coupled Device) 카메라에 의해 이미지 획득한 후, 바코드 ROI 추출 방법을 위해 $32{\times}32$ 미세블룩 검사 방법을 적용하였다. ROI 추출 절차는 최대-최소 차이값과 동적 인계값 기준으로 바탕면 제거, 문자열과 바코드 영역을 판단하기 위한 대각선(diagonal) 검사방법 적용, 바코드 영역인지 검증하기 위해 수평으로 5 라인을 검사하고 에지의 수와 폭의 변화량 비교 등의 과정으로 수행하였다. 그리고 바코드 ROI 추출은 레이블링 과정에 의해 바코드 영역의 보정과 그룹크기 비교에 의한 ROI 영역의 구체화와 정보 해석을 위하여 ROI 외곽좌표 8개중에서 가장 간 중심축 라인으로 생성하는 방법 등을 적용하였다. ROI 추출과 중심축 시험결과에 의하면 $50{\sim}180msec$이내에 가능하게 되었다. 그리고, ROI 추출의 정확도는 99.994% 이상을 만족한다.

  • PDF

Watershed 변환을 이용한 효율적인 문자 영상 향상 및 영역 분할 (An Efficient Character Image Enhancement and Region Segmentation Using Watershed Transformation)

  • 최영규;이상범
    • 정보처리학회논문지B
    • /
    • 제9B권4호
    • /
    • pp.481-490
    • /
    • 2002
  • 오프라인 필기체 문자 인식은 동적인 정보를 가지고 있지 않고, 다양한 필기와 자음과 모음의 겹침이 심하며, 획 사이의 잡영을 많이 가지고 있어 불완전한 전처리를 수행하여야 하는 어려움이 있다. 따라서 오프라인 필기체 문자 인식은 다양한 방법의 전처리 즉 이진화 및 세선화에 대한 연구가 필요하다. 본 논문에서는 오프라인 필기체 한글 문자 인식의 전처리로서 워터쉐드 알고리즘의 수행 시간과 결과 영상의 품질을 고려해 그레이 레벨 문자 영상에서의 문자 영역과 배경 영역의 분할을 위한 효과적인 워터쉐드 알고리즘의 적용 방법과 추출된 워터쉐드 영상을 이진화하는 분할 함수를 제안한다. 또한 수행 시간과 골격선의 품질을 고려한 조건 검사 마스크를 통해서 효과적으로 골격선을 추출하는 세선화 방법을 제안하고 기존의 방법과 본 논문 방법을 수행 시간과 품질로써 성능을 평가한다. 실험 결과 기존의 방법은 평균 2.16초, 본 논문 방법은 평균 1.72초의 수행 시간이 걸렸다. 또한 결과 영상의 품질은 본 논문 방법이 문자 획 사이의 잡영을 효과적으로 처리함을 알 수 있었다.

다중 활자체 한글 문자 인식을 위한 유형 분류 (The Type Clustering for the Multi-Font Hangul Character Recognition)

  • 김민기;권영빈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.194-199
    • /
    • 1997
  • 본 논문에서는 글꼴의 변화와 잡영을 흡수할 수 있도록 자소의 탐색 영역을 정의 하였으며 이 영역에 나타나는 횡모음과 종모음의 주획을 추출하는 방법을 기술하였다. 종모음 영역에서 추출한 수직획들과 횡모음 영역에서 추출한 수평획들을 각각 종모음과 횡모음의 주획이 될 수 있는 후보들로써 이들로 부터 종모음과 횡모음의 존재를 파악하는 것이 한글 유형 분류의 주된 내용이다. 그러나 다양한 글꼴에 나타나는 수평획들로부터 곧바로 횡모음의 존재를 파악하는 것은 쉬운 문제가 아니다 본 논문에서는 기존의 트리 분류기를 확장하여 복잡하고 다양한 특징을 단계별로 단순화시키고 트리 분류기의 상위 노드에서 결정된 정보와 제약 조건을 이용하여 유형을 분류하는 방법을 제안하였다. 제안된 방법은 한글 상위 빈도 1405자, 3가지 글꼴에 대하여 99.8 %의 유형 분류율을 보이고 있다.

  • PDF

실세계 영상에서 적응적 에지 강화 기반의 MSER을 이용한 글자 영역 추출 기법 (An Extracting Text Area Using Adaptive Edge Enhanced MSER in Real World Image)

  • 박영목;박순화;서영건
    • 디지털콘텐츠학회 논문지
    • /
    • 제17권4호
    • /
    • pp.219-226
    • /
    • 2016
  • 일반 생활 속에서 우리 인간의 눈으로 정보를 인식하고 그 정보를 이용하는 것에는 한계가 없을 만큼 다양하고 방대하다. 그러나 인공지능이 발달한 현재의 기술로도, 인간의 시각 처리 능력에 비하면 턱없이 능력이 부족하다. 그럼에도 불구하고 많은 연구자들은 실생활 속에서 정보를 얻고자 하고 있고, 특히 글자로 된 정보를 인식하는데 많은 노력을 기울이고 있다. 글자를 인식하는 분야에서 일반적인 문서에서 글자를 추출하는 것은 일부 정보처리 분야에서 이용되고 있지만, 실영상에서 문자를 추출하고 인식하는 부분은 아직도 많이 부족하다. 그 이유는 실영상에서는 색깔, 크기, 방향, 공통점 등에서 다양한 특징을 갖고 있기 때문이다. 본 논문에서는 이런 다양한 환경에서 문자 영역을 추출하기 위하여 적응적 에지 강화 기반의 MSER을 적용하여 장면 텍스트 추출을 시도하고, 비교적 좋은 방법임을 실험으로 보인다.

모바일정보검색 서비스를 위한 문자 인식 (Image Processing for Mobile Information Retrieval Service)

  • 임명재;현성경;박지은;이기영
    • 한국인터넷방송통신학회논문지
    • /
    • 제11권1호
    • /
    • pp.103-108
    • /
    • 2011
  • 현대 사회는 정보화에 대한 인식이 크게 보편화되면서 정보 통신 기술에 대한 개발이 급속화 되고 있는 추세이다. 특히 모바일 기기에 대한 기술 또한 빠르게 진행됨에 따라 자신이 원하는 정보를 언제 어디서나 제공받기를 기대한다. 이에 따라 편리한 정보검색을 위한 이미지 검색이 보편화 되고 있다. 하지만 일반적인 이미지 검색은 이미지에서의 문자영역 추출의 부정확성과 추출된 문자로 상세한 정보를 얻는데 어려움이 따른다. 따라서 본 논문에서는 촬영한 영상에서 문자인식을 통해 관광지를 포함한 여러 상점들의 간판을 인식하여 사용자에게 편리한 정보제공을 목적으로 하고 있으며, Top-Hat이라는 문자추출 방법과 서버를 함께 연동시키므로 시킴으로써 보다 정확하고 상세한 정보를 얻을 수 있다.

연결요소 특징을 이용한 복잡한 문서영상의 구조 분석 (A new segmentation method for non-manhattan layout document images using connected component)

  • 이상협;이경무
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1997년도 학술대회
    • /
    • pp.71-74
    • /
    • 1997
  • 본 논문은 일반적으로 제약 없는 형식 문서 즉, 논-맨하탄(non-manhattan) 형식의 이진문서영상을 분석하는 기법으로서, 연결요소기법에 기반한 특징추출과 이를 이용한 영역분리 및 분류에 관한 새로운 방법을 제안한다. 제안한 방식은 바텀-업(bottom-up)방식으로서 먼저 처리속도의 고속화와 축소시 특징 영역보존을 위해 임계치 축소기법을 사용하고, 축소된 이진 문서영상내의 각 연결된 검은 화소의 집합을 개체화하고 개체의 특성에 따라 텍스트, 신성분, 해프톤, 도형 그리고 표 등으로 분류한다. 영역분류는 두단계로 이루어지는데, 1차분류에서는 우선, B/W 비, 면적, 외각 테두리의 높이와 너비 비, 테두리선유무 등의 특징을 이용하여 해프톤, 수평 수직선, 테두리(표 및 도형)영역을 분리한다. 이후 2차 분류에서는 문자성분의 수평결합을 통한 텍스트행 성분을 추출한다. 마지막 후처리 과정으로 표분석 알고리듬을 통하여 테두리 영역중 표와 도형을 정확히 구분하고, 또한 도형에 관련한 문서성분을 해당 도형 개체에 연결하는 작업을 수행함으로써 완벽한 영역분류를 한다. 다양한 문서영상을 이용한 시뮬레이션을 통해 제안한 알고리듬의 성능을 입증한다.

  • PDF

Adaptive Multi-threshold를 이용한 자동차 번호판영역의 이진화 (Binarization of Vehicle Plate Region using Adaptive Multi-threshold)

  • 김형재;이도엽;배익성;이철희;차의영
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 1998년도 춘계학술발표논문집
    • /
    • pp.143-147
    • /
    • 1998
  • 카메라 영상에 의한 자동차 번호판 인식시스템은 영상 획득, 번호판 추출, 전처리, 문자 분리, 문자 인식 등 크게 5자기의 핵심 부분으로 구성된다. 따라서 자동차 번호판 인식시스템의 성능을 향상시키기 위해서는 이들 부분들 각각의 성능의 최적화가 필요하다. 본 연구는 자동차 번호판 인식시스템의 여러 단계 중 전처리에 해당하는 번호판 영역의 이진화에 관한 연구로서, 기존의 단일 임계치 방법과 다중 임계치 방법이 해결하지 못했던 부분을 보완하는 새로운 다중 임계치 방법을 제안한다. 본 논문에서 제안하는 다중 임계치 알고리즘(Adaptive Multi-threshold Algorithm)을 사용함으로써 gray-level 번호판 영상에 대해서 보다 깨끗한 이진 영상을 얻을 수 있었으며, 또한 이 알고리즘은 번호판 영역의 밝기값이 고르지 않은 영상에 대해서도 효율적인 알고리즘 임을 알 수 있었다.

  • PDF

호텔링 변환을 이용한 자동차 번호판 인식시스템에 관한 연구 (License Plate Recognition System Using Hotelling Transform)

  • 김태우;강용석
    • 한국정보전자통신기술학회논문지
    • /
    • 제2권1호
    • /
    • pp.29-35
    • /
    • 2009
  • 본 논문에서는 차량의 후면에서 촬영한 영상을 이용하여 효과적으로 번호판을 추출하고, 그 안에 표기된 문자를 인식하는 방법을 제안한다. 기존의 연구방법은 전체영상에 대하여 전처리를 수행하여 에지(edge)영상을 구하여 이진화 한다. 이진화된 영상에서 허프(Hough)변환을 수행하여 수평, 수직선을 구하고, 번호판의 특징을 이용하여 번호판 영역을 추출한다. 이 방법의 문제점은 처리시간이 많이 소요되므로 실시간처리가 곤란하다는 점과 야간관 같이 명암상태가 불규칙하고 영상에서 번호판 테두리가 나타나지 않으면 번호판 영역추출을 할 수 없다는 점이다. 또한 차량의 후면에서 촬영한 영상에서 번호판 영역의 명암값 변화의 특성을 이용하여 번호판 영역에서 숫자폭, 배경영역과 숫자영역의 명암차를 조사하여 숫자영역임을 확인하고, 확인된 숫자와 숫자사이의 거리를 조사하여 번호판 영역을 추출한다. 본 연구는 기존방법의 번호판 테두리 훼손에 따른 번호판 영역추출 실패의 문제점을 해결하고 시간 소요의 문제를 실시간안에 처리 함으로써 실용적 응용이 가능하다. 실험 결과 100장의 샘플영상으로 실험한 결과 멀리 있는 자동차 영상에서도 자동으로 번호판을 판독할 수 있었으며, 번호판 추출에 실패한 영상은 13%를 나타내었고, 문자인식에 실패한 영상은 0.4%의 결과를 나타내었다.

  • PDF