• Title/Summary/Keyword: 카메라 영상 문자 인식

Search Result 91, Processing Time 0.027 seconds

Human Friendly Documentation System of the Printed Hangul Images (인간에게 친밀한 인쇄체 한글 영상의 문서화 시스템)

  • 곽주원;강순대;백승복;박상욱;박정현;박홍선;손영선
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2002.12a
    • /
    • pp.361-364
    • /
    • 2002
  • 본 논문에서는 일반적인 문서를 CCD 카메라로 입력 받은 후, 사용자가 원하는 영역을 손가락으로 선택하면, 손 인식 알고리즘을 적용하여 사용자의 손가락 움직임을 검출하고, 손가락으로 선택되어진 영역을 인식한 후, 선택되어진 영역으로 카메라를 이동시켜 획득된 영상을 문자 인식 가능한 크기로 확대/축소하며, 확대된 영상에 문자인식 알고리즘을 적용하여 문서로 변환하는 시스템을 구현하였다 최종적으로 사용자가 이 시스템의 존재를 인지하지 못할 만큼 자연스럽게 사용할 수 있는 시스템을 구현하고자 하였다.

A Method for Thresholding and Correction of Skew in Camera Document Images (카메라 문서 영상의 이진화 및 기울어짐 보정 방법)

  • Jang Dae-Geun;Chun Byung-Tae
    • Journal of the Korea Society of Computer and Information
    • /
    • v.10 no.3 s.35
    • /
    • pp.143-150
    • /
    • 2005
  • Camera image is very sensitive to illumination that result in difficulties for recognizing character. Also Camera captured document images have not only skew but also vignetting effect and geometric distortion. Vignetting effect make it difficult to separate characters from the document images. Geometric distortion, occurred by the mismatch of angle and center position between the document image and the camera, make the shape of characters to be distorted, so that the character recognition is more difficult than the case of using scanner. In this paper, we propose a method that can increase the performance of character recognition by correcting the geometric distortion of document images using a linear approximation which changes the quadrilateral region to the rectangle one. The proposed method also determine the quadrilateral transform region automatically, using the alignment of character lines and the skewed angles of characters located in the edges of each character line. Proposed method, therefore, can correct the geometric distortion without getting positional information from camera.

  • PDF

Flowchart-C Conversion System using Camera (카메라를 이용한 flowchart-C변환 시스템)

  • 이창우;주윤희;손영선
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2003.05a
    • /
    • pp.165-168
    • /
    • 2003
  • 본 논문에서는 CCD 흑백 카메라를 이용하여 프로그래머의 알고리즘이 표현된 flowchart의 영상을 입력받아 C언어 코드로 변환하는 시스템을 구현하였다. 입력된 영상을 이진화 처리한 영상으로부터 flowchart 기호들을 인식하기 위하여 chain code 방법을 이용하였고, flowchart 기호에 기술된 영문자 및 특수문자의 인식을 위하여 가로 및 세로 히스토그램을 이용하여 한 문자색 분할한 후 각 문자들을 구성하는 흑화소 pixel의 합과 chain code 방법을 사용하였다. 가로 및 세로 투영을 이용하여 흐름선을 인식함으로써 flowchart의 논리흐름을 파악할 수 있었다. 이 시스템을 수치연산에 적용하여, 프로그래머의 알고리즘에 부합하는 프로그램이 작성되어짐을 확인할 수 있었다.

  • PDF

Development of vision system for the character recognition of the billet image (빌렛영상에 포함된 문자인식을 위한 비전시스템 개발)

  • Park, Sang-Gug
    • Journal of Korea Society of Industrial Information Systems
    • /
    • v.13 no.1
    • /
    • pp.22-29
    • /
    • 2008
  • This paper describes the developed results of vision system for the recognition of material management characters, which was included in the billet image. The material management characters, which was marked at the surface of billet, should be recognized before billet moves to the next process. Our vision system for the character recognition includes that CCD camera system which acquire billet image, optical transmission system which transmit captured image to the long distance, input and output system for the interface with existing system and software for the character recognition. We have installed our vision system at the wire rod line of steel & iron plant and tested. Also, we have performed inspection of durability, reliability and recognition rate. Through the testing, we have confirmed that our system have high recognition rate, 98.6%.

  • PDF

Pattern Recognition Using Augmented Reality (증강현실을 이용한 패턴 인식)

  • Lei, Wang;Shin, Seong-Yoon;Rhee, Yang-Won
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2009.01a
    • /
    • pp.203-206
    • /
    • 2009
  • 분 논문은 카메라 장비와 마커, DB를 이용하여 문자의 색감과 모음, 자음을 인식하여 문자에 해당되는 이미지 및 영상을 HMD 및 모니터, 가정에서 사용하는 화상 카메라 등을 이용하여 보다 구체적인 정보를 전달할 수 있게 해준다. DB에는 각 텍스트의 모음과 자음에 관한 텍스트가 등록되어 있으며, 각각의 색과 텍스트를 비교하여 해당하는 이미지를 출력하게 된다. 기존의 증강현실 기법은 해당 마크에 관한 패턴을 인식하여 그에 해당하는 이미지 및 영상을 출력하는데, DB를 이용한 문자인식을 사용할 경우 사용자에게 텍스트를 인식하여 연관된 많은 정보를 제공할 수 있게 된다. 제안된 인터페이스는 다양한 모습을 어려 시야를 통해 기존의 카탈로그보다 사용자의 접근성을 향상시키고, 미리 정의된 DB에 접근하여 해당 문자에 관한 여러가지 정보를 사용자에게 전달한다. 여러 전달 매체를 이용, 가상현실 및 증강현실 등을 다양한 카탈로그 뿐만 아니라 교육 및 신문 잡지, 광고 등 문자가 등장하는 여러 분야에 활용이 가능하다.

  • PDF

Recognition of Digit Strings from Celluar Phone image by Sequential Color Clustering (순차적 칼라 클러스터링에 기반 한 휴대폰 카메라 영상에서의 숫자열 인식)

  • 박현일;김수형
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.766-768
    • /
    • 2004
  • 자연영상에서 획득된 문자를 인식하는 연구는 대부분 디지털 카메라나 캠코더를 이용하여 획득된 고해상도 영상을 입력영상으로 사용하고 있다. 본 논문에서는 휴대폰 카메라로 획득된 저해상도 영상을 입력영상으로 사용하였다. 저해상도의 영상은 적은 수의 픽셀로 정보를 표현하고 있기 때문에 기존에 제시되었던 다양한 이진화 방법으로는 문자와 배경을 깨끗하게 분리해 낼 수 없다. 본 논문은 입력영상의 이진화를 위친 K-Means 알고리즘을 이용하여 칼라 클러스터링을 하였으며, 이진화 성능을 향상시키기 위해 지능형 주파수 필터를 사용하였다. 이진화된 영상을 파이프라인 구조의 인식 시스템에 인식시킴으로써 기존의 제안 방법들에 비하여 인식 성능을 향상시킬 수 있었다.

  • PDF

Text Region Extraction and OCR on Camera Based Images (카메라 영상 위에서의 문자 영역 추출 및 OCR)

  • Shin, Hyun-Kyung
    • The KIPS Transactions:PartD
    • /
    • v.17D no.1
    • /
    • pp.59-66
    • /
    • 2010
  • Traditional OCR engines are designed to the scanned documents in calibrated environment. Three dimensional perspective distortion and smooth distortion in images are critical problems caused by un-calibrated devices, e.g. image from smart phones. To meet the growing demand of character recognition of texts embedded in the photos acquired from the non-calibrated hand-held devices, we address the problem in three categorical aspects: rotational invariant method of text region extraction, scale invariant method of text line segmentation, and three dimensional perspective mapping. With the integration of the methods, we developed an OCR for camera-captured images.

Development of character recognition system for the billet image by use vision system (비전시스템을 이용한 빌렛영상 문자인식기 개발)

  • Park Sang-Gug;Park Soo-Young;Lee Moon-Rak
    • Proceedings of the Korea Society for Industrial Systems Conference
    • /
    • 2006.05a
    • /
    • pp.197-200
    • /
    • 2006
  • 본 논문은 철강공장의 연주공정에서 만들어진 빌렛 소재의 관리를 위해 사용되는 소재 관리문자를 실시간으로 인식하기 위한 빌렛 소재 관리문자 인식용 비전시스템 개발 결과에 대해 기술한다. 빌렛 재질의 단면에 마킹된 소재 관리문자는 소재가 다음 공정으로 이동하기 전에 공정상에서 실시간으로 인식된다. 문자인식 시스템은 영상획득을 위한 카메라 시스템, 영상을 장거리로 고속 전송하기위한 영상전송 시스템, 기존 시스템과의 인터페이스를 위한 입. 출력 장치로 구성된다. 개발된 문자인식 시스템을 실제 철강공장에 설치하여 운용테스트를 실시했다. 테스트 기간 중에 시스템의 내구성과 신뢰성을 검증하고 최종적으로 문자 인식률을 검증했다. 개발된 시스템에 대해 현장 테스트 결과 실험실 수준과 비슷한 수준의 인식률을 가졌다.

  • PDF

A Noise Removal Method Using Chain Code for Document Images (체인 코드를 이용한 문서 영상의 잡음 제거 방법)

  • Kim, Se-Ho;Seo, Dong-Hwan;Pack, Jae-Hwa
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.05a
    • /
    • pp.439-442
    • /
    • 2005
  • 카메라 모바일 폰이 대중화됨에 따라 이제 더 이상 음성 전달 기기로서가 아닌 정보 조작 및 정보 전달 기기로서의 기능이 더욱 중요해졌다. 때문에 이러한 욕구를 충족 시켜주기 위해서는 적시 적소에 정보를 활용할 수 있는 오프라인 문자 인식 시스템이 필요하게 되었다. 하지만, 오프라인 문자 인식 시스템은 카메라를 통해 입력된 영상 중에는 순수 문자 영상뿐만 아니라 배경 이미지나 잡음을 포함한다. 특히, 그림과 함께 삽입 되어져 있는 명함과 같은 텍스트 문서 같은 경우, 삽입되어져 있는 그림 때문에 오인식의 문제가 발생 할 수 있다. 따라서 본 논문에서는 카메라를 통해 입력되는 문서 영상을 문자와 배경 그림을 분리하여 효과적으로 잡음을 제거하는 방법을 제안하였다.

  • PDF

DOT Classification Code Extraction through 3-Dimensional Features (3차원 특징을 이용한 DOT 분류 코드 추출)

  • 김재한;심재창
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.394-396
    • /
    • 2001
  • 본 논문의 목적은 타이어에 각인되어 있는 DOT 코드 문자를 효과적으로 추출하는데 있다. 기존의 DOT 문자 인식 방법에서는 카메라와 조명에 의한 2차원 영상에서 DOT 문자 추출을 시도하였는데, 타이어는 DOT 문자와 배경이 동일한 색상이고, 조명에 민감해서 DOT 문자의 추출이 용이하지 않았다. 그래서, 본 논문에서는 타이어의 DOT 문자를 조명에 거의 영향을 받지 않는 3자원 레이저 스캐너를 이용해서 획득하고, 획득된 영상에서 높이 값 정보를 추출했으며 추출된 높이 값 정보를 가진 영상에 패턴 인식 기법을 적용하여 DOT 문자를 효과적으로 추출할 수 있었다.

  • PDF