• 제목/요약/키워드: OCR(Optical Character Recognition) technology

검색결과 46건 처리시간 0.021초

문자 인식 기술을 이용한 데이터베이스 구축 (Building Database using Character Recognition Technology)

  • 한선화;이충식;이준호;김진형
    • 한국정보처리학회논문지
    • /
    • 제6권7호
    • /
    • pp.1713-1723
    • /
    • 1999
  • 문자 인식 기술은 인쇄도니 형태로 존재하는 수많은 정보를 데이터베이스화 할 수 있는 가장 유용한 대안이다. 본 논문에서는 문자 인식 기술을 사용한 데이터베이스 구축의 타당성을 조사하기 위하여, 문자인식기를 사용한 데이터베이스를 시범적으로 구축하였다. 우선 데이터베이스를 구축할 때 문자 인식기의 선택 시 고려하여야 할 사항들을 살펴보고, 이를 기준으로 4가지의 상용 문자 인식기에 대한 인식 실험을 거친 후 그 중 인식 성능이 가장 좋은 것을 선택하였다. 대상 문서로는 다양한 인쇄 품질 및 특성을 갖는 실제 논문집의 초록을 대상으로 삼았으며, 대량 데이터에 대한 인식률 계산을 위해 수작업된 데이터베이스가 있는 KT 테스트 컬렉션[1]을 선택하였다. 실험은 실제 대용량 데이터베이스 구축과 유사한 환경을 만들기 위해, 문서별 학습이나 기울기 보정 등의 사전 작업을 생략하였다. 실험 결과 970편의 논문 요약문에 대해 평균 문자 인식률 90.5%를 보여, 한글 문자 인식 기술이 아직 데이터베이스 구축에 활용되기에는 이르다는 것을 보였다. 문자 인식에 의한 인식 오류에서는 수작업 한 문서에서 발견되는 오류와는 상이한 유형이 많이 발견된다. 본 논문에서는 추후의 연구를 위하여 문자 인식 텍스트에서 나타나는 오류의 유형을 분류하였다.

  • PDF

RFID/OCR 기반의 자동화 게이트시스템 개발 (Development of the automated gate system based on RFID/OCR in a container terminal)

  • 최형림;박병주;신중조;;이정희
    • 한국산업정보학회논문지
    • /
    • 제12권2호
    • /
    • pp.37-48
    • /
    • 2007
  • 각국의 항만들은 중심항만으로 자리매김하기 위해 첨단기술을 항만건설, 하역장비, 운영시스템 등에 적용함으로써 항만 효율성 및 생산성 향상에 박차를 가하고 있다. 최근에는 RFID(radio frequency identification)와 OCR(optical character recognition) 기술의 등장으로 자동화 게이트시스템에 대한 관심이 높아지고 있다. 국내에는 RFID 기술과 OCR 기술을 적용하여 컨테이너 터미널 게이트의 효율성 및 생산성을 향상시키고자 하는 연구과제들이 수행되고 있으나, 100%에 미치지 못하는 인식률 때문에 현실에 적용하기에 부족한 부분이 있다. 이에 본 연구에서는 RFID와 OCR기술을 동시에 적용해 이들이 가진 장점을 활용한 RFID/OCR 기반의 자동화 게이트시스템을 개발하고, 이를 컨테이너 터미널 게이트에 적영하여 컨테이너 터미널 게이트의 인식업무를 개선시킬 수 있는 효율적인 게이트 운영 시스템을 제시하고자 한다.

  • PDF

OCR 기반 스마트 가계부 구현 (Development of Smart Household Ledger based on OCR)

  • 채성은;정기석;이정열;노영주
    • 한국인터넷방송통신학회논문지
    • /
    • 제18권6호
    • /
    • pp.269-276
    • /
    • 2018
  • OCR(광학문자인식)은 컴퓨터 분야에 적용된 지 20년의 역사가 되었고, 자동차 번호판 인식을 통한 주차관리 등 여러 분야에서 응용되어왔다. 본 OCR 기반 스마트 가계부 앱 개발연구에서도 이 기술을 이용하였다. 스마트폰 기반 가계부에서 구매 내역을 수기로 일일이 기입하는 불편을 개선하고자 카메라로 영수증을 촬영해서 구입 목록을 자동으로 정리할 수 있도록 하였다. 이 과정에서 기존의 OCR 기술만으로 영수증의 이미지 문자를 판독하면 인식률이 떨어져서 영상처리기술을 이용하여 영수증 사진의 대비를 조절하는 방법으로 영수증의 문자 인식률을 89%에서 92.5%로 향상하였다.

온톨로지를 이용한 tesseract 기반의 OCR 모델 인식률 향상에 관한 연구 (A Study on the Improvement of Tesseract-based OCR Model Recognition Rate using Ontology)

  • 황치곤;윤대열;윤창표
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.438-440
    • /
    • 2021
  • 기계학습의 발전에 따라 다양한 분야에 인공지능 기법이 적용되고 있다. 이 분야 중 이미지에 있는 문자를 텍스트로 변환하는 OCR 기법이 있다. HP에서 개발된 tesseract는 그 기법의 하나다. 그러나 이미지의 문자를 인식하는 인식률이 아직은 낮다. 이를 위해 본 연구에서는 온톨로지를 이용하여 문맥을 인지시키는 후처리 과정을 통해서 이미지의 문자 변환율에 향상을 기하고자 한다.

  • PDF

영양 성분 인식을 위한 FOTS 기반 OCR 구현 (FOTS based OCR Implementation for Nutritional Component Recognition)

  • 이나현;신재영;이수민;정유철
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제63차 동계학술대회논문집 29권1호
    • /
    • pp.21-22
    • /
    • 2021
  • 사람들이 체중을 조절하고 건강을 관리하기 위한 방법 중 하루 영양소 섭취량을 조절이 있다. 현대 사회에선 가공식품의 섭취량이 증가함에 따라 자연스레 가공식품들의 영양소를 파악하고 기록하는 것도 중요한 문제가 되었다. 본 논문에서는 실제 가공 식품의 포장지에 인쇄되어있는 영양성분 표 이미지를 인식할 수 있는 OCR을 FOTS 기반으로 구현 및 실험을 진행하였다. 실제로 시중에서 파는 영양성분 표는 한글과 영어가 섞여 있기 때문에 한글을 인식하는 모델과 영어와 숫자를 인식하는 모델을 따로 학습한 뒤 생성하여 각 언어에 대한 인식률을 향상시켰다.

  • PDF

문자 인식에 의해 구축된 한글 문서 데이터베이스에 대한 정보 검색 (Retrieving Information from Korean OCR Text Database)

  • 이준호;이충식;한선화;김진형
    • 한국정보처리학회논문지
    • /
    • 제6권4호
    • /
    • pp.833-841
    • /
    • 1999
  • 문자 인식에 의해 구축된 문서들은 키보드 입력에 의해 구축된 문서들에 비하여 다수의 오류를 포함한다. 따라서 이러한 문서들로부터 원하는 정보를 검색하기 위해서는 다수의 오류를 포함하고 있는 문서들에 대한 효과적인 자동 색인 방법이 요구된다. 본 연구에서는 개별 문자 인식률 90% 수준의 문자 인식기에 의해 구축된 한글 문서 데이터베이스로부터 원하는 정보를 효과적으로 검색하기 위한 자동 색인 방법에 대하여 살펴본다. 실험 결과는 문자 인식에 의해 구축된 한글 문서 데이터베이스에 대해서는 형태소 단위 색인법과 2-gram 기반 색인법이 유사한 수준의 검색 효과를 제공함을 보여준다.

  • PDF

Online to Offline 상점을 위한 한글 메뉴판 인식 : 어텐션 메커니즘을 적용한 VGG-ResNet 융합 모델 (Recognition of Korean Menu for Online to Offline Stores : VGG-ResNet Fusion Model with Attention Mechanism)

  • 시종욱;이상진;김성영
    • 한국정보전자통신기술학회논문지
    • /
    • 제17권4호
    • /
    • pp.190-197
    • /
    • 2024
  • O2O 상점 모델은 온/오프라인의 경계를 허물어 고객에게 큰 편의성을 제공하는 플랫폼이다. 이러한 플랫폼을 효과적으로 운영하기 위해서는 소상공인들이 필요한 정보를 디지털 형태로 제공해야 한다. 특히, 한글 메뉴판을 디지털화하는 과정이 수동으로 진행될 경우 여러 문제점을 일으킬 수 있으며, OCR 기술 사용 시 한글의 인식 정확도가 낮아 오류 인식의 가능성이 높다. 이에 본 논문에서는 한글 메뉴판의 자동 인식을 위해 대표적인 OCR 모델인 EasyOCR을 기반으로 하되, 한글 문자 인식의 낮은 정확도를 개선하고자 한다. 제안하는 모델은 VGG와 ResNet의 구조적 장점을 통합하고, 어텐션 메커니즘을 도입하여 한글 문자의 인식 성능을 크게 향상시키도록 설계한다. 실험 결과, 제안하는 모델은 EasyOCR에 비해 Accuracy 기준 약 3.5%, Confidence Score와 Normalized Edit Distance 기준 약 1%의 인식 정확도 향상을 보였다. 따라서, 제안한 방법이 기존 문제를 효과적으로 해결할 수 있음을 입증한다.

Detection and Recognition of Vehicle License Plates using Deep Learning in Video Surveillance

  • Farooq, Muhammad Umer;Ahmed, Saad;Latif, Mustafa;Jawaid, Danish;Khan, Muhammad Zofeen;Khan, Yahya
    • International Journal of Computer Science & Network Security
    • /
    • 제22권11호
    • /
    • pp.121-126
    • /
    • 2022
  • The number of vehicles has increased exponentially over the past 20 years due to technological advancements. It is becoming almost impossible to manually control and manage the traffic in a city like Karachi. Without license plate recognition, traffic management is impossible. The Framework for License Plate Detection & Recognition to overcome these issues is proposed. License Plate Detection & Recognition is primarily performed in two steps. The first step is to accurately detect the license plate in the given image, and the second step is to successfully read and recognize each character of that license plate. Some of the most common algorithms used in the past are based on colour, texture, edge-detection and template matching. Nowadays, many researchers are proposing methods based on deep learning. This research proposes a framework for License Plate Detection & Recognition using a custom YOLOv5 Object Detector, image segmentation techniques, and Tesseract's optical character recognition OCR. The accuracy of this framework is 0.89.

테라헤르츠 신호를 이용한 영상의 글자 추출을 위한 화질 개선처리에 대한 연구 (A Study of Image Enhancement Processing for Letter Extraction of Image Using Terahertz Signal)

  • 김성윤;최현근;박인호;김영섭;이용환
    • 반도체디스플레이기술학회지
    • /
    • 제16권3호
    • /
    • pp.111-115
    • /
    • 2017
  • Terahertz waves are superior to conventional X-ray or Magnetic Resonance Tomography(MRI), and the amount of information that can be transmitted is as large as thousands of times that conventional X-ray or MRI. In addition, Terahertz waves have great performance in analyzing an object which have some layered structure. By using this advantage, we can extract the letters of a page by analyzing information such as absorption amount and reflection amount by irradiating a closed book with pulses of various frequencies within gap of a terahertz wave. However, in the image of each page using the Terahertz wave might be obtained various kinds of noise and the different character occlusion region. So, to extract letters from the terahertz image, we must take the noise and occlusion region away. We have been working to enhancement the image quality in various ways, and keep on studying de-noising processing for enhancement about the image quality and high resolution. Finally, we also keep on studying about OCR(Optical Character Recognition) technology, which based on pattern matching technique, to read letters.

  • PDF

특허와 논문정보를 활용한 OCR 기술발전 동향예측에 관한 연구 (A Study on the Prediction for the OCR Technology Development Trajectory based on the Patent and Article Information)

  • 김원준;이상곤;표성국
    • 한국IT서비스학회지
    • /
    • 제21권6호
    • /
    • pp.39-51
    • /
    • 2022
  • As the 4th Industrial Revolution emerged as a key to improving national competitiveness, OCR technology, one of the major technologies in the 4th industry is in the spotlight. Since characters in various images contain a lot of information, OCR technology for recognizing these characters has evolved into technology used in many industries. In this paper, trends in OCR technology were identified and predicted using thesis data published in 'RISS' and patent data by International patent classification (IPC) under the theme of Optical character recognition (OCR). For patent data 20,000 patents related to OCR technology from 2002 to 2020 were used as data, and 432 papers from 2012 to 2022 were used as data. Through time-series analysis, each patent data and thesis data were investigated since when OCR technology has developed, and various keyword analysis predicted which technology will be used in the future. Finally, the direction of future OCR technology development was presented through network association analysis with patent data and thesis data.