• Title/Summary/Keyword: OCR Technology

Search Result 130, Processing Time 0.025 seconds

FOTS based OCR Implementation for Nutritional Component Recognition (영양 성분 인식을 위한 FOTS 기반 OCR 구현)

  • Lee, Na-hyeon;Shin, Jae-young;Lee, Su-min;Jung, Yu-chul
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2021.01a
    • /
    • pp.21-22
    • /
    • 2021
  • 사람들이 체중을 조절하고 건강을 관리하기 위한 방법 중 하루 영양소 섭취량을 조절이 있다. 현대 사회에선 가공식품의 섭취량이 증가함에 따라 자연스레 가공식품들의 영양소를 파악하고 기록하는 것도 중요한 문제가 되었다. 본 논문에서는 실제 가공 식품의 포장지에 인쇄되어있는 영양성분 표 이미지를 인식할 수 있는 OCR을 FOTS 기반으로 구현 및 실험을 진행하였다. 실제로 시중에서 파는 영양성분 표는 한글과 영어가 섞여 있기 때문에 한글을 인식하는 모델과 영어와 숫자를 인식하는 모델을 따로 학습한 뒤 생성하여 각 언어에 대한 인식률을 향상시켰다.

  • PDF

Study on OCR Enhancement of Homomorphic Filtering with Adaptive Gamma Value

  • Heeyeon Jo;Jeongwoo Lee;Hongrae Lee
    • Journal of the Korea Society of Computer and Information
    • /
    • v.29 no.2
    • /
    • pp.101-108
    • /
    • 2024
  • AI-OCR (Artificial Intelligence Optical Character Recognition) combines OCR technology with Artificial Intelligence to overcome limitations that required human intervention. To enhance the performance of AI-OCR, training on diverse data sets is essential. However, the recognition rate declines when image colors have similar brightness levels. To solve this issue, this study employs Homomorphic filtering as a preprocessing step to clearly differentiate color levels, thereby increasing text recognition rates. While Homomorphic filtering is ideal for text extraction because of its ability to adjust the high and low frequency components of an image separately using a gamma value, it has the downside of requiring manual adjustments to the gamma value. This research proposes a range for gamma threshold values based on tests involving image contrast, brightness, and entropy. Experimental results using the proposed range of gamma values in Homomorphic filtering suggest a high likelihood for effective AI-OCR performance.

A Novel Digital Over Current Relay with Variable Time-Current Characteristics for Protective Coordination

  • Park, M. S.;P. S. Cho;Lee, S. J.;S. H. Hyun;Kim, K. H.
    • KIEE International Transactions on Power Engineering
    • /
    • v.2A no.3
    • /
    • pp.83-88
    • /
    • 2002
  • An over current relay(OCR), one of the most frequently used protective devices, has time-current characteristics (TCC) to control its trip time according to the current level. It is because an appropriate operating time interval is necessary for coordination with other protective devices. A set of TCC curves of an OCR is, in general, given by the supplier from which a curve is selected by the operator. Therefore, in many cases, it is impossible to consider the operation condition of the given power system exactly. A novel concept of an OCR is suggested in this paper. The proposed OCR has an internal correction module so that it may produce the most adequate TCC curve according to the given protective information for coordination with other devices. With the generated TCC curve, a variety of operation and coordination conditions can be taken into consideration in an effective manner. The suggested OCR is applied to a simple test power system to show very promising results from a coordination point of view.

Evaluation of OCR in Fine Grained Soil by Piezocone Tests (피에조콘 관입 시험에 의한 OCR 평가)

  • Lim, Beyong-Seock
    • Proceedings of the Korean Geotechical Society Conference
    • /
    • 2000.11a
    • /
    • pp.561-568
    • /
    • 2000
  • 본 연구의 목적은 Piezocone 관입시험을 이용한 연약지반의 OCR 평가에 있어 기존의 여러 가지 해석방법들과 최근에 새롭게 제안된 방법들을 실내 모형토조에서 실측된 피에조콘 관입 실험치에 적용하여 각 해석방법들의 차이와 장단점들을 비교 분석하는데 있다. 본 연구의 연구실험방법으로는, Piezocone 관입을 위한 연약 모형지반 조성을 위하여 초대형 Slurry Consolidometer에 Free Stress 상태의 Slurry를 45일간 압밀시킨후 Automatic Computer Control Calibration Chamber (LSU/CALCHAS; Louisiana Slate University Calibration Chamber System)에 옮긴후 다시한번 압밀시키는 Two-Stage Consolidation Method를 사용하였다. 모형지반은 여러 가지 Boundary Condition들과 Stress Condition 그리고 Stress History등을 달리하여 총 5개의 지반을 조성하였다. 관입시험은 총 25개의 Piezocone 관입이 수행되어졌고, 그중 4개는 Standard 10 cm2 Piezocone이고, 나머지 21개는 Miniature Piezocone이 사용되었다. Piezocone 실험치들에 대한 여러 가지 OCR 해석방법 적용결과, Schmertmann방법은 5개 모형지반 모두에서 과다한 OCR평가를 보였으며, $B_{q}$ 방법은 일부모형지반에서 음의 OCR값으로 계산되어졌다. 그러나, Critical-Stale Soil Mechanics 와 Cavity Expansion 이론에 근거하여 Mayne(1991), Kurup(1993), Tumay et al (1995) 들이 제안한 OCR 평가방법들은 실험치와 잘맞는 경향을 보여주었다. 이와같은 이론 모델값들의 차이는 응력조건(Stress Condition)과 경계조건(Boundary Condition)들에 대한 각 해석방법들의 고려정도에 따른 결과로 판단된다.

  • PDF

Consumption management application using OCR technology (OCR 기술을 활용한 소비 관리 어플)

  • Jeong, seo-yea;Kim, Seo-hee;Park, eun-byeol;An, cha-rin;Jeong, cha-rim;Kim, ByungWan;Lee, ByongKwon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2021.07a
    • /
    • pp.203-204
    • /
    • 2021
  • 본 논문에서는 OCR기술을 이용하여 나만의 소비패턴을 분석하는 어플을 제안한다. 현재 카드와 간편결제를 많이 쓰는 시대, 사람들은 소비 패턴을 쉽게 분석하고 알 수 없기 때문에 절약과 저축도 쉽게 못하고 있다. 따라서 OCR을 활용한 영수증 인식으로 소비 패턴을 분석하고 나의 소비 생활을 쉽게 알 수 있는 서비스를 통해 소비 문제가 개선될 것이라고 생각한다. 가계부의 핵심 기능은 수입/지출을 표기하는 것이다. 하지만 현재 상용 중인 소비 앱은 너무 많은 기능을 도입해 오히려 사용성이 떨어진다. 이를 해결하기 위해 복잡한 서비스는 빼고, 핵심 기능과 OCR 기능, 예산 관리, 포인트 제도, 카테고리별 지출 관리를 넣었다. 프로젝트의 대상은 평소 과도한 지출을 하는 사람과 자신의 소비를 기록하고 싶은 사람이며, 본 시스템에서 OCR을 이용해 소비시 발생하는 영수증을 인식하여 더욱 편리하게 입력할 수 있다. 또한, 비 계획적인 소비를 효율적으로 해결할 수 있으며, 포인트 제도를 이용해 사용자의 출석률 문제를 효율적으로 해결할 것으로 기대된다.

  • PDF

Using Dynamic Programming for Word Segmentation in OCR (동적 프로그래밍을 이용한 OCR에서의 띄어쓰기 교정)

  • Park, Ho-Min;Kim, Chang-Hyun;Noh, Kyung-Mok;Cheon, Min-Ah;Kim, Jae-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2016.10a
    • /
    • pp.243-245
    • /
    • 2016
  • 광학 문자 인식(OCR)을 통해 문서의 글자를 인식할 때 띄어쓰기 오류가 발생한다. 본 논문에서는 이를 해결하기 위해 OCR의 후처리 과정으로 동적 프로그래밍을 이용한 분절(Segmentation) 방식의 띄어쓰기 오류 교정 시스템을 제안한다. 제안하는 시스템의 띄어쓰기 오류 교정 과정은 다음과 같다. 첫째, 띄어쓰기 오류가 있다고 분류된 어절 내의 공백을 모두 제거한다. 둘째, 공백이 제거된 문자열을 동적 프로그래밍을 이용한 분절로 입력 문자열에 대하여 가능한 모든 띄어쓰기 후보들을 찾는다. 셋째, 뉴스 기사 말뭉치와 그 말뭉치에 기반을 둔 띄어쓰기 확률 모델을 참조하여 각 후보의 띄어쓰기 확률을 계산한다. 마지막으로 띄어쓰기 후보들 중 확률이 가장 높은 후보를 교정 결과로 제시한다. 본 논문에서 제안하는 시스템을 이용하여 OCR의 띄어쓰기 오류를 해결할 수 있었다. 향후 띄어쓰기 오류 교정에 필요한 언어 규칙 등을 시스템에 추가한 띄어쓰기 교정시스템을 통하여 OCR의 최종적인 인식률을 향상에 대해 연구할 예정이다.

  • PDF

Development an Android based OCR Application for Hangul Food Menu (한글 음식 메뉴 인식을 위한 OCR 기반 어플리케이션 개발)

  • Lee, Gyu-Cheol;Yoo, Jisang
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.21 no.5
    • /
    • pp.951-959
    • /
    • 2017
  • In this paper, we design and implement an Android-based Hangul food menu recognition application that recognizes characters from images captured by a smart phone. Optical Character Recognition (OCR) technology is divided into preprocessing, recognition and post-processing. In the preprocessing process, the characters are extracted using Maximally Stable Extremal Regions (MSER). In recognition process, Tesseract-OCR, a free OCR engine, is used to recognize characters. In the post-processing process, the wrong result is corrected by using the dictionary DB for the food menu. In order to evaluate the performance of the proposed method, experiments were conducted to compare the recognition performance using the actual menu plate as the DB. The recognition rate measurement experiment with OCR Instantly Free, Text Scanner and Text Fairy, which is a character recognizing application in Google Play Store, was conducted. The experimental results show that the proposed method shows an average recognition rate of 14.1% higher than other techniques.

A Hierarchical Structure on OCR "Guldori" (OCR "글돌이"의 계층구조)

  • Lee, Kyoon-Ha
    • Annual Conference on Human and Language Technology
    • /
    • 1989.10a
    • /
    • pp.272-277
    • /
    • 1989
  • 한글을 포함하는 문서의 인식을 위한 시스템의 설계, 유지, 보수 및 확장을 체계적이며 용이하도록 하기 위한 문서인식 시스템의 기능별 계층화 구조를 제안하고 실용화를 목표로 추진중인 OCR "글돌이"의 원형 시스템에의 적용 타당성을 조사하였다. 각 계층은 인접 계층과 인터페이스만으로 연결토록 하여 상호 독립적인 방식을 취하였으며 특히 문자인식등과 갈이 소프트웨어의 구조가 복잡한 계층은 하드웨어 및 firmware의 형태로 구성을 하여 임의의 워크 스테이션 또는 임의의 스캐너와 쉽게 접속되도록 하였다.

  • PDF

Development of Intelligent OCR Technology to Utilize Document Image Data (문서 이미지 데이터 활용을 위한 지능형 OCR 기술 개발)

  • Kim, Sangjun;Yu, Donghui;Hwang, Soyoung;Kim, Minho
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2022.05a
    • /
    • pp.212-215
    • /
    • 2022
  • In the era of so-called digital transformation today, the need for the construction and utilization of big data in various fields has increased. Today, a lot of data is produced and stored in a digital device and media-friendly manner, but the production and storage of data for a long time in the past has been dominated by print books. Therefore, the need for Optical Character Recognition (OCR) technology to utilize the vast amount of print books accumulated for a long time as big data was also required in line with the need for big data. In this study, a system for digitizing the structure and content of a document object inside a scanned book image is proposed. The proposal system largely consists of the following three steps. 1) Recognition of area information by document objects (table, equation, picture, text body) in scanned book image. 2) OCR processing for each area of the text body-table-formula module according to recognized document object areas. 3) The processed document informations gather up and returned to the JSON format. The model proposed in this study uses an open-source project that additional learning and improvement. Intelligent OCR proposed as a system in this study showed commercial OCR software-level performance in processing four types of document objects(table, equation, image, text body).

  • PDF

FEA & Topology Optimization of Single-Phase Induction Motor for Rotary Compressor (로터리 컴프레서용 단상 유도모터의 유한요소해석 및 위상 최적설계)

  • Wang, Se-Myung;Kang, Je-Nam
    • The Transactions of the Korean Institute of Electrical Engineers B
    • /
    • v.51 no.7
    • /
    • pp.351-356
    • /
    • 2002
  • The oil circulation rate (OCR) of the rotary compressor is a crucial factor affecting the performance and reliability of air-conditioning systems. In this paper, topology optimization of the single-phase induction motor of rotary compressor is carried out for reducing the OCR. The nonlinear transient characteristic of single-phase induction motor for rotary compressor is analyzed by using FLUX2D. The topology optimization for electromagnetic systems is developed using the finite element method (FEM). The topology optimization is applied to a single-phase induction motor for reducing the OCR. For validation, optimize induction motors are manufactured and tested.