• 제목/요약/키워드: WeOCR

검색결과 165건 처리시간 0.023초

확장된 평균 엔트로피에 기반한 명도 영상 필기 데이터의 품질 자동 평가 (Automatic Quality Measurement of Gray-scale Handwriting Based on Extended Average Entropy)

  • 박정선
    • 인지과학
    • /
    • 제10권3호
    • /
    • pp.77-83
    • /
    • 1999
  • 1990년대 OCR에 대한 관심이 고조되면서, 다양한 필기 데이터베이스가 전 세계적으로 구축되었다. 그러나, 현재 연구분야에서 직면한 문제는 필기 품질을 포함하여 각기 다양한 방법으로 구축된 데이터베이스 내에서 필기 문자의 품질을 평가하는 것이다. 본 논문은 다양한 필기 데이터베이스를 비교하고, 문자 인식기의 성능을 객관적으로 평가하는데 사용할 수 있는 필기 품질을 측정하는 방법을 제안한다. 여기서 사용된 핵심 아이디어는 각각의 문자 샘플을 필기 품질에 따라 여러 개의 그룹으로 나누는 것이다. 제안된 방법의 성능을 평가하기 위하여, 대용량 필기 한글 데이터베이스인 KU-1 데이터베이스에 대한 실험을 수행한 결과, 제안된 방법이 필기 데이터베이스를 비교하고, 인식기의 성능을 객관적으로 평가하는데 유용하게 사용할 수 있는 가능성을 확인하였다.

  • PDF

복원된 영상에 표기된 시간 정보에 의한 프레임 재정렬 기법 (Frame Rearrangement Method by Time Information Remarked on Recovered Image)

  • 김용진;이정환;변준석;박남인
    • 한국멀티미디어학회논문지
    • /
    • 제24권12호
    • /
    • pp.1641-1652
    • /
    • 2021
  • To analyze the crime scene, the role of digital evidence such as CCTV and black box is very important. Such digital evidence is often damaged due to device defects or intentional deletion. In this case, the deleted video can be restored by well-known techniques like the frame-based recovery method. Especially, the data such as the video can be generally fragmented and saved in the case of the memory used almost fully. If the fragmented video were recovered in units of images, the sequence of the recovered images may not be continuous. In this paper, we proposed a new video restoration method to match the sequence of recovered images. First, the images are recovered through a frame-based recovery technique. Then, after analyzing the time information marked on the images, the time information was extracted and recognized via optical character recognition (OCR). Finally, the recovered images are rearranged based on the time information obtained by OCR. For performance evaluation, we evaluate the recovery rate of our proposed video restoration method. As a result, it was shown that the recovery rate for the fragmented video was recovered from a minimum of about 47% to a maximum of 98%.

음각 정보를 이용한 딥러닝 기반의 알약 식별 알고리즘 연구 (Pill Identification Algorithm Based on Deep Learning Using Imprinted Text Feature)

  • 이선민;김영재;김광기
    • 대한의용생체공학회:의공학회지
    • /
    • 제43권6호
    • /
    • pp.441-447
    • /
    • 2022
  • In this paper, we propose a pill identification model using engraved text feature and image feature such as shape and color, and compare it with an identification model that does not use engraved text feature to verify the possibility of improving identification performance by improving recognition rate of the engraved text. The data consisted of 100 classes and used 10 images per class. The engraved text feature was acquired through Keras OCR based on deep learning and 1D CNN, and the image feature was acquired through 2D CNN. According to the identification results, the accuracy of the text recognition model was 90%. The accuracy of the comparative model and the proposed model was 91.9% and 97.6%. The accuracy, precision, recall, and F1-score of the proposed model were better than those of the comparative model in terms of statistical significance. As a result, we confirmed that the expansion of the range of feature improved the performance of the identification model.

DTV 분산중계망 필드 테스트 결과 (Field Test Results Of A DTV Distributed Translator Network)

  • 왕수현;서영우;목하균;이재영;이용훈;김흥묵
    • 방송공학회논문지
    • /
    • 제13권4호
    • /
    • pp.463-478
    • /
    • 2008
  • 분산중계 방식은 기존 중계기를 이용하는 MFN(Multiple Frequency Network)과 OCR(On Channel Repeater)을 이용한 SFN(Single Frequency Network)에 비해 기존의 송출시설을 최대한 활용할 수 있고, 짧은 시간에 구축이 가능하여 비용이 효율적이며, 주파수 이용 효율을 높일 수 있는 방식이다. 본 필드 테스트는 이러한 분산중계 방식의 성능을 검증하고자 서울 서북부 지역을 중심으로 3세대, 5세대 그리고 6세대 수신기를 이용하여 총 30개 지점에 대하여 수신 전계강도와 노이즈마진 및 수신가능각을 측정하였고, 수신화질의 주관적 평가를 수행하였다. 필드 테스트를 수행한 결과 모든 조건의 수신기에서 수신 성능의 향상을 보였다. 각 수신기별 특성을 볼 때 3세대 수신기에 비해 5세대 수신기 및 6세대 수상기는 수신율의 향상뿐만 아니라 수신가능각도 증가되어 분산중계망의 가능성을 알 수 있었다.

A Korean CAPTCHA Study: Defeating OCRs In a New CAPTCHA Context By Using Korean Syllables

  • Yang, Tae-Cheon;Ince, Ibrahim Furkan;Salman, Yucel Datu
    • International Journal of Contents
    • /
    • 제5권3호
    • /
    • pp.50-56
    • /
    • 2009
  • Internet is being used for several activities by a great range of users. These activities include communication, e-commerce, education, and entertainment. Users are required to register regarding website in order to enroll web activities. However, registration can be done by automated hacking software. That software make false enrollments which occupy the resources of the website by reducing the performance and efficiency of servers, even stop the entire web service. It is crucial for the websites to have a system which has the capability of differing human users and computer programs in reading images of text. Completely Automated Public Turing Test to Tell Computers and Human Apart (CAPTCHA) is such a defense system against Optical Character Recognition (OCR) software. OCR can be defined as software which work for defeating CAPTCHA images and make countless number of registrations on the websites. This study proposes a new CAPTCHA context that is Korean CAPTCHA by means of the method which is splitting CAPTCHA images into several parts with random rotation values, and drawing random lines on a grid background by using Korean characters only. Lines are in the same color with the CAPTCHA text and they provide a distortion of image with grid background. Experimental results show that Korean CAPTCHA is a more secure and effective CAPTCHA type for Korean users rather than current CAPTCHA types due to the structure of Korean letters and the algorithm we are using: rotation and splitting. In this paper, the algorithm of our method is introduced in detail.

지능형 OCR 시스템을 위한 한글 필기체 생성 및 분류 모델에 관한 연구 (A Study on Hangul Handwriting Generation and Classification Mode for Intelligent OCR System)

  • 백진성;서지윤;정상중;정도운
    • 융합신호처리학회논문지
    • /
    • 제23권4호
    • /
    • pp.222-227
    • /
    • 2022
  • 본 논문에서는 다양한 산업분야에 적용 가능한 딥러닝 알고리즘 기반의 한글 필기체 생성 및 분류 모델을 구현하였다. 구현된 GAN 기반의 한글 필기체 생성 모델과 CNN 기반의 한글 필기체 분류 모델 2가지로 구성되어 있다. GAN 모델은 가짜 한글 필기체 데이터를 생성하기 위한 생성자 모델과 가짜 필기체 데이터를 판별하기 위한 판별자 모델로 구성된다. CNN 모델의 경우 'PHD08' 데이터세트를 활용하여 모델의 학습을 수행하였으며, 학습 결과 92.45% 정확도로 한글 필기체를 분류하는 것을 확인하였다. 구현된 GAN 모델을 통해 생성된 한글 필기체 데이터를 기존 CNN 모델의 학습 데이터세트와 통합하여 분류 모델의 성능평가를 진행한 결과 96.86%로 기존 분류 성능보다 우수하게 나타남을 확인하였다.

A Design and Implementation of Generative AI-based Advertising Image Production Service Application

  • Chang Hee Ok;Hyun Sung Lee;Min Soo Jeong;Yu Jin Jeong;Ji An Choi;Young-Bok Cho;Won Joo Lee
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권5호
    • /
    • pp.31-38
    • /
    • 2024
  • 본 논문에서는 생성형 AI 기반의 광고 이미지 자동 제작 서비스를 제공하는 ASAP(AI-driven Service for Advertisement Production) 애플리케이션을 제안한다. 이 애플리케이션은 GPT-3.5 Turbo Instruct를 이용하여 사용자가 입력한 키워드에 적합한 배경 분위기와 홍보 문구를 생성한다. 이를 입력으로 하여 배경 이미지와 텍스트 이미지를 생성하기 위해 OpenAI사의 DALL·E 3 모델과 Stability AI사의 SDXL 모델을 활용한다. 추가적으로 OCR 기술을 활용하여 텍스트 이미지의 정확도를 높이고, 생성된 출력물들을 모두 합성하여 최종적인 광고를 제작한다. 또한 PILLOW, OpenCV 라이브러리의 텍스트 박스를 이용하여 전화번호, 영업시간 등 세부 사항을 홍보물의 가장자리에 삽입할 수 있도록 구현한다. 본 애플리케이션은 광고 제작에 어려움이 많은 소상공인들에게 광고를 쉽고 편리하게 제작할 수 있고, 광고 제작 비용을 절감할 수 있는 효과를 제공한다.

퍼지 멤버쉽 함수로 최적화된 LVQ를 이용한 패턴 분류 모델 (Pattern Classification Model using LVQ Optimized by Fuzzy Membership Function)

  • 김도현;강민경;차의영
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권8호
    • /
    • pp.573-583
    • /
    • 2002
  • 패턴인식은 전처리 과정에서 패턴들의 특징을 추출하고 이를 학습을 통하여 유사한 패턴들끼리 클러스터링을 한 다음 식별 과정을 거쳐 인식하게 된다. 본 연구에서는 OCR 시스템에서의 패턴 인식을 위한 패턴 분류 모델로서 퍼지 멤버쉽 함수를 도입하여 LVQ 학습 알고리즘을 최적화한 F-LVQ(Fuzzy Learning Vector Quantization)를 제안한다 본 논문의 효율성을 검증하기 위하여 한글 및 영어 22종의 글꼴에 대한 숫자 데이타 220개 패턴을 학습한 후 이를 다양한 형태로 변형시킨 4840개의 테스트 패턴에 대하여, 기존의 여러 가지 패턴 분류 모델과의 비교 분석을 통해 그 유효성과 강인성을 증명하였다.

CGO 담지 귀금속 촉매를 이용한 DME 자열개질 특성 연구 (Experiment of DME autothermal reforming with CGO-based catalysts)

  • 최승현;배중면
    • 한국신재생에너지학회:학술대회논문집
    • /
    • 한국신재생에너지학회 2011년도 춘계학술대회 초록집
    • /
    • pp.158.2-158.2
    • /
    • 2011
  • DME is acronym of dimethyl ether, which is spotlighted as an ideal fuel to produce hydrogen due to its high hydrogen/carbon ratio, high energy density and easiness to carry. In this research, we calculated thermodynamic hydrogen (or syngas) yield from DME autothermal reforming and compared to other fuels. The reforming efficiency was about 80% above $700^{\circ}C$. Lower OCR has higher reforming efficiency but, it requires additional heat supply since the reactions are endothermic. SCR has no significant effect on the reforming efficiency. The optimized condition is $700^{\circ}C$, SCR 1.5, OCR 0.45 without additional heat supply. Comparing to other commercial gaseous fuels (methane and propane), DME has higher selectivity of $H_2O$ and $CO_2$ than the others due to the oxygen atom in the molecule. To apply DME autothermal reforming to real system, a proper catalyst is required. Therefore, it is performed the experiment comparing various novel metal catalysts based on CGO. Experiments were performed at calculated condition. The composition of product was measured and reforming efficiency was calculated. The catalysts have similar efficiency at high temperature(${\sim}800^{\circ}C$) but, CGO-Ru has the highest efficiency at low temperature ($600^{\circ}C$).

  • PDF

Design for Automation System for Pharmaceutical Prescription Using Arduino and Optical Character Recognition

  • Lim, Myung-Jae;Jung, Dong-Kun;Kim, Kyu-Dong;Kwon, Young-Man
    • International journal of advanced smart convergence
    • /
    • 제10권3호
    • /
    • pp.66-71
    • /
    • 2021
  • Recent healthcare environments have characteristics of expanding the scope of healthcare-impacting healthcare, complexity resulting from diversification of components, and accelerating the pace of change. Drugs are used for the prevention, mitigation, and treatment of diseases, so they can inevitably cause harm, while they have efficacy and effectiveness, which are key elements of health recovery. Therefore, many countries regulate permits for safe and effective medicines, and also designate essential drugs directly related to life as pay targets and guarantee health insurance. Especially Pharmacist relying on manpower for composition medicine is liable for mal-manufacture due to combination of toxic medical substances or other chemical usage. In this paper, we focus on using Kiosk and Optical Character Recognition (OCR) for automated pharmacy to level up medical service and create labor friendly environment for pharmacist themselves through maintenance of prescription data and automated manufacturing solution. Presentation of drug substances and precautions will lead to efficient drug prescription and prevent misuse of information while auto manufacturing system efficiently maintain labor force and raise patient satisfaction level by reduction of waiting time.