• 제목/요약/키워드: 광학문자 인식

검색결과 82건 처리시간 0.025초

문자 및 색 인식을 혼용한 검사시스템의 구현 (Implementation of Vision System combining Character and Color Recognition)

  • 양우석
    • 한국인터넷방송통신학회논문지
    • /
    • 제16권1호
    • /
    • pp.221-225
    • /
    • 2016
  • 본 논문은 자동차용 퓨즈 및 릴레이 박스의 취부상태를 검사하기 위한 비전시스템의 구현 예를 보여준다. 검사를 위한 vision system은 영상 취득부와 검사 알고리즘, 그리고 사용자 인터페이스의 세 부분으로 구성된다. 영상 취득부는 box의 영상을 grabbing하는 부분으로 조명부와 광학부로 이루어진다. 검사 알고리즘은 영상을 이용하여 검사작업을 수행하는 부분이다. 사용자 인터페이스는 fuse & relay box의 모양과 부착되는 fuse와 relay를 등록하기 위한 사용자 인터페이스와 검사 작업을 수행하기 위한 사용자 인터페이스 두 부분으로 이루어진다. 본 연구에서 제시하는 검사 알고리즘은 신뢰도가 높아 실제 생산 현장에 사용이 가능하다.

노년층을 위한 의약품 식별 애플리케이션 (Drug identification application for aged group)

  • 조현준;서혜민;정환훈;임혁;주종화
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.673-675
    • /
    • 2022
  • 우리 사회에서 개인이 복용하고 있는 약물의 종류와 수가 점점 늘어나고 있다. 약물의 사용이 증가하면서 때로는 치명적일 수 있는 약물 오남용 또한 빈번히 발생하고 있으며 특히 노년층과 같이 약품을 정확하게 구별할 수 없는 사람들은 더욱더 그 위험에 노출되어있다. 본 논문에서는 사용자가 간단한 사진을 찍는 행위를 거치면 약물의 정보를 제공하고, 복용법을 알 수 있는 모바일 애플리케이션에 관하여 기술한다. 이를 구현하기 위하여 세밀한 시각적 분류 (Fine-Grained Visual Categorization, FGVC) 기법과 광학 문자 인식 (Optical Character Recognition, OCR) 기법을 결합한 인공지능 모델을 사용하였으며, React Native 를 사용하여 운영체제에 종속되지 않도록 애플리케이션을 제안한다. 이 애플리케이션은 노년층에 친화된 UI/UX 로 디자인되었으며, 약물의 정보 제공 이외에도 개인 약물 관리, 주변 약국 길 찾기 등의 편의 기능을 통해 노년층에 삶의 질 향상을 기대할 수 있을 것이다.

광학 문자 인식(OCR)을 활용한 저시력자 및 시각장애인 등 사회적 약자를 위한 비건 판독 시스템 개발 (Development of a Vegan Decipher System for the Social Vulnerable, such as the Low Vision Person and the Visually Impaired Person Using Optical Character Recognition (OCR))

  • 오혜림;공예나;김정민;최재준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.990-991
    • /
    • 2023
  • 커져만 가는 비건 시장에 비해서 비건 제품의 가격은 높고, 한정되어 있다. 성분표만을 보고 비건 여부를 파악하기에는 어렵고, 저시력자 및 시각장애인에게는 더욱 어려운 일이다. 치주 질환이나 당뇨를 포함한 크고 작은 다양한 질병으로 인해 육식 섭취 대신 불가피하게 채식을 실천해야 하는 경우 또는 가격 부담이 크고 찾기 어렵다. 그래서 비건 인증을 받은 제품 대신 일반 제품들 사이에서 비건에 적합한 제품을 찾는 데 도움이 되는 시스템을 개발하고자 한다. 본 논문에서는 저시력자 및 시각장애인을 위한 큰 글씨 화면, 음성 입출력 시스템 제공과 성분표 촬영을 통해 비건 적합 여부 및 알레르기 정보 제공, 사용자 특성 분석을 통한 UI 구성의 서비스를 제공한다. 성분표 촬영에 어려움을 겪는 저시력자 및 시각장애인에게 편리를 제공하기 위해 소프트웨어 뿐만 아니라 하드웨어를 구성한다.

UAV 기반 외래거북 탐지를 위한 광학문자 인식(OCR)의 가능성 평가 (Feasibility of Optical Character Recognition (OCR) for Non-native Turtle Detection)

  • 임태양;김지윤;김휘문;강완모;송원경
    • 한국환경복원기술학회지
    • /
    • 제25권5호
    • /
    • pp.29-41
    • /
    • 2022
  • Alien species cause problems in various ecosystems, reduce biodiversity, and destroy ecosystems. Due to these problems, the problem of a management plan is increasing, and it is difficult to accurately identify each individual and calculate the number of individuals, especially when researching alien turtle species such as GPS and PIT based on capture. this study intends to conduct an individual recognition study using a UAV. Recently, UAVs can take various sensor-based photos and easily obtain high-definition image data at low altitudes. Therefore, based on previous studies, this study investigated five variables to be considered in UAV flights and produced a test paper using them. OCR was used to monitor the displayed turtles using the manufactured test paper, and this confirmed the recognition rate. As a result, the use of yellow numbers showed the highest recognition rate. In addition, the minimum threat distance was confirmed to be 3 to 6m, and turtles with a shell size of 6 to 8cm were also identified during the flight. Therefore, we tried to propose an object recognition methodology for turtle display text using OCR, and it is expected to be used as a new turtle monitoring technique.

문서 이미지 데이터 활용을 위한 지능형 OCR 기술 개발 (Development of Intelligent OCR Technology to Utilize Document Image Data)

  • 김상준;유동희;황소영;김민호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.212-215
    • /
    • 2022
  • 오늘날 소위 디지털 전환시대를 맞아, 많은 부분에서 빅데이터의 구축과 활용에 대한 필요성이 높아졌다. 오늘날에 많은 데이터가 디지털기기, 미디어 친화적으로 생산 및 보관되는 것과 달리, 과거 오랜 기간 데이터의 생산 및 보관은 활자 인쇄도서가 주를 이루었다. 따라서 오랜 기간 축적되어온 방대한 활자 인쇄도서를 빅데이터로써 활용하기 위한 광학 문자 판독(OCR: Optical Character Recognition) 기술의 필요성 역시 빅데이터의 필요성에 맞추어 함께 요구되었다. 본 연구에서는 도서 스캔 이미지의 정보를 각 문서 객체별로 세분화하여 그 구조와 내용을 디지털화하는 시스템을 제안한다. 제안 시스템은 크게 1) 문서객체(표, 수식, 그림, 본문)의 영역정보를 인식. 2)인식된 객체의 영역정보를 각각 표 처리, 수식 처리, 텍스트 처리 모듈로 OCR. 3) OCR로 처리된 문서 정보를 JSON형식으로 종합하여 반환하는 세 단계로 구성된다. 본 연구에서 제안하는 모델은 이러한 단계를 수행함에 있어 오픈소스로 공개된 프로젝트를 활용하되, 본 시스템의 목표에 맞추어 추가적인 학습과 개량을 거쳤다. 본 연구에서 제안한 지능형 OCR 시스템은 문서 이미지 내 4종(표, 수식, 이미지, 텍스트)의 객체인식과 처리에 있어 상용 소프트웨어 수준의 성능을 확인할 수 있었다.

  • PDF

OCR 프로그램을 활용한 선박 항해일지 데이터 추출 모델 개발 (Development of a Ship's Logbook Data Extraction Model Using OCR Program)

  • 이다인;김성철;윤익현
    • 해양환경안전학회지
    • /
    • 제30권1호
    • /
    • pp.97-107
    • /
    • 2024
  • 빠르게 발전하는 이미지 인식 기술에도 불구하고 표 형식의 문서와 수기로 작성된 문서를 완벽하게 디지털화하기에는 아직 어려움이 따른다. 본 연구는 표 형식의 수기 문서인 선박 항해일지를 작성하는 데에 사용되는 규칙을 이용하여 보정 작업을 수행함으로써 OCR 결과물의 정확도를 향상시키고자 한다. 이를 통해 OCR 프로그램을 통하여 추출된 항해일지 데이터의 정확성과 신뢰성을 높일 것으로 기대된다. 본 연구는 목포해양대학교 실습선 새누리호의 2023년에 항해한 57일간의 항해일지 데이터를 대상으로 OCR 프로그램 인식 후 발생한 오류를 보정하여 그 정확도를 개선하고자 하였다. 이 모델은 항해일지 기재 시 고려되는 몇 가지 규칙을 활용하여 오류를 식별한 후, 식별된 오류를 보정하는 방식으로 구성하였다. 모델을 활용하여 오류를 보정 후, 그 효과를 평가하고자 보정 전과 후의 데이터를 항차별로 구분한 후, 같은 항차의 같은 변수끼리 비교하였다. 본 모델을 활용하여 실제 셀 오류율은 약 11.8% 중 약 10.6%의 오류를 식별하였고, 123개의 오류 중 56개를 개선하였다. 본 연구는 항해일지 중 항해정보를 기입하는 Dist.Run부터 Stand Course까지의 정보만을 대상으로 수행하였다는 한계점이 있으므로, 추후 항해정보 뿐만 아니라 기상정보 등 항해일지의 더 많은 정보를 보정하기 위한 연구를 진행할 예정이다.

사용자 편의성과 효율성을 증진하기 위한 신뢰도 높은 이미지-텍스트 융합 CAPTCHA (Reliable Image-Text Fusion CAPTCHA to Improve User-Friendliness and Efficiency)

  • 문광호;김유성
    • 정보처리학회논문지C
    • /
    • 제17C권1호
    • /
    • pp.27-36
    • /
    • 2010
  • 웹 서비스 신청 단계에서 신청자가 실제 인간 사용자임을 확인하기 위해 사용되는 텍스트 기반 캡차(text-based CAPTCHA)의 변형된 문자를 광학문자인식 기술로 파악하는 것이 가능하기에 캡차의 신뢰성이 떨어지는 문제가 발생하고 있다. 이 문제를 해결하기 위해 제안되었던 기존의 이미지 기반 캡차(image-based CAPTCHA)에서도 여러 문제점이 존재한다. 인공지능 프로그램을 사용하여 시스템이 보유하고 있는 제한된 수의 이미지 내용을 파악함으로써 신뢰도가 떨어지는 문제가 발생할 수 있으며, 제공된 이미지에 대해 사용자가 다른 유사한 단어를 입력하는 경우에는 오답으로 판정되어 반복적으로 캡차를 시도해야 하는 불편함이 발생 할 수 있으며 또한, 사용자에게 캡차 문제를 제공하기 위해 여러 이미지 파일을 전송해야 하기에 전송 비용의 비효율성 문제가 존재한다. 이러한 기존 이미지 기반 캡차의 문제점들을 해결하기 위해 본 논문에서는 이미지와 관련 키워드 일부를 융합하여 제공하는 이미지-텍스트 융합 캡차를 제안하였다. 본 논문에서 제안한 이미지-텍스트 융합 캡차에서는 이미지와 관련된 단어의 일부분을 힌트로 활용하여 쉽게 정답을 입력할 수 있도록 사용자 편리성을 제공하며 이미지와 텍스트를 한 이미지 파일 내에 융합시켰기 때문에 전송 비용을 절약하여 효율성을 증진할 수 있다. 또한, 캡차 시스템의 신뢰성 증진을 위해 인터넷 검색으로 캡차용 이미지를 대량으로 수집하도록 하였으며 수집되는 캡차 이미지의 정확성을 유지하기 위해 필터링 과정을 거치도록 하였다. 또한, 본 논문에서는 실제 실험을 통해 제안된 이미지-텍스트 융합 캡차가 기존 이미지 기반 캡차보다 사용자에게 편리하고 신뢰성이 증진될 수 있음을 입증하였다.

인슈어테크(InsurTech)산업에서의 인공지능(AI)을 활용한 보험서비스 마케팅사례 연구 (Case Studies for Insurance Service Marketing Using Artificial Intelligence(AI) in the InsurTech Industry.)

  • 조재욱
    • 디지털융복합연구
    • /
    • 제18권10호
    • /
    • pp.175-180
    • /
    • 2020
  • 최근 활성화 되고 있는 인슈어테크(InsurTech) 산업에서의 인공지능(AI)을 활용한 보험서비스 마케팅 사례연구를 통해, 보험산업 생태계에서 혁신적인 기술(예: 인공지능, 기계학습 등)이 어떻게 활용되고 있는지 살펴보았다. 특히, 국내·외 서비스 사례연구를 통해 인공지능기술을 활용하여 파괴적 혁신을 가져온 미국의 레모네이드(Lemonade)사의 챗봇을 이용한 신속하고, 간편한 보험가입 및 보험금 지급 서비스, 국내 AI컴퍼니의 광학 문자 인식(OCR)기반의 진단서 입력을 통해 예상 보험금이 산출되는 보험금 산정서비스를 고찰해 보았다. 사례분석 결과 인공지능 기반의 수많은 고객데이터를 활용한 기계학습을 통해 보험 가입 및 지급 절차에 있어 리드타임을 획기적으로 단축하였고, 고객과 보험사간의 분쟁이 많은 보험금 산정에 있어서도 정확하고 합리적인 보험금을 산출함으로써, 고객만족과 고객가치를 높일 수 있었다.

딥러닝을 활용한 전략물자 판정 지원도구 개발에 대한 연구 (A Study on the Development of a Tool to Support Classification of Strategic Items Using Deep Learning)

  • 조재영;윤지원
    • 정보보호학회논문지
    • /
    • 제30권6호
    • /
    • pp.967-973
    • /
    • 2020
  • 전략물자관리 제도의 이행 확산에 따라 전략물자 판정의 중요성이 높아지고 있으나 전략물자 제도를 처음 접하는 수출기업은 전략물자의 개념을 이해하기 쉽지 않고, 전략물자를 통제하는 기준이 다양하여 전략물자 판정에 어려움이 따른다. 본 논문에서는 전략물자 제도를 처음 접하는 기업이나 전략물자 판정시스템 이용자에게 진입장벽을 낮추어 판정이라는 과정을 쉽게 접근할 수 있는 방법을 제안한다. 이용자가 전략물자 판정이라는 절차를 매뉴얼이나 카탈로그의 제공만으로 판정결과를 확인할 수 있게 된다면, 전략물자 판정 방법과 절차에 보다 편리하고 쉽게 다가설 수 있을 것이다. 본 연구 목적을 달성하기 위해 이미지 인식 및 분류에서 연구되고 있는 딥러닝과 OCR(광학문자판독) 기술을 활용하고, 전략물자 판정 지원도구에 대한 개발과 연구를 통하여 우리 기업의 전략물자 판정에 도움이 되는 정보를 제공한다.

기계학습 알고리즘 기반 하자 정보 관리 시스템 개발 - 공동주택 전용부분을 중심으로 - (A Developing a Machine Leaning-Based Defect Data Management System For Multi-Family Housing Unit)

  • 박다슬;차희성
    • 한국건설관리학회논문집
    • /
    • 제24권5호
    • /
    • pp.35-43
    • /
    • 2023
  • 공동주택 하자 분쟁의 증가와 함께, 하자관리의 중요성 또한 커지고 있다. 그러나 기존의 연구는 '공용 부분'에 초점을 맞추어 진행되었다. 또한 하자관리의 주체인 '관리사무소'를 위한 시스템 연구도 부족한 실정이다. 이는 관리사무소의 하자관리 능력의 부족과 관리 품질의 저하를 초래한다. 따라서, 본 논문에서는 관리사무소를 위한 기계학습 기반의 하자 정보 관리 시스템을 제안한다. OCR과 NLP 모듈을 사용하여 관리상의 불편한 점을 해소하는 것을 목표로 한다. OCR을 통해 수기로 작성된 하자 정보를 디지털 문서로 변환한다. 이후 언어모델을 이용하여 사용자가 지정한 양식과 함께 하자 정보를 재생성한다. 최종적으로 생성된 텍스트를 데이터베이스에 저장하고 이를 기반으로 통계적 분석을 실행한다. 이러한 일련의 과정을 통해, 관리사무소의 하자관리 역량을 향상할 수 있도록 돕고, 의사결정을 지원할 수 있을 것으로 기대한다.