• 제목/요약/키워드: Tesseract

검색결과 28건 처리시간 0.035초

Design of Image Generation System for DCGAN-Based Kids' Book Text

  • Cho, Jaehyeon;Moon, Nammee
    • Journal of Information Processing Systems
    • /
    • 제16권6호
    • /
    • pp.1437-1446
    • /
    • 2020
  • For the last few years, smart devices have begun to occupy an essential place in the life of children, by allowing them to access a variety of language activities and books. Various studies are being conducted on using smart devices for education. Our study extracts images and texts from kids' book with smart devices and matches the extracted images and texts to create new images that are not represented in these books. The proposed system will enable the use of smart devices as educational media for children. A deep convolutional generative adversarial network (DCGAN) is used for generating a new image. Three steps are involved in training DCGAN. Firstly, images with 11 titles and 1,164 images on ImageNet are learned. Secondly, Tesseract, an optical character recognition engine, is used to extract images and text from kids' book and classify the text using a morpheme analyzer. Thirdly, the classified word class is matched with the latent vector of the image. The learned DCGAN creates an image associated with the text.

머신러닝 기반의 대규모 이미지 파일에서 개인 정보 분류 시스템 (Machine Learning based Personal Information Classification System in Large Image Files)

  • 김기태;윤상혁;서보인;이세훈
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제62차 하계학술대회논문집 28권2호
    • /
    • pp.293-294
    • /
    • 2020
  • 본 논문에서는 현재 이슈가 되고 있는 개인 정보 보안에 대해서 Keras 라이브러리를 사용하여 개인 정보 관련 데이터를 학습한 후, 한글 인식률 증가된 Tesseract-OCR 활용하여 사람들이 가지고 있는 데이터의 개인 정보 유무를 판단하여 분류한다.

  • PDF

OCR 기반의 의약품 성분 정보 검색 시스템 (OCR-Based Medicine Ingredient Information Retrieval System)

  • 박진아;박승보
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제65차 동계학술대회논문집 30권1호
    • /
    • pp.83-84
    • /
    • 2022
  • 본 논문에서는 의약품의 효율적인 구매와 안전한 복용, 또 의약품 성분에 대한 정보 전달을 위한 시스템을 제안한다. 이 시스템에서는 약품 후면을 촬영한 영상으로부터 이미지 프로세싱을 통해 이미지에서 관심영역을 설정한 뒤, OCR 엔진인 Tesseract-OCR을 사용하여 인식한 텍스트 데이터를 통해 약품 성분을 추출하며, 식품의약품안전처에서 제공하는 의약품 안전 사용 서비스(DUR) API와 네이버 의약품 사전 검색 결과를 이용해 관련 정보들을 읽어와 출력하도록 한다. 약품의 표준 서식을 따르는 이미지를 기준으로 백 개의 이미지를 이용해 테스트하여 65%의 검출 정확도를 보였다.

  • PDF

OpenCV 를 활용한 타브 악보 인식 시스템 (Tab sheet recognition system using OpenCV)

  • 이민석;김승우;최혁규;서승현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.743-744
    • /
    • 2023
  • 타브(TAB) 악보는 주로 현악기에서 쓰이는 악보로, 일반적으로 생각하는 오선보 대신 악기의 줄 수만큼 선을 긋고 그 선 위에 프렛의 위치를 숫자 또는 문자로 표기한 형식의 악보이다. 본 논문에서는 입력된 PDF 형식의 타브 악보에서 OpenCV 를 사용하여 음표 및 악상 기호를 인식하는 시스템을 제안한다. 이 시스템은 사용자가 인식을 원하는 PDF 형식의 악보를 입력하면 PDF 파일을 PNG 파일로 변경한 뒤, 이를 OpenCV 를 활용하여 음표의 길이, 프렛의 위치 등 연주에 필요한 요소들만 객체 검출한 뒤 Tesseract 로 인식한다.

오픈소스 기반 OCR의 한국어 인식성능 비교분석에 관한 연구 (Comparative Analysis of Korean Language Recognition Performance in Open Source-Based OCR)

  • 김정섭;김현정;유상현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.471-472
    • /
    • 2023
  • 문서 전자화 시스템의 도입에 따라 OCR에 관련된 많은 연구가 진행되고 있으며, 현재 넓은 분야에서 OCR을 활용 중이다. 그러나 OCR 라이브러리들의 한국어 인식성능에 어느 정도 차이가 있는지에 대한 의문이 생기고 있다. 본 논문에서는 현재 사용 중인 OCR 라이브러리의 한국어 인식성능을 비교, 분석하였고 Tesseract OCR이 더 인식성능이 좋다는 결과를 얻었다.

M2M 기술을 이용한 스마트 선박 컨테이너 (Smart Ship Container With M2M Technology)

  • 로네쉬 샤르마;이성로
    • 한국통신학회논문지
    • /
    • 제38C권3호
    • /
    • pp.278-287
    • /
    • 2013
  • 현대 정보 기술은 새롭고 개선된 방법으로 여러 산업들에 지속적인 제공을 하고 있다. 본 논문에서 고려한 스마트 컨테이너 공급망 관리는 사물지능(M2M)통신의 급속한 발전과 함께 고성능 센서, 컴퓨터 비전, GPS, GSM을 기반으로 형성된다. 기존 공급망관리는 실시간 컨테이너 추적에 제한이 있다는 문제점을 가지고 있다. 본 논문은 인터럽트 및 보통 정기적인 알림에 대한 컨테이너 식별 시스템과 자동 알림 시스템의 개발과 실시간 컨테이너 공급망관리의 연구 및 구현에 초점을 맞추었다. 첫째, 본 논문은 컨테이너 코드 식별 및 실시간 작업에 대해 컴퓨터 비전 라이브러리와 OCR 엔진을 비주얼 스튜디오 2010으로 구현된 식별 알고리즘을 제안하고 있다. 둘째는 실시간 컨테이너 추적 및 그 시스템의 한계에 대해 제공되는 현재 자동 알림 시스템에 대해 설명한다. 마지막으로 본 논문은 고성능 센서와 컴퓨터 비전과 함께 유비쿼터스 모바일 및 위성 네트워크와 실시간 컨테이너 추적 솔루션의 미래에 도전과 가능성을 요약하였다. 뛰어난 운영 및 보안 공급망관리의 우수한 전송을 제공하기 위해 이러한 모든 구성요소를 결합하였다.

맞춤형 여행 콘텐츠 개발을 위한 OCR 기법을 활용한 영화 속 촬영지 정보 추출 방안 제시 (Study on Extracting Filming Location Information in Movies Using OCR for Developing Customized Travel Content)

  • 박은비;신유빈;강주영
    • 한국빅데이터학회지
    • /
    • 제5권1호
    • /
    • pp.29-39
    • /
    • 2020
  • 목적 사회 전반적으로 퍼진 개인의 취향에 대해 존중하는 분위기는 소비 트렌드를 바꾸었다. 그에 따라 여행 산업에서도 소비자 개인의 취향을 반영하는 맞춤형 여행이 새로운 트렌드로 주목받고 있다. 특히 여행 산업 분야 중 하나인 '영화 관광'에 대한 관심이 커지고 있음에 주목하였다. 영화를 시청하며 발생하는 개인의 여행 동기를 맞춤형 여행 제안으로 충족시키고자 하며, 이는 '영화 관광 산업'의 지속적 발전의 촉진제가 될 것으로 기대한다. 설계/방법론/접근 본 연구에서는 시청자가 실제로 방문하고 싶은 영화 속 촬영지 정보를 'OCR'을 통해 추출, 제안하는 방법론을 구현하였다. 먼저, 실시간 이미지 프로세싱 라이브러리인 'OpenCV'를 활용하여 사용자가 선택한 영화 속 장면을 추출 받는다. 또한, 딥러닝 기반의 텍스트 영역 탐지모델인 'EAST 모델'을 활용하여 해당 장면 이미지에서 문자가 위치한 곳을 탐지하여 검출한다. 검출한 이미지는 'OpenCV 내장 함수'를 사용해 전처리하여 인식의 정확도를 높인다. 마지막으로 광학 문자 인식 엔진인 'Tesseract'를 사용하여 이미지 속 문자를 인식 가능한 텍스트로 변환한 후, 'Google Map API'를 통해 실제 위치 정보를 반환한다. 의의 본 연구는 기존의 영화 관광에서 나아가, 4차 산업 기술을 활용한 개인 맞춤 관광 콘텐츠를 제공해준다는 점에서 큰 의의가 있다. 이는 앞으로 여행사와 함께 영화 관광 패키지 상품 개발에 활용될 수 있다. 또한 국내에서 해외로의 유입뿐만 아니라, 해외에서 국내로의 유입에 활용될 가능성 역시 내포하고 있다.

이미지 내의 텍스트 데이터 인식 정확도 향상을 위한 멀티 모달 이미지 처리 프로세스 (Multi-modal Image Processing for Improving Recognition Accuracy of Text Data in Images)

  • 박정은;주경돈;김철연
    • 데이타베이스연구회지:데이타베이스연구
    • /
    • 제34권3호
    • /
    • pp.148-158
    • /
    • 2018
  • 광학 문자 인식(OCR)은 텍스트를 포함한 이미지에서 텍스트 영역을 인식하고 이로부터 텍스트를 추출하는 기술이다. 전체 텍스트 데이터 중 상당히 많은 텍스트 정보가 이미지에 포함되어 있기 때문에 OCR은 데이터 분석 분야에 있어 중요한 전처리 단계를 담당한다. 대부분의 OCR 엔진이, 흰 바탕의 검정 글씨의 단순한 형태를 가진 이미지와 같은, 텍스트와 배경의 구분이 뚜렷한 저 복잡도 이미지에 대해서는 높은 인식률을 보이는 반면, 텍스트와 배경의 구분이 뚜렷하지 않은 고 복잡도 이미지에 대해서는 저조한 인식률을 보이기 때문에, 인식률 개선을 위해 입력 이미지를 OCR 엔진이 처리하기 용이한 이미지로 변형하는 전처리 작업이 필요하게 된다. 따라서 본 논문에서는 OCR 엔진의 정확성 증대를 위해 텍스트 라인별로 이미지를 분리하고, 영상처리 기법 기반의 CLAHE 모듈과 Two-step 모듈을 병렬적으로 수행하여 텍스트와 배경 영역을 효율적으로 분리한 후 텍스트를 인식한다. 이어서 두 모듈의 결과 텍스트에 대하여 N-gram방법과 Hunspell 사전을 결합한 알고리즘으로 인식률을 비교하여 가장 높은 인식률의 결과 텍스트를 최종 결과물로 선정하는 방법론을 제안한다. 대표적인 OCR 엔진인 Tesseract와 Abbyy와의 다양한 비교 실험을 통해 본 연구에서 제안하는 모듈이 복잡한 배경을 가진 이미지에서 가장 정확한 텍스트 인식률을 보임을 보였다.

게리트 리트벨트 디자인 개념 재평가에 관한 연구 (A Study on the Reappraisal of Gerrit Thomas Rietveld's Design Concept)

  • 이광인
    • 한국디지털건축인테리어학회논문집
    • /
    • 제12권4호
    • /
    • pp.97-105
    • /
    • 2012
  • This study aims to evaluate Rietveld's creative design style and concepts. To this end, I looked into the evaluation of major researchers on Rietveld, classified all his works into four groups according to the design types and analyzed them. As follows: based on the results of the analysis of works I concluded. First, Rietveld created the concept of the spatial extension to the ingenious joint which had the structural node formed of three listels with quadrangular section. It is the design innovation that led to liberate the closed construction. Second, Rietveld had opened up the possibility to neutralize the gravitational three-dimensional works. He subtracted the weight in the direction of gravity from the three-dimensional structure of the works and painted the three primary colors on them partially to get rid of the original material color. Therefore they looked like the forms liberated from gravity. Third, Rietveld ripped off the surfaces of cube through several formative experiments and decomposed the volume into the tesseract. Through this method of realizing the new plastic concepts, he completed the architectural models of weightlessness. Fourth, Rietveld opened the possibility of the realization of the three-dimensional works integrated all space and time in the one-pieced works and the folded works. Fifth, Rietveld steadily experimented and realized the internal and external integration of time and space in his later works.

반 두즈버르그의 색면 조형 실험에 관한 연구 (A Study on Theo van Doesburg's Plastic Experiments with Colored Planes)

  • 박영경
    • 한국실내디자인학회논문집
    • /
    • 제16권3호
    • /
    • pp.30-37
    • /
    • 2007
  • This research is to find out the characteristics and significance of the plastic experiments with colored planes in Theo van Doesburg's works. Based on the analysis, the following results have been obtained. First, Thea van Doesburg's plastic experiments with colored planes started from the paintings in 1916-1918. series and series were made of the ion of still life or human motion. These paintings were intended to make effects of rhythm, acceleration and simultaneity. Second, he colored the outer and inner architectural surface with primary colors. The expression of visual. rhythm on the color design for De Vonk, Districts Housing Projects VIII & IX in Spangen, Multi-Housing in Oosterstraat, Friesian Housing, Landbouw Winter School, and University Hall in Amsterdam embodied the concept of painting-in-architecture. Third, the field of these experiments were extended into the architectural space. As a results, $H\hat{o}tel$ Particulier and Maison d'Artiste was shown on the Architectural Exhibition in Paris in 1923. The colored planes were used as a construction material. They generated the dynamic space in architecture. Fourth, through the pictorial works like Architectural Analysis, Contra-Composition, Simultaneous Composition or Simultaneous Contra-Composition, Tesseract and Aubette Cinema-Dancing Hall, he created the concepts of simultaneous integration including nature and the environments as well as space-time in the architecture.