• 제목/요약/키워드: ocr

검색결과 473건 처리시간 0.025초

T-DMB 시스템에서 궤환간섭 제거기를 가지는 등화형 OCR (Equalization OCR with Feedback Interference Canceller in T-DMB System)

  • 박성익;음호민;박소라;김건;이용태;김흥묵
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2008년도 추계학술대회
    • /
    • pp.23-26
    • /
    • 2008
  • 본 논문에서는 T-DMB 시스템의 단일 주파수 망 구성을 위해 궤환신호 제거기를 가지는 등화형 OCR (Equalization On-Channel Repeater, E-OCR)을 제안한다. 제안된 OCR은 송/수신 안테나의 충분치 못한 분리도로 인해 야기된 궤환신호를 궤환간섭 제거기를 통해 제거하여 송신출력을 높일 뿐만 아니라, 송신기와 중계기 사이의 다중경로 신호를 등화기를 통해 제거하여 우수한 출력신호 품질을 보장한다. 또한, 본 논문에서는 전산실험을 통해 제안된 OCR의 성능을 살펴보고 실험실 테스트를 통해 실제 구현된 OCR의 성능을 검증한다.

  • PDF

딥러닝을 활용한 한글문장 OCR연구 (A Study on the OCR of Korean Sentence Using DeepLearning)

  • 박선우
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.470-474
    • /
    • 2019
  • 한글 OCR 성능을 높이기 위해 딥러닝 모델을 활용하여 문자인식 부분을 개선하고자 하였다. 본 논문에서는 폰트와 사전데이터를 사용해 딥러닝 모델 학습을 위한 한글 문장 이미지 데이터를 직접 생성해보고 이를 활용해서 한글 문장의 OCR 성능을 높일 다양한 모델 조합들에 대한 실험을 진행했다. 딥러닝 모델은 STR(Scene Text Recognition) 구조를 사용해 변환, 추출, 시퀀스, 예측 모듈 각 24가지 모델 조합을 구성했다. 딥러닝 모델을 활용한 OCR 실험 결과 한글 문장에 적합한 모델조합은 변환 모듈을 사용하고 시퀀스와 예측 모듈에는 BiLSTM과 어텐션을 사용한 모델조합이 다른 모델 조합에 비해 높은 성능을 보였다. 해당 논문에서는 이전 한글 OCR 연구와 비교해 적용 범위를 글자 단위에서 문장 단위로 확장하였고 실제 문서 이미지에서 자주 발견되는 유형의 데이터를 사용해 애플리케이션 적용 가능성을 높이고자 한 부분에 의의가 있다.

  • PDF

오픈소스 기반 OCR의 한국어 인식성능 비교분석에 관한 연구 (Comparative Analysis of Korean Language Recognition Performance in Open Source-Based OCR)

  • 김정섭;김현정;유상현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.471-472
    • /
    • 2023
  • 문서 전자화 시스템의 도입에 따라 OCR에 관련된 많은 연구가 진행되고 있으며, 현재 넓은 분야에서 OCR을 활용 중이다. 그러나 OCR 라이브러리들의 한국어 인식성능에 어느 정도 차이가 있는지에 대한 의문이 생기고 있다. 본 논문에서는 현재 사용 중인 OCR 라이브러리의 한국어 인식성능을 비교, 분석하였고 Tesseract OCR이 더 인식성능이 좋다는 결과를 얻었다.

나이브 베이즈 분류기와 혼동 행렬을 이용한 OCR에서의 철자 교정 (Using Naïve Bayes Classifier and Confusion Matrix Spelling Correction in OCR)

  • 노경목;김창현;천민아;김재훈
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.310-312
    • /
    • 2016
  • OCR(Optical Character Recognition)의 오류를 줄이기 위해 본 논문에서는 교정 어휘 쌍의 혼동 행렬(confusion matrix)과 나이브 베이즈 분류기($na{\ddot{i}}ve$ Bayes classifier)를 이용한 철자 교정 시스템을 제안한다. 본 시스템에서는 철자 오류 중 한글에 대한 철자 오류만을 교정하였다. 실험에 사용된 말뭉치는 한국어 원시 말뭉치와 OCR 출력 말뭉치, OCR 정답 말뭉치이다. 한국어 원시 말뭉치로부터 자소 단위의 언어모델(language model)과 교정 후보 검색을 위한 접두사 말뭉치를 구축했고, OCR 출력 말뭉치와 OCR 정답 말뭉치로부터 교정 어휘 쌍을 추출하고, 자소 단위로 분해하여 혼동 행렬을 만들고, 이를 이용하여 오류 모델(error model)을 구축했다. 접두사 말뭉치를 이용해서 교정 후보를 찾고 나이브 베이즈 분류기를 통해 확률이 높은 교정 후보 n개를 제시하였다. 후보 n개 내에 정답 어절이 있다면 교정을 성공하였다고 판단했고, 그 결과 약 97.73%의 인식률을 가지는 OCR에서, 3개의 교정 후보를 제시하였을 때, 약 0.28% 향상된 98.01%의 인식률을 보였다. 이는 한글에 대한 오류를 교정했을 때이며, 향후 특수 문자와 숫자 등을 복합적으로 처리하여 교정을 시도한다면 더 나은 결과를 보여줄 것이라 기대한다.

  • PDF

피에조콘 관입 시험에 의한 OCR 평가 (Evaluation of OCR in Fine Grained Soil by Piezocone Tests)

  • Lim, Beyong-Seock
    • 한국지반공학회:학술대회논문집
    • /
    • 한국지반공학회 2000년도 가을 학술발표회 논문집
    • /
    • pp.561-568
    • /
    • 2000
  • 본 연구의 목적은 Piezocone 관입시험을 이용한 연약지반의 OCR 평가에 있어 기존의 여러 가지 해석방법들과 최근에 새롭게 제안된 방법들을 실내 모형토조에서 실측된 피에조콘 관입 실험치에 적용하여 각 해석방법들의 차이와 장단점들을 비교 분석하는데 있다. 본 연구의 연구실험방법으로는, Piezocone 관입을 위한 연약 모형지반 조성을 위하여 초대형 Slurry Consolidometer에 Free Stress 상태의 Slurry를 45일간 압밀시킨후 Automatic Computer Control Calibration Chamber (LSU/CALCHAS; Louisiana Slate University Calibration Chamber System)에 옮긴후 다시한번 압밀시키는 Two-Stage Consolidation Method를 사용하였다. 모형지반은 여러 가지 Boundary Condition들과 Stress Condition 그리고 Stress History등을 달리하여 총 5개의 지반을 조성하였다. 관입시험은 총 25개의 Piezocone 관입이 수행되어졌고, 그중 4개는 Standard 10 cm2 Piezocone이고, 나머지 21개는 Miniature Piezocone이 사용되었다. Piezocone 실험치들에 대한 여러 가지 OCR 해석방법 적용결과, Schmertmann방법은 5개 모형지반 모두에서 과다한 OCR평가를 보였으며, $B_{q}$ 방법은 일부모형지반에서 음의 OCR값으로 계산되어졌다. 그러나, Critical-Stale Soil Mechanics 와 Cavity Expansion 이론에 근거하여 Mayne(1991), Kurup(1993), Tumay et al (1995) 들이 제안한 OCR 평가방법들은 실험치와 잘맞는 경향을 보여주었다. 이와같은 이론 모델값들의 차이는 응력조건(Stress Condition)과 경계조건(Boundary Condition)들에 대한 각 해석방법들의 고려정도에 따른 결과로 판단된다.

  • PDF

나이브 베이즈 분류기와 혼동 행렬을 이용한 OCR에서의 철자 교정 (Using Naïve Bayes Classifier and Confusion Matrix Spelling Correction in OCR)

  • 노경목;김창현;천민아;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.310-312
    • /
    • 2016
  • OCR(Optical Character Recognition)의 오류를 줄이기 위해 본 논문에서는 교정 어휘 쌍의 혼동 행렬(confusion matrix)과 나이브 베이즈 분류기($na{\ddot{i}}ve$ Bayes classifier)를 이용한 철자 교정 시스템을 제안한다. 본 시스템에서는 철자 오류 중 한글에 대한 철자 오류만을 교정하였다. 실험에 사용된 말뭉치는 한국어 원시 말뭉치와 OCR 출력 말뭉치, OCR 정답 말뭉치이다. 한국어 원시 말뭉치로부터 자소 단위의 언어 모델(language model)과 교정 후보 검색을 위한 접두사 말뭉치를 구축했고, OCR 출력 말뭉치와 OCR 정답 말뭉치로부터 교정 어휘 쌍을 추출하고, 자소 단위로 분해하여 혼동 행렬을 만들고, 이를 이용하여 오류 모델(error model)을 구축했다. 접두사 말뭉치를 이용해서 교정 후보를 찾고 나이브 베이즈 분류기를 통해 확률이 높은 교정 후보 n개를 제시하였다. 후보 n개 내에 정답 어절이 있다면 교정을 성공하였다고 판단했고, 그 결과 약 97.73%의 인식률을 가지는 OCR에서, 3개의 교정 후보를 제시하였을 때, 약 0.28% 향상된 98.01%의 인식률을 보였다. 이는 한글에 대한 오류를 교정했을 때이며, 향후 특수 문자와 숫자 등을 복합적으로 처리하여 교정을 시도한다면 더 나은 결과를 보여줄 것이라 기대한다.

  • PDF

OCR 기술을 활용한 소비 관리 어플 (Consumption management application using OCR technology)

  • 정서예;김서희;박은별;안채린;정채림;김병완;이병권
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.203-204
    • /
    • 2021
  • 본 논문에서는 OCR기술을 이용하여 나만의 소비패턴을 분석하는 어플을 제안한다. 현재 카드와 간편결제를 많이 쓰는 시대, 사람들은 소비 패턴을 쉽게 분석하고 알 수 없기 때문에 절약과 저축도 쉽게 못하고 있다. 따라서 OCR을 활용한 영수증 인식으로 소비 패턴을 분석하고 나의 소비 생활을 쉽게 알 수 있는 서비스를 통해 소비 문제가 개선될 것이라고 생각한다. 가계부의 핵심 기능은 수입/지출을 표기하는 것이다. 하지만 현재 상용 중인 소비 앱은 너무 많은 기능을 도입해 오히려 사용성이 떨어진다. 이를 해결하기 위해 복잡한 서비스는 빼고, 핵심 기능과 OCR 기능, 예산 관리, 포인트 제도, 카테고리별 지출 관리를 넣었다. 프로젝트의 대상은 평소 과도한 지출을 하는 사람과 자신의 소비를 기록하고 싶은 사람이며, 본 시스템에서 OCR을 이용해 소비시 발생하는 영수증을 인식하여 더욱 편리하게 입력할 수 있다. 또한, 비 계획적인 소비를 효율적으로 해결할 수 있으며, 포인트 제도를 이용해 사용자의 출석률 문제를 효율적으로 해결할 것으로 기대된다.

  • PDF

T-DMB의 SFN을 위한 등화형 동일채널 중계기 (Equalization On-Channel Repeater for Single Frequency Network of Terrestrial Digital Multimedia Broadcasting)

  • 박성익;박소라;음호민;이용태;김흥묵
    • 방송공학회논문지
    • /
    • 제13권3호
    • /
    • pp.365-379
    • /
    • 2008
  • 본 논문에서는 단일 주파수 망(Single Frequency Network: SFN)을 통해 지상파 DMB 신호를 서비스하기 위해 필요한 동일채널 중계기(On-Channel Repeater, OCR)의 요구사항에 대하여 고찰하고, 그러한 요구사항을 만족하기 위한 등화형 OCR의 구조 및 구현방법을 제안한다. 등화형 OCR은 짧은 시스템 지연을 가질 뿐만 아니라 송/수신 안테나의 낮은 분리도로 인한 궤환신호와 송신기와 중계기 사이의 다중경로 신호를 동시에 제거하여 높은 송신출력과 우수한 출력신호 품질을 보장한다. 또한, 본 논문에서는 전산실험을 통해 등화형 OCR의 성능을 살펴보고 실험실 테스트를 통해 실제 구현된 등화형 OCR의 성능을 검증한다.

피에조콘 관입시험에 의한 과압밀비 산정에 관한 연구 (Determination of the Overconsolidation Ratio using the Piezocone Penetration Test)

  • 이기세;신원태;구남실;김학준
    • 지질공학
    • /
    • 제17권3호
    • /
    • pp.351-358
    • /
    • 2007
  • 본 연구에서는 피에조콘 관입시험(PCPT)결과를 사용한 연약지반의 과압밀비(OCR)결정의 타당성을 평가하고자 양산-물금지역의 연약지반에서 실시된 피에조 콘 관입시험 자료와 동일지역 44개소에서 심도별로 시추한 총 172개 자연시료를 사용하여 기본적인 실내토질시험 결과를 사용하였다. 실내압밀시험 결과로부터 구한 과압밀비($OCR_c$)와 압밀시험에 사용된 시료와 상응하는 지역에서 실시된 피에조콘 관입시험 결과로 구한 과압밀비($OCR_p$)를 비교 분석하여 피에조콘 관입시험 결과와 과압밀비의 상관 관계식을 제시하였다. 본 연구에 사용된 점토의 경우 Poewll 등(1994)이 균열이 없는 점토를 대상으로 하여 제안한 경험식으로 구한 과압밀비가 표준압밀시험으로 구한 과압밀비와 가장 잘 부합되는 것으로 나타났다.

Novel Equalization On-Channel Repeater with Feedback Interference Canceller in Terrestrial Digital Multimedia Broadcasting System

  • Park, Sung-Ik;Eum, Ho-Min;Park, So-Ra;Kim, Geon;Lee, Yong-Tae;Kim, Heung-Mook;Oh, Wang-Rok
    • ETRI Journal
    • /
    • 제31권4호
    • /
    • pp.357-364
    • /
    • 2009
  • In this paper, we propose a novel equalization on-channel repeater (OCR) with a feedback interference canceller (FIC) to relay terrestrial digital multimedia broadcasting signals in single frequency networks. The proposed OCR not only has high output power by cancelling the feedback signals caused by insufficient antenna isolation through the FIC, but also shows better output signal quality than the conventional OCR by removing multipath signals existing between the main transmitter and the OCR through an equalizer. In addition, computer simulations and laboratory test results demonstrate that the proposed OCR successfully cancels feedback signals and compensates channel distortions and provides a higher quality transmitting signal with higher output power than conventional OCRs.