• Title/Summary/Keyword: OCR Technology

Search Result 130, Processing Time 0.023 seconds

통계적 특징 추출 방법을 이용한 샘물체 필기 한글의 오프라인 인식 (Off-line recognition of Hanguls handprinted in sammool style with statistical feature extraction method)

  • 이성환;박정선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
    • /
    • pp.237-248
    • /
    • 1992
  • 본 논문에서는 통계적인 특징 추출 방법을 사용하여 샘물체로 필기된 한글을 고속으로 인식하는 방법을 소개한다. 대부분이 직선 성분으로 이루어진 한글의 특성을 이응하기 위하여 입력 영상으로부터 수평, 수직, 사선, 역사선의 방향 성분을 추출하며, 검은 화소의 밀도에 따라 동적으로 그물을 결정함으로써 획 간의 접촉 변형에 무관한 특징 벡터를 추출한다. 이와 같은 통계적 특징 추출 방법은 크기 정규화나 세선화 과정이 필요없으며, 또한 샘물체라는 필기 형태의 제약에 의해 정합 대상 부류의 수가 현저히 줄어들기 때문에 인식에 소요되는 시간을 상당히 줄일 수 있음은 물론, 인식률을 향상시켰다. 제안된 방법의 타당성을 검증하기 위하여 샘물체로 필기된 KS 완성형 한글 2,350자에 대해 실험한 결과, 평균 90% 이상의 인식률을 보이며, IBM PC 486(33MHz)상에서 문자당 평균 0.17초의 인식 속도를 보임으로써, 실용적인 고속 OCR 시스템의 개발 가능성을 확인할 수 있었다.

  • PDF

그레이스케일 영상에서 표준 편차를 이용한 문자 분할 (Character Segmentation in a Grayscale Image using the Standard Deviation)

  • 정민철
    • 반도체디스플레이기술학회지
    • /
    • 제11권2호
    • /
    • pp.27-31
    • /
    • 2012
  • This paper proposes a new method of character segmentation in a grayscale image using the standard deviation. Firstly, the proposed method scans vertically the region of interest in an image in order to calculate a standard deviation for each scan line. Characters' standard deviations are much bigger than the background's. Therefore, it is possible to segment characters vertically using the differentiation of those two types of standard deviations. Secondly, the method scans each vertically segmented image horizontally at this time, and then segments each image similarly. The proposed method is implemented using C language in an embedded Linux system for a high-speed real-time image processing. Experiments were conducted by using credit card images. The results show that the proposed algorithm is quite successful for most credit cards. However, the method fails in some credit cards with strong background patterns.

신용카드 번호의 광학적 인식 (Optical Recognition of Credit Card Numbers)

  • 정민철
    • 반도체디스플레이기술학회지
    • /
    • 제13권1호
    • /
    • pp.57-62
    • /
    • 2014
  • This paper proposes a new optical recognition method of credit card numbers. Firstly, the proposed method segments numbers from the input image of a credit card. It uses the significant differences of standard deviations between the foreground numbers and the background. Secondly, the method extracts gradient features from the segmented numbers. The gradient features are defined as four directions of grayscale pixels for 16 regions of an input number. Finally, it utilizes an artificial neural network classifier that uses an error back-propagation algorithm. The proposed method is implemented using C language in an embedded Linux system for a high-speed real-time image processing. Experiments were conducted by using real credit card images. The results show that the proposed algorithm is quite successful for most credit cards. However, the method fails in some credit cards with strong background patterns.

BTMSM/$O_2$ 고유량으로 증착된 low-k SiOCH 박막의 전기적인 특성 (Electrical characteristics of low-k SiOCH thin film deposited by BTMSM/$O_2$ high flow rates)

  • 김민석;황창수;김홍배
    • 반도체디스플레이기술학회지
    • /
    • 제7권1호
    • /
    • pp.41-45
    • /
    • 2008
  • We studied the electrical characteristics of low-k SiOCR interlayer dielectric(ILD) films fabricated by plasma enhanced chemical vapor deposition (PECVD). The precursor bis-trimethylsilylmethane (BTMSM) was introduced into the reaction chamber with the various flow rates. The absorption intensities of Si-O-$CH_x$, bonding group and Si-$CH_x$, bonding group changed synchronously for the variation of precursor flow rate, but the intensity of Si-O-Si(C) responded asynchronously with the $CH_x$, combined bonds. The SiOCH films revealed ultra low dielectric constant around 2.1(1) and reduced further below 2.0 by heat treatments.

  • PDF

파일명 자동 부착 서비스를 위한 비지도 학습 기반 파일명 추출방법 (For Automatic File Name Attachment Service Unsupervised Learning-based File Name Extraction Method)

  • 선주오;장영진;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.596-599
    • /
    • 2022
  • 심층 학습은 지속적으로 발전하고 있으며, 최근에는 실제 사용자에게 제공되는 애플리케이션까지 확장되고 있다. 특히 자연어처리 분야에서는 대용량 언어 말뭉치를 기반으로 한 언어모델이 등장하면서 사람보다 높은 성능을 보이는 시스템이 개발되었다. 그러나 언어모델은 높은 컴퓨팅 파워를 요구하기 때문에 독립적인 소형 디바이스에서 제공할 수 있는 서비스에 적용하기 힘들다. 예를 들어 스캐너에서 제공할 수 있는 파일명 자동 부착 서비스는 하드웨어의 컴퓨팅 파워가 제한적이기 때문에 언어모델을 적용하기 힘들다. 또한, 활용할 수 있는 공개 데이터가 많지 않기 때문에, 데이터 구축에도 높은 비용이 요구된다. 따라서 본 논문에서는 컴퓨팅 파워에 비교적 독립적이고 학습 데이터가 필요하지 않은 비지도 학습을 활용하여 파일명 자동 부착 서비스를 위한 파일명 추출 방법을 제안한다. 실험은 681건의 문서 OCR 결과에 정답을 부착하여 수행했으며, ROUGE-L 기준 0.3352의 성능을 보였다.

  • PDF

HANDWRITTEN HANGUL RECOGNITION MODEL USING MULTI-LABEL CLASSIFICATION

  • HANA CHOI
    • Journal of the Korean Society for Industrial and Applied Mathematics
    • /
    • 제27권2호
    • /
    • pp.135-145
    • /
    • 2023
  • Recently, as deep learning technology has developed, various deep learning technologies have been introduced in handwritten recognition, greatly contributing to performance improvement. The recognition accuracy of handwritten Hangeul recognition has also improved significantly, but prior research has focused on recognizing 520 Hangul characters or 2,350 Hangul characters using SERI95 data or PE92 data. In the past, most of the expressions were possible with 2,350 Hangul characters, but as globalization progresses and information and communication technology develops, there are many cases where various foreign words need to be expressed in Hangul. In this paper, we propose a model that recognizes and combines the consonants, medial vowels, and final consonants of a Korean syllable using a multi-label classification model, and achieves a high recognition accuracy of 98.38% as a result of learning with the public data of Korean handwritten characters, PE92. In addition, this model learned only 2,350 Hangul characters, but can recognize the characters which is not included in the 2,350 Hangul characters

특징 분리를 통한 자연 배경을 지닌 글자 기반 CAPTCHA 공격 (Breaking character and natural image based CAPTCHA using feature classification)

  • 김재환;김수아;김형중
    • 정보보호학회논문지
    • /
    • 제25권5호
    • /
    • pp.1011-1019
    • /
    • 2015
  • 컴퓨터 사용자가 사람인지 아닌지를 판별하는 CAPTCHA는 많은 포털 사이트에서 자동 프로그램에 의한 비정상적인 회원가입 또는 다중 로그인 방지 등을 위해 사용되고 있다. 많은 웹 사이트들은 숫자 혹은 영어로 구성된 문자열 기반 캡챠를 대부분 사용하는데, 최근에는 OCR 기술의 발달로 단순한 텍스트 기반 캡챠는 쉽게 무력화 된다. 이에 대한 대안으로 많은 웹 사이트들은 글자 판독을 어렵게 하기 위해 잡음을 첨가하거나 글자를 왜곡시키는 등 다양한 시도를 하고 있다. 본 논문에서 대상으로 하는 국내 한 포털 사이트 역시 공격자들에 의해 많은 공격을 당하였고, 끊임없이 캡챠를 발전시키고 있다. 본 논문에서는 해당 사이트에서 현재 사용되고 있는 다양한 자연 배경을 지닌 캡챠에 대해 분석하고, SVM을 이용한 특징 분리 후 CNN을 이용한 글자 인식을 통해 해당 캡챠의 취약성을 검증하였다. 실험 결과, 총 1000개의 캡챠 이미지 중 368개에 대해 정확히 맞추었고, 이를 통해 해당 포털 사이트에서 현재 사용하고 있는 새로운 버전의 캡챠 역시 안전하지 않음을 입증하였다.

세포 호흡량 측정용 다채널 측정 시스템 개발 (Development of a multi channel measurement system for the cellular respiration measurement)

  • 남현욱;박정일;김영미;박정호
    • 센서학회지
    • /
    • 제19권1호
    • /
    • pp.36-42
    • /
    • 2010
  • This paper describes a multi channel measurement system which can measure the cellular respiration level in a solution containing cells by using a Clark-type sensor with the solution temperature control unit. The Clark-type sensor can measure the cellular respiration level in the solution because it can measure the reduction current depending on the dissolved oxygen level in the solution. This measurement system was maintained the temperature within ${\pm}0.1^{\circ}C$ of the setting temperature value by on/off control method in order to measure the precise cellular respiration level. The measurement system showed that the applied voltage to the working electrode was very stable(-0.8 V$\pm$ 0.0071 V) by using proportional control method. From the current measurement, the response time and the linearity correlation coefficient were 25 sec and 0.94, respectively, which are very close to the results of the commercial product. Using this system and the fabricated Clarktype sensor, the average ratio of the uncoupled OCR(oxygen consumption rate) to the coupled OCR was 1.35 and this is almost the same as that obtained from a commercial systems.

효과적인 도서목록 검색을 위한 개선된 OCR알고리즘에 관한 연구 (Improvement OCR Algorithm for Efficient Book Catalog RetrievalTechnology)

  • 하문;백영현;문성룡
    • 전자공학회논문지CI
    • /
    • 제47권1호
    • /
    • pp.152-159
    • /
    • 2010
  • 본 논문에서는 기울어진 문자, 다양한 크기, 글씨체, 흐린 문자를 포함한 입력영상의 문자 복원과 인식, 효율적인 도서 검색을 위한 광학문자인식 알고리즘을 제안한다. 본 논문에서 제안한 광학문자 인식알고리즘은 검출부와 인식부로 구성되며, 검출부에서는 복잡한 배경에서 정확한 도서 영역 검출을 위하여 로버츠 에지 연산자와 허도로프 거리 알고리즘을 적용하여 필요한 영역을 검출하였다. 또한 인식부에서는 문자의 크기와 경사도, 부분 손실 등의 영상에 강인성을 갖는 바이큐빅 보간법을 적용하여 데이터 손실 복원과, 반자동 기울기를 갖는 입력 영상의 보정을 하였다. 모의실험 결과 기존 알고리즘 보다 인식률에서는 6%, 검색시간에서는 1.077초 더 우수함을 확인하였다.

과압밀비와 함수비를 고려한 실트질 사질토 지반의 강도 및 변형 특성 (Strength and Stiffness of Silty Sands with Different Overconsolidation Ratios and Water Contents)

  • 김현주;이경숙;이준환
    • 한국지반공학회논문집
    • /
    • 제21권9호
    • /
    • pp.53-64
    • /
    • 2005
  • 지반설계에 있어 지반거동은 일반적으로 단순화된 선형탄성이나 완전소성으로 간주되어 적용되고 있으나, 비선형 응력-변형률 거동, 응력이력 및 함수비 등의 현장 지반조건 또한 정밀한 지반설계를 위해서는 적절히 반영되어야 한다. 본 연구에서는 삼축압축시험과 공진주시험을 포함한 일련의 실내시험을 통하여 실트함유량, 상대밀도, 응력상태등 다양한 지반조건과 과압밀비 및 함수비의 변화와 같은 현장 지반조건을 고려하여 사질토의 강도 및 강성도 특성을 분석하였다. 그 결과 최대전단강도 및 초기전단탄성계수에 대한 과압밀의 영향은 미소하게 나타났으나, 초기 미소변형률 이후부터 파괴까지의 비선형 탄성구간에서는 과압밀의 영향이 무시할 수 없는 영향인자임을 확인할 수 있었다. 함수비의 경우 구속압과 상대밀도가 낮은 경우 함수비가 증가함에 따라 초기전단탄성계수는 세립분 증가와 함께 감소하였으며, 구속압이 증가할수록 함수비의 영향은 감소하였다.