• Title/Summary/Keyword: Character segmentation

Search Result 172, Processing Time 0.031 seconds

The Recognition of Vehicle Plate`s Korean Character Using Grapheme Segmentation (자소 분리 방법을 이용한 차량번호판의 용도구분 문자 인식)

  • 김성우;강동구;박재현;차의영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.646-648
    • /
    • 2002
  • 본 논문에서는 차량번호판의 용도구분 문자를 자소 단위로 분리하는 효율적인 방법을 제안하고, 신경망을 이용하여 자소를 인식하는 방법을 소개한다. 용도구분 문자(가, 거, 나, 너‥‥)는 실제 번호판의 훼손, 카메라의 성능, 기타 여러 가지 조건에 의해서 번호판 영상에 많은 잡영이 포함된다. 따라서 차량번호판 한글문자를 자소분리하는 것은 어려운 작업이다. 제안하는 이진 영상처리 기법(morphological operation, connected component labeling 등) 으로 분리된 자소가 인식시스템으로의 입력벡터로 입력되었을 때 높은 인식률을 보이는 것을 실험을 통하여 확인하였다

  • PDF

Recognition of Hangeul Character Using Grapheme Segmentation and Pixel Distribution (자소분할과 픽셀분포를 이용한 한글문자인식)

  • Cho, Young-Guk;Lee, Dong-Wook
    • Proceedings of the KIEE Conference
    • /
    • 2009.07a
    • /
    • pp.1919_1920
    • /
    • 2009
  • 한글 문자 인식에 관한 연구는 통계적 방법과 구조적 방법, 신경 회로망 등 다양한 방법론이 제시되어 왔다. 그러나 한글은 영문이나 숫자에 비해 방대한 문자수와 복잡한 구조로 인하여 인식에 많은 어려움을 가지고 있다. 따라서 본 논문에서는 한글을 가장 단순한 구조인 자음과 모음으로 분리한 뒤 각 개체의 픽셀 분포를 파악하고, 한글의 구조적 특징을 이용하여 자소의 행과 열에서의 peak값과 픽셀의 분포를 그룹으로 나누어 한글을 인식하는 방법을 제시한다.

  • PDF

character segmentation using histogram (히스토그램을 이용한 문자 영역 추출)

  • Kim, Jieum;Jung, Woo Young
    • Annual Conference on Human and Language Technology
    • /
    • 2012.10a
    • /
    • pp.173-174
    • /
    • 2012
  • 문자 영역의 추출은 명함 등 문서의 정형화된 문자 인식, 비전 기반 감시 시스템에서의 간판, 부호 등의 자연영상에서의 문자 인식 등 다양한 분야에 활용될 수 있다. 우리가 관심을 갖는 문자는 간판이나 이름표 등 다른 이에게 정보를 전달해주는 기능을 하는 것으로 그 전배경의 구분이 명확하다. 이러한 특징은 히스토그램의 변화와 관련이 되어 있으며 본 논문에서는 그 변화를 분석함으로써 문자 영역 추출 방법을 제안한다.

  • PDF

A Method of Character String Segmentation using Histogram Analysis (히스토그램 분석 기반의 인쇄체 문자열 분할 방법)

  • 장승익;임길택;남윤석
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.532-534
    • /
    • 2003
  • 본 논문에서는 인쇄체 우편주소 영상에서 smearing과 히스토그램 분석을 이용한 고속의 문자열 기울기 보정 및 분할 방법을 제안하였다. 제안한 방법에서는 입력 영상을 가분할 하고, 각각의 가분할 영상에 대한 수평 히스토그램을 분석하여 기울기 측정 및 보정을 수행하였다. 문자열 분할 단계에서는, 기울기가 보정된 영상에 smearing을 수행하고, 영상에 존재하는 잡영 및 각종 바코드를 제거하고, 수평 히스토그램 분석을 통해 최종 문자열 분할 결과를 도출하였다. 제안한 방법을 사용한 실험에서 2,000 장의 테스트 영상 중 1,989장의 영상에서 정확한 문자분할 결과를 얻을 수 있었으며, 제안한 방법이 유효함을 보였다.

  • PDF

Handwritten Korean Character Segmentation using Background thinning (배경 세선화를 이용한 한글 필기체 글자 단위 분할)

  • 서원택;조범준
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.823-825
    • /
    • 2004
  • 본 연구에서는 필기체 한글의 글자단위의 분할을 위해 배경 세선화(Background thinning)라는 방법을 제안한다. 배경 세선화 방법은 글자와 글자 사이에 존재하는 배경의 정보를 세선화 처리하여 필기체 한글에서 많이 발생할 수 있는 중첩(Overlap)글자와 연결(Touched)글자를 서로 분할하는데 효과적인 성능을 보였다. 배경 세선화를 이용하여 글자를 분할하는 방법은 인식과정의 판단을 필요하지 않은 외적분할 방법으로 빠른 속도의 분할 성능을 보였다. 이 방법은 특히, 중첩된 글자의 분할에 탁월한 성능을 보였을 뿐만 아니라, 연결된 글자에 대해서도 좋은 성능을 보였다.

  • PDF

An Approach for Efficient Handwritten Word Recognition Using Dynamic Programming Matching (동적 프로그래밍 정합을 이용한 효율적인 필기 단어 인식 방법)

  • 김경환
    • Journal of the Korean Institute of Telematics and Electronics C
    • /
    • v.36C no.4
    • /
    • pp.54-64
    • /
    • 1999
  • This paper proposes an efficient handwritten English word recognition scheme which can be applied practical applications. To effectively use the lexicon which is available in most handwriting related applications, the lexicon entries are introduced in the early stage of the recognition. Dynamic programming is used for matching between over-segmented character segments and letters in the lexicon entries. Character segmentation statistics which can be obtained while the training is being performed are used to adjust the matching window size. Also, the matching results between the character segments and the letters in the lexicon entries are cached to avoid repeat of the same computation. In order to verify the effectiveness of the proposed methods, several experiments were performed using thousands of word images with various writing styles. The results show that the proposed methods significantly improve the matching speed as well as the accuracy.

  • PDF

A method for Character Segmentation using Frequence Characteristics and Back Propagation Neural Network (주파수 특성과 역전파 신경망 알고리즘을 이용한 문자 영역 분할 방법)

  • Chun Byung-Tae;Song Chee-Yang
    • Journal of the Korea Society of Computer and Information
    • /
    • v.11 no.4 s.42
    • /
    • pp.55-60
    • /
    • 2006
  • The proposed method uses FFT(Fast Fourier Transform) and neural networks in order to extract texts in real time. In general, text areas are found in the higher frequency domain, thus, can be characterized using FFT. The neural network are learned by character region(high frequency) and non character region(low frequency). The candidate text areas can be thus found by applying the higher frequency characteristics to neural network. Therefore, the final text area is extracted by verifying the candidate areas. Experimental results show a perfect candidate extraction rate and about 95% text extraction rate. The strength of the proposed algorithm is its simplicity, real-time processing by not processing the entire image.

  • PDF

Detecting Numeric and Character Areas of Low-quality License Plate Images using YOLOv4 Algorithm (YOLOv4 알고리즘을 이용한 저품질 자동차 번호판 영상의 숫자 및 문자영역 검출)

  • Lee, Jeonghwan
    • Journal of Korea Society of Digital Industry and Information Management
    • /
    • v.18 no.4
    • /
    • pp.1-11
    • /
    • 2022
  • Recently, research on license plate recognition, which is a core technology of an intelligent transportation system(ITS), is being actively conducted. In this paper, we propose a method to extract numbers and characters from low-quality license plate images by applying the YOLOv4 algorithm. YOLOv4 is a one-stage object detection method using convolution neural network including BACKBONE, NECK, and HEAD parts. It is a method of detecting objects in real time rather than the previous two-stage object detection method such as the faster R-CNN. In this paper, we studied a method to directly extract number and character regions from low-quality license plate images without additional edge detection and image segmentation processes. In order to evaluate the performance of the proposed method we experimented with 500 license plate images. In this experiment, 350 images were used for training and the remaining 150 images were used for the testing process. Computer simulations show that the mean average precision of detecting number and character regions on vehicle license plates was about 93.8%.

Word Segmentation in Handwritten Korean Text Lines based on GAP Clustering (GAP 군집화에 기반한 필기 한글 단어 분리)

  • Jeong, Seon-Hwa;Kim, Soo-Hyung
    • Journal of KIISE:Software and Applications
    • /
    • v.27 no.6
    • /
    • pp.660-667
    • /
    • 2000
  • In this paper, a word segmentation method for handwritten Korean text line images is proposed. The method uses gap information to segment words in line images, where the gap is defined as a white run obtained after vertical projection of line images. Each gap is assigned to one of inter-word gap and inter-character gap based on gap distance. We take up three distance measures which have been proposed for the word segmentation of handwritten English text line images. Then we test three clustering techniques to detect the best combination of gap metrics and classification techniques for Korean text line images. The experiment has been done with 305 text line images extracted manually from live mail pieces. The experimental result demonstrates the superiority of BB(Bounding Box) distance measure and sequential clustering approach, in which the cumulative word segmentation accuracy up to the third hypothesis is 88.52%. Given a line image, the processing time is about 0.05 second.

  • PDF

A High-Speed Korean Morphological Analysis Method based on Pre-Analyzed Partial Words (부분 어절의 기분석에 기반한 고속 한국어 형태소 분석 방법)

  • Yang, Seung-Hyun;Kim, Young-Sum
    • Journal of KIISE:Software and Applications
    • /
    • v.27 no.3
    • /
    • pp.290-301
    • /
    • 2000
  • Most morphological analysis methods require repetitive procedures of input character code conversion, segmentation and lemmatization of constituent morphemes, filtering of candidate results through looking up lexicons, which causes run-time inefficiency. To alleviate such problem of run-time inefficiency, many systems have introduced the notion of 'pre-analysis' of words. However, this method based on pre-analysis dictionary of surface also has a critical drawback in its practical application because the size of the dictionaries increases indefinite to cover all words. This paper hybridizes both extreme approaches methodologically to overcome the problems of the two, and presents a method of morphological analysis based on pre-analysis of partial words. Under such hybridized scheme, most computational overheads, such as segmentation and lemmatization of morphemes, are shifted to building-up processes of the pre-analysis dictionaries and the run-time dictionary look-ups are greatly reduced, so as to enhance the run-time performance of the system. Moreover, additional computing overheads such as input character code conversion can also be avoided because this method relies upon no graphemic processing.

  • PDF