• Title/Summary/Keyword: 문자추출

Search Result 671, Processing Time 0.024 seconds

Text Extraction and Word Grouping using 3D Area-Weighted Graph in Document (문서 이미지에서 문자 추출과 3차원 면적-가중치 그래프를 이용한 단어 그룹핑)

  • 옥세영;박환철;조환규
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.556-558
    • /
    • 1998
  • 이미지 분석이나 데이터 베이스 인덱싱 또는 종이 문서를 전자 문서화 하는 문제는컴퓨터 비젼 응용분야에서 중요 관심사가 되어왔다. 이러한 문제들을 처리하기 위해서는 제일 먼저 이미지와 문자가 혼합되어 있는 문서에서 자동으로 문자와 이미지들을 분리해 내는 과정이 필수 적이다. 본 논문에서는 신문이나 광고등에서 볼 수 있는 이미지, 음각 문자와 양각 문자가 섞여 있는 문서에서 문자만을 추출하는 알고리즘을 제안한다. 이 알고리즘은 Run-length code를 이용하여 문자나 이미지의 경계선(bound) 모양의 특징을 추출하여 음각 문자와 이미지, 양각 문자를 구분한다. 그리고 추출된 글자들을 3차원 공간상에 매핑한 후 3차원 면적 가중치 그래프를 이용하여 관련된 단어들로 묶어주는 3차원 그룹핑 알고리즘을 제시한다. 실험결과로는 추출된 문자와 그룹핑된 결과를 보여준다.

  • PDF

Character Region Extraction Based on Texture and Depth Features (질감과 깊이 특징 기반의 문자영역 추출)

  • Jang, Seok-Woo;Park, Young-Jae;Huh, Moon-Haeng
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.14 no.2
    • /
    • pp.885-892
    • /
    • 2013
  • In this paper, we propose a method of effectively segmenting character regions by using texture and depth features in 3D stereoscopic images. The suggested method is mainly composed of four steps. The candidate character region extraction step extracts candidate character regions by using texture features. The character region localization step obtains only the string regions in the candidate character regions. The character/background separation step separates characters from background in the localized character areas. The verification step verifies if the candidate regions are real characters or not. In experimental results, we show that the proposed method can extract character regions from input images more accurately compared to other existing methods.

Character Segmentation Using Depth Information (거리 정보를 활용한 문자 분할)

  • Jang, Seok-Woo;Park, Young-Jae;Kim, Gye-Young;Choi, Hyun-Jun
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2013.01a
    • /
    • pp.229-230
    • /
    • 2013
  • 본 논문에서는 입체영상을 분석하여 3차원의 영상 내에 나타나는 문자 영역을 효과적으로 분리하는 알고리즘을 제안한다. 제안된 알고리즘은 먼저 입력된 영상에서 질감 특징을 이용해 문자영역이 존재하는 후보 영역을 분할하고, 후보 문자영역 중에서 문자열만을 형성하는 영역을 추출한다. 그런 다음, 지역화된 문자영역을 문자와 배경으로 분리하며, 거리 특징을 활용하여 추출된 문자영역이 비 문자영역을 포함하지 않고 문자영역만을 포함하고 있는지를 최종적으로 검증한다. 실험에서는 제안된 방법을 여러 가지 영상에 적용하여 테스트 해 보았으며, 제안된 방법이 기존의 방법에 비해 보다 정확하게 문자영역을 추출함을 확인하였다.

  • PDF

The Extraction of Car License Plates and the Separation of Characters (차량 번호판의 영역 추출 및 문자 분할에 관한 연구)

  • 권숙연;이화진;전병환
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2000.04a
    • /
    • pp.457-462
    • /
    • 2000
  • 교통 법규 위반 단속이나 주차 관리를 위한 차량 번호판 인식 시스템을 구현하기 위해서는 크게 차량 번호판 추출, 문자 분할, 문자 인식의 세부분으로 이루어진다. 본 논문에서는 차량 번호판 인식 시스템의 구현을 위해 번호판 영역의 색상정보를 이용하여 차량 번호판을 추출하는 방법을 제안하고, 번호판 영역 문자들의 사전 정보와 색상성분을 사용하여 정확하게 번호판 문자 분할을 하는 방법을 제안한다. 자가용과 영업용 차량 영상을 주간/dirks 및 정면/후면으로 나누어 다양하게 취득하여 실험한 결과, 94.6%의 번호판 추출률과 86.8%의 문자분할률을 얻었다.

  • PDF

PDA-based Text Localization System Using Client/Server Architecture (Client/Server 구조를 이용한 PDA기반의 문자 추출 시스템)

  • 박안진;정기철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.751-753
    • /
    • 2004
  • PDA에서 사용하는 대부분의 CPU는 실수 연산 구성요소(float computation component)가 없는 정수(integer) CPU를 사용한다. 인공 신경망(neural network)과 같은 실수 연산이 많은 알고리즘은 PDA에서 많은 수행시간을 가진다. 본 논문에서는 이런 단점을 해결하기 위해 무선 랜(LAN)으로 연결된 Client(PDA)/Server(PC) 구조를 이용한 효과적인 문자 추출 시스템을 제안한다. Client(PDA)는 대략적인 문자 추출 결과를 JPEG으로 압축하여 전송속도를 최소화한다. Server(PC)는 Client(PDA)의 결과를 바탕으로 정밀한 문자 영역 추출을 위해, 텍스춰 분류 방법과 연결 성분 분석 방법을 이용한다. 실험에서 제안한 방법은 속도뿐만 아니라 문자 추출에서도 효과적이었다.

  • PDF

A Generalized Method for Extracting Characters and Video Captions (일반화된 문자 및 비디오 자막 영역 추출 방법)

  • Chun, Byung-Tae;Bae, Young-Lae;Kim, Tai-Yun
    • Journal of KIISE:Software and Applications
    • /
    • v.27 no.6
    • /
    • pp.632-641
    • /
    • 2000
  • Conventional character extraction methods extract character regions using methods such as color reduction, region split and merge and texture analysis from the whole image. Because these methods use many heuristic variables and thresholding values derived from a priori knowledge, it is difficult to generalize them algorithmically. In this paper, we propose a method that can extract character regions using a topographical feature extraction method and a point-line-region extension method. The proposed method can also solve the problems of conventional methods by reducing heuristic variables and generalizing thresholding values. We see that character regions can be extracted by generalized variables and thresolding values without using a priori knowledge of character region. Experimental results show that the candidate region extraction rate is 100%, and the character region extraction rate is over 98%.

  • PDF

Recognition System of Passports by Using Enhanced Fuzzy Neural Networks (개선된 퍼지 신경망을 이용한 여권 인식 시스템)

  • 류재욱;김광백
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2003.09b
    • /
    • pp.155-161
    • /
    • 2003
  • 출입국 관리 절차를 간소화하는 방안의 하나로 퍼지 신경망을 이용한 여권 인식 시스템을 제안한다. 제안된 여권 인식 방법은 소벨 연산자와 수평 스미어링, 윤곽선 추적 알고리즘을 적용하여 코드의 문자열 영역을 추출한다 여권의 문자열 영역은 OCR 문자 서체로 구성되어 있고, 명도 차이가 다양하게 나타난다. 따라서 추출된 문자열 영역을 블록 이진화와 평균 이진화를 각각 수행하고 그 결과들을 AND 비트 연산을 취하여 적응적으로 이진화한다. 이진화된 문자열 영역에 대해서 개별 코드의 문자들을 복원하기 위하여 CDM(Conditional Dilation Morphology) 마스크를 적용한 후, 역 CDM마스크와 HEM(Hit Erosion Morphology)마스크를 적용하여 잡음을 제거한다 잡음이 제거된 문자열 영역에 대해 수직 스미어링을 적용하여 개별 코드의 문자를 추출한다. 추출된 개별 코드의 인식은 퍼지 ART 알고리즘을 개선하여 RBF 네트워크의 중간층으로 적용하는 퍼지 RBF 네트워크와 개선된 퍼지 ART 알고리즘과 지도 학습을 결합한 퍼지 자가 생성 지도 학습 알고리 즘을 각각 제안하여 여권의 개별 코드 인식에 적용한다. 제안된 방법의 성능을 확인하기 위해서 실제 여권 영상을 대상으로 실험한 결과, 제안된 추출 및 인식 방법이 여권 인식에서 우수한 성능이 있음을 확인하였다.

  • PDF

Feature Extraction and Similarity Measure Function Define For Beauty Evaluation of Korean Character (한글의 미적 평가를 위한 특징 추출 및 유사도 함수 정의)

  • 한군희;오명관;이형우;전병민
    • The Journal of the Korea Contents Association
    • /
    • v.2 no.1
    • /
    • pp.59-67
    • /
    • 2002
  • This study pre-processed the characters, performed the feature extraction for the beauty evaluation, and then defined the similarity function. It suggested the definition of the similarity function, and the extraction of the features of character elements. it experimented how much the various input character patterns were similar with the standard character patterns, found their results were almost similar with the expected ones and the results of beauty evaluation on general people through the questionaire with the results of the methods suggested here.

  • PDF

The Character Area Extraction and the Character Segmentation on the Color Document (칼라 문서에서 문자 영역 추출믹 문자분리)

  • 김의정
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.9 no.4
    • /
    • pp.444-450
    • /
    • 1999
  • This paper deals with several methods: the clustering method that uses k-means algorithm to abstract the area of characters on the image document and the distance function that suits for the HIS coordinate system to cluster the image. For the prepossessing step to recognize this, or the method of characters segmentate, the algorithm to abstract a discrete character is also proposed, using the linking picture element. This algorithm provides the feature that separates any character such as the touching or overlapped character. The methods of projecting and tracking the edge have so far been used to segment them. However, with the new method proposed here, the picture element extracts a discrete character with only one-time projection after abstracting the character string. it is possible to pull out it. dividing the area into the character and the rest (non-character). This has great significance in terms of processing color documents, not the simple binary image, and already received verification that it is more advanced than the previous document processing system.

  • PDF

Text Region Detection Using Regional Connected Component and Edge Structure Component Feature From Natural Scene Images (지역적 연결요소 및 에지 구조 성분 특징을 이용한 자연이미지로부터 문자영역 검출)

  • Bak, Jong-Cheon;Hwang, Dong-Guk;Gwon, Gyo-Hyeon;Jeon, Byeong-Min
    • Proceedings of the KAIS Fall Conference
    • /
    • 2009.05a
    • /
    • pp.40-43
    • /
    • 2009
  • 최근 모바일 영상기반 응용 분야에 관한 연구가 활발히 진행되고 있으며 모바일기기로 촬영된 영상에서 문자정보를 추출하고자 하는 많은 연구도 진행되고 있다. 자연이미지로부터 문자정보를 추출을 위한 전단계로 문자영역 검출이 필수적이다. 본 연구는 문자영역의 지역적 에지 및 연결요소 특징을 고려하여 조명 및 복잡한 배경에서도 문자영역을 검출하는 방법을 제안한다. 에지 검출은 캐니-에지 검출기로 추출하고, RGB 컬러분포 패턴을 분석하여 컬러 양자화를 함으로서 연결성분을 추출한다. 각각 추출된 에지 및 연결성분으로부터 문자후보 영역을 검출하고, 각각의 결과를 결합하여 최종적인 문자 후보 영역을 검출하고, 문자 후보 영역에 대한 검증을 수행함으로서 최종적인 문자영역을 검출한다. 제안한 방법은 다양한 환경에서 얻어진 자연이미지를 대상으로 실험한 결과, 에지 및 연결성분의 두 가지 특징을 결합함으로서 자연이미지에 존재하는 다양한 형태의 문자영역을 효과적으로 검출하였다.

  • PDF