• Title/Summary/Keyword: 문자패턴

Search Result 297, Processing Time 0.024 seconds

A Study on Detecting Personal Information from Image Files (이미지파일에 포함된 개인정보추출에 관한 연구)

  • Lee, Minsuk;Kim, Sukhyeon;Yoon, Jiae;Won, Yoojae
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2017.01a
    • /
    • pp.209-212
    • /
    • 2017
  • 최근 정보통신기술의 비약적 발전에 따라 문서 제작 과정 또한 디지털 방식의 형태가 주를 이루게 되었다. 하지만 이와 더불어 문서를 통한 개인 정보 유출의 문제 또한 대두되게 되었다. 본 논문에서는 이미지 형식의 문서의 유출 방지를 위해 광학문자인식(OCR)을 활용한 문자인식 기능과 개인정보 검출 기능을 통합적으로 수행 한하여 기존 OCR엔진과의 차별점을 두었다. 또한 원하는 경로의 파일 탐색을 가능하도록 하고, 선택한 경로에 저장되어 있는 이미지파일 내의 검출 문자들을 정규표현식을 사용해 특정한 개인정보 패턴과 매칭하여 문서 내 포함된 개인정보를 반환하여 출력한다. 이러한 개인정보 검출 결과 중요 개인정보가 포함된 파일을 사용자에게 별도로 통보하도록 한다. 따라서 본 논문에서는 기존의 개인정보 검출 과정의 번거로움을 극복하여 사용자의 편의 향상과 더불어 문서를 통한 개인정보의 유출을 사전에 방지 할 수 있도록 하였다.

  • PDF

An Index Data Structure for String Search in External Memory (외부 메모리에서 문자열을 효율적으로 탐색하기 위한 인덱스 자료 구조)

  • Na, Joong-Chae;Park, Kun-Soo
    • Journal of KIISE:Computer Systems and Theory
    • /
    • v.32 no.11_12
    • /
    • pp.598-607
    • /
    • 2005
  • We propose a new external-memory index data structure, the Suffix B-tree. The Suffix B-tree is a B-tree in which the key is a string like the String B-tree. While the node in the String B-tree is implemented with a Patricia trio, the node in the Suffix B-tree is implemented with an array. So the Suffix B-tree is simpler and easier to be Implemented than the String B-tree. Nevertheless, the branching algorithm of the Suffix B-tree is as efficient as that of the String B-tree. Consequently, the Suffix B-tree takes the same worst-case disk accesses as the String B-tree to solve the string matching problem, which is fundamental and important in the area of string algorithms.

A Study on the Integrated Coding of Image and Document Data (영상과 문자정보의 통합 부호화에 관한 연구)

  • Lee, Huen-Joo;Park, Goo-Man;Park, Kyu-Tae
    • Journal of the Korean Institute of Telematics and Electronics
    • /
    • v.26 no.7
    • /
    • pp.42-49
    • /
    • 1989
  • A new integrated coding method is proposed in this study for embedding the text information including Hangul into an image. A monochrome analog image may be quantized to a few leveled digital image and be displayed on bi-leveled output devices by using halftone processing techniques. Text data are embedded on each micro pattern. Based on this concept, the encoding and the decoding algorithm are implemented and experiments are performed. As a result, the average amount of the embedded text information is more than 8 bpp (bits per pixer) in this halftone processed image converted form a $64{\times}64$ image, i.e, corresponding to 2000 characters in Hangul, or 4000 characters in alphanumeral. using this algorithm, the integrated personal record management system is implemented.

  • PDF

Fast Handwriting Recognition Using Model Graph (모델 그래프를 이용한 빠른 필기 인식 방법)

  • Oh, Se-Chang
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.16 no.5
    • /
    • pp.892-898
    • /
    • 2012
  • Rough classification methods are used to improving the recognition speed in many character recognition problems. In this case, some irreversible result can occur by an error in rough classification. Methods for duplicating each model in several classes are used in order to reduce this risk. But the errors by rough classfication can not be completely ruled out by these methods. In this paper, an recognition method is proposed to increase speed that matches models selectively without any increase in error. This method constructs a model graph using similarity between models. Then a search process begins from a particular point in the model graph. In this process, matching of unnecessary models are reduced that are not similar to the input pattern. In this paper, the proposed method is applied to the recognition problem of handwriting numbers and upper/lower cases of English alphabets. In the experiments, the proposed method was compared with the basic method that matches all models with input pattern. As a result, the same recognition rate, which has shown as the basic method, was obtained by controlling the out-degree of the model graph and the number of maintaining candidates during the search process thereby being increased the recognition speed to 2.45 times.

A Study on Extraction of text region using shape analysis of text in natural scene image (자연영상에서 문자의 형태 분석을 이용한 문자영역 추출에 관한 연구)

  • Yang, Jae-Ho;Han, Hyun-Ho;Kim, Ki-Bong;Lee, Sang-Hun
    • Journal of the Korea Convergence Society
    • /
    • v.9 no.11
    • /
    • pp.61-68
    • /
    • 2018
  • In this paper, we propose a method of character detection by analyzing image enhancement and character type to detect characters in natural images that can be acquired in everyday life. The proposed method emphasizes the boundaries of the object part using the unsharp mask in order to improve the detection rate of the area to be recognized as a character in a natural image. By using the boundary of the enhanced object, the character candidate region of the image is detected using Maximal Stable Extermal Regions (MSER). In order to detect the region to be judged as a real character in the detected character candidate region, the shape of each region is analyzed and the non-character region other than the region having the character characteristic is removed to increase the detection rate of the actual character region. In order to compare the objective test of this paper, we compare the detection rate and the accuracy of the character region with the existing methods. Experimental results show that the proposed method improves the detection rate and accuracy of the character region over the existing character detection method.

Enhancement of English-to-Korean Translation Quality by Korean Style Generation Patterns (한국어 스타일 생성 패턴에 의한 영한 번역 품질 개선)

  • Choi, Sung-Kwon;Hong, Mun-Pyo;Park, Sang-Kyu
    • Annual Conference on Human and Language Technology
    • /
    • 2003.10d
    • /
    • pp.235-240
    • /
    • 2003
  • 본 논문에서는 영한 자동번역 시스템에 한국어 스타일 생성 패턴을 적용함으로써 영한 번역 품질을 향상하고자 하는 것이 목표이다. 이러한 목표는 기존의 원문에 대한 번역문의 정보 전달 정확성을 측정하는 1차원적인 번역률 평가 방법에서 벗어나 번역문의 정보 정확성뿐만 아니라 자연스러움도 평가할 수 있는 2차원적인 번역률 평가방법으로써 정확성과 스타일을 동시에 평가하는 방법을 제안한다. 2차원적인 번역률 평가 방법에 따라 스타일 생성 패턴이 적용되기 전과 적용된 후의 평가 결과는 100문자의 샘플문을 대상으로 하였을 때, 스타일 생성 패턴에 의해서만 0.5%의 번역률이 향상되는 것을 관찰하였다. 본 논문에서의 스타일 생성 패턴은 단순히 언어간 스타일 차이만 적용한 것이며 향후에는 신문, 일기예보, 기술 매뉴얼과 같은 특정 그룹을 위한 스타일 생성 패턴을 적용할 계획이다.

  • PDF

A Vehicle License Plate Recognition Using Intensity Variation and Geometric Pattern Vector (명암도 변화값과 기하학적 패턴벡터를 이용한 차량번호판 인식)

  • Lee, Eung-Ju;Seok, Yeong-Su
    • The KIPS Transactions:PartB
    • /
    • v.9B no.3
    • /
    • pp.369-374
    • /
    • 2002
  • In this paper, we propose the react-time car license plate recognition algorithm using intensity variation and geometric pattern vector. Generally, difference of car license plate region between character and background is more noticeable than other regions. And also, car license plate region usually shows high density values as well as constant intensity variations. Based on these characteristics, we first extract car license plate region using intensity variations. Secondly, lightness compensation process is performed on the considerably dark and brightness input images to acquire constant extraction efficiency. In the proposed recognition step, we first pre-process noise reduction and thinning steps. And also, we use geometric pattern vector to extract features which independent on the size, translation, and rotation of input values. In the experimental results, the proposed method shows better computation times than conventional circular pattern vector and better extraction results regardless of irregular environment lighting conditions as well as noise, size, and location of plate.

A Method of Detecting Car Number Plate Using Local Intensity Contrast (국부적 명암도 대비를 이용한 자동차 번호판 검출 기법)

  • Kim, Jae-Do;Han, Young-Joon;Hahn, Hern-Soo
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2009.01a
    • /
    • pp.181-184
    • /
    • 2009
  • 본 논문은 번호판 내 명암도 대비를 이용한 자동차 번호판 검출 기법을 제안한다. 평균값 필터와 라플라시안 필터를 사용하여 영상의 잡음을 제거하는 동시에 에지 성분을 향상시킨 후 조명 환경 변화에 강인한 번호판 내 명암도 대비 특징을 이용하여 문자 후보를 검출한다. 다음으로 검출된 문자 후보가 열을 이루는 텍스트 후보를 검출하고, 이 영역을 Otsu 이진화 기업을 사용하여 x축에 투영하였을 시 나타나는 패턴을 평가함으로써 최종적으로 자동차 번호판을 검출하게 된다. 제안하는 기법의 성능을 평가하기 위해 다수의 데이터를 사용하여 실험하였고, 이를 분석하여 제안하는 기법의 우수성을 검증하였다.

  • PDF

Shape Analysis and Representation of Handwritten Hangul Characters (필기 한글 문자의 모양 분석과 표현)

  • Hong, Ki-Cheon;Oh, Il-Seok
    • The Transactions of the Korea Information Processing Society
    • /
    • v.7 no.5
    • /
    • pp.1579-1586
    • /
    • 2000
  • This paper propose a method of shape analysis and representation for the handwritten Hangul character patterns. Each of the connected components composing a Hangul character is decomposed into many parts, and skeletons are extracted from the decomposed parts. Using the results, we represent the shape of Hangul characters using the attributed graph representation. A node of the attributed graph represents a part and an edge represents their relationships and they store valuable informations of the pattern shapes.

  • PDF

A Study on Enhancement of Handwritten Character Image using Binary Watershed Algorithm (Binary Watershed Algorithm을 이용한 필기체 문자 영상 향상에 관한 연구)

  • 이호준;최영규;이상범
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.400-402
    • /
    • 2001
  • 오프라인 필기체 한글 문자인식에서 대부분의 연구들은 영상획득 장비로부터 얻어진 이진영상(Binary image)을 바탕으로 이루어진다. 이 과정 중 영상에 잡음이나 영상패턴의 훼손을 가져오는 경우가 많다. 획이 끊기거나 영상 내 홀(holes)이 발생한 경우 인식에 많은 질적인 문제를 가져온다. 오프라인 필기체 한글 문자인식 과정 중 영상 내 골격을 추출하는 연구는 아직도 많은 난제를 가지고 있다. 또한 골격추출과정은 인식에 많은 영향을 준다. 잡영이 포함된 영상은 잘못된 골격선 추출에 기인한다. 본 논문에 사용된 Binary Watershed Algorithm은 잡영이 포함된 영상개선에 사용하였고, 이 Algorithm은 많은 다양성을 가지고 있어 여러 분야의 응용에 사용되어지고 있다. 본 논문은 이러한 잡영이 포함된 영상의 개선을 통해 기존의 Morphological 세선화 방법과 Zang-Suen 세선화 방법을 통해 골격선 추출을 평가하였다. 여기에는 아직도 자소의 교차 획에 있어서 효과적인 골격선을 추출하는 문제를 가지고 있다.

  • PDF