• 제목/요약/키워드: Character Extraction

검색결과 303건 처리시간 0.025초

몽타주 기법과 음영합성 기법을 이용한 벡터기반 얼굴 생성 (Vector-based Face Generation using Montage and Shading Method)

  • 박연출;오해석
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권6호
    • /
    • pp.817-828
    • /
    • 2004
  • 본 논문에서는 몽타주 기법과 음영합성 기법을 이용한, 디자이너(예술가)의 감각을 살린 벡터 기반의 얼굴 생성 시스템을 제안한다. 제안하는 시스템은 사진으로부터 얼굴의 특징정보를 추출하여 사람의 얼굴과 유사한 얼굴을 자동으로 생성해 주는 시스템이며, 윤곽선만을 사용하던 기존의 얼굴 생성 시스템과 달리 컬러 기반이며, 음영을 사진으로부터 추출하여 이를 이목구비 이미지와 합성하여 생성하는 방식이다. 따라서 실사형에 좀 더 근접한 얼굴을 생성할 수 있다는 장점을 갖는다. 또, 벡터를 기반으로 하기 때문에 사이즈에 제한 얼이 자유로운 변형이 가능할 뿐만 아니라 디자이너 또는 그림 작가의 느낌을 결과물에 그대로 유지할 수 있도록 한다는 점에서 타 접근방식과의 차별성을 갖는다. 또, 2D 아바타에 자유로운 표정을 적용하는 데에도 쉽게 적용이 가능하다.

안면근 신호를 이용한 최소 자판 문자 입력 시스템의 개발 (Development of Character Input System using Facial Muscle Signal and Minimum List Keyboard)

  • 김홍현;김응수
    • 한국정보통신학회논문지
    • /
    • 제14권6호
    • /
    • pp.1338-1344
    • /
    • 2010
  • 사람은 주로 언어를 통해 서로간의 의사를 표현한다. 하지만, 말을 할 수 없는 중증 장애인, 특히 전신마비 증세가 있는 중증 장애인의 경우에는 글을 쓰거나 몸짓을 통한 방법으로도 자신의 의사를 효과적으로 전달하지 못한다는 문제점이 있다. 따라서 본 논문에서는 이러한 중증 장애인이 의사소통을 할 수 있도록 안면근 신호를 이용한 의사 전달기를 구현하였다. 특히, 안면근 신호가 포함된 뇌파의 특징을 추출하여 이를 일반적인 제어 신호로써 변환한 다음, 이 제어 신호와 최소한의 자판을 연동시켜 문자를 선택하도록 함으로써, 중증 장애인이 효과적으로 의사를 전달할 수 있도록 하였다.

최적화된 특정 영역을 이용한 스케치 기반 영상 검색 시스템 (Sketch-based Image Retrieval System using Optimized Specific Region)

  • 고광훈;김낙우;김태은;최종수
    • 한국통신학회논문지
    • /
    • 제30권8C호
    • /
    • pp.783-792
    • /
    • 2005
  • 본 논문은 애니메이션 캐릭터를 대상으로 한 스케치 기반 영상 검색의 특징 추출 방법을 제안한다. 우리는 특징 영역의 추출을 위해서 영상에서의 장면 전환 검출 기법, 프레임 사이의 대응점 검출 기법 및 애니메이션 제작과정의 특성을 이용한다. 추출된 특징 영역에서 유사한 색상들이 집중된 영역들을 검출한다. 각 영역들의 색상, 크기 그리고 영역간의 관계로 영상 검색을 위한 특징으로 사용한다. 최종적으로 애니메이션 제작 특성과 사용자의 스케치를 질의 영상으로 사용하여 유사한 캐릭터를 검색한다.

Multi-National Integrated Car-License Plate Recognition System Using Geometrical Feature and Hybrid Pattern Vector

  • Lee, Su-Hyun;Seok, Young-Soo;Lee, Eung-Joo
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 ITC-CSCC -2
    • /
    • pp.1256-1259
    • /
    • 2002
  • In this paper, we have proposed license plate recognition system for multi-national vehicle license plate using geometric features along with hybrid and seven segment pattern vectors. In the proposed system, we suggested to find horizontal and vertical relation after going through preparation process with inputted real-time license plate image of Korea and Japan, and then to classify license plate with using characteristic and geometric information of license plates. It classifies the extracted license plate images into letters and numbers, such as local name, local number, classification character and license consecutive numbers, and recognize license plate of Korea and Japan by applying hybrid and seven segments pattern vectors to classified letter and number region. License plate extraction step of the proposed system uses width and length information along with relative rate of Korean and Japanese license plate. Moreover, it exactly segmentation by letters with using each letter and number position information within license plate region, and recognizes Korean and Japanese license plates by applying hybrid and seven segment pattern vectors, containing characteristics related to letter size and movement within segmented letter area. As the result of testing the proposed system in real experiment, it recognized regardless of external lighting conditions as well as classifying license plates by nations, Korea and Japan. We have developed a system, recognizing regardless of inputted structural character of vehicle licenses and external environment.

  • PDF

Correction of Signboard Distortion by Vertical Stroke Estimation

  • Lim, Jun Sik;Na, In Seop;Kim, Soo Hyung
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제7권9호
    • /
    • pp.2312-2325
    • /
    • 2013
  • In this paper, we propose a preprocessing method that it is to correct the distortion of text area in Korean signboard images as a preprocessing step to improve character recognition. Distorted perspective in recognizing of Korean signboard text may cause of the low recognition rate. The proposed method consists of four main steps and eight sub-steps: main step consists of potential vertical components detection, vertical components detection, text-boundary estimation and distortion correction. First, potential vertical line components detection consists of four steps, including edge detection for each connected component, pixel distance normalization in the edge, dominant-point detection in the edge and removal of horizontal components. Second, vertical line components detection is composed of removal of diagonal components and extraction of vertical line components. Third, the outline estimation step is composed of the left and right boundary line detection. Finally, distortion of the text image is corrected by bilinear transformation based on the estimated outline. We compared the changes in recognition rates of OCR before and after applying the proposed algorithm. The recognition rate of the distortion corrected signboard images is 29.63% and 21.9% higher at the character and the text unit than those of the original images.

Development of a Low-cost Industrial OCR System with an End-to-end Deep Learning Technology

  • Subedi, Bharat;Yunusov, Jahongir;Gaybulayev, Abdulaziz;Kim, Tae-Hyong
    • 대한임베디드공학회논문지
    • /
    • 제15권2호
    • /
    • pp.51-60
    • /
    • 2020
  • Optical character recognition (OCR) has been studied for decades because it is very useful in a variety of places. Nowadays, OCR's performance has improved significantly due to outstanding deep learning technology. Thus, there is an increasing demand for commercial-grade but affordable OCR systems. We have developed a low-cost, high-performance OCR system for the industry with the cheapest embedded developer kit that supports GPU acceleration. To achieve high accuracy for industrial use on limited computing resources, we chose a state-of-the-art text recognition algorithm that uses an end-to-end deep learning network as a baseline model. The model was then improved by replacing the feature extraction network with the best one suited to our conditions. Among the various candidate networks, EfficientNet-B3 has shown the best performance: excellent recognition accuracy with relatively low memory consumption. Besides, we have optimized the model written in TensorFlow's Python API using TensorFlow-TensorRT integration and TensorFlow's C++ API, respectively.

신경회로망과 기억이론에 기반한 한글영상 인식과 복원 (The Hangeul image's recognition and restoration based on Neural Network and Memory Theory)

  • 장재혁;박중양;박재홍
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권4호
    • /
    • pp.17-27
    • /
    • 2005
  • 본 논문에서는 문자인식과 복원을 위한 신경회로망 시스템을 제안한다. 제안하는 시스템은 인식부와 연상부로 구성되었다. 인식부에서는 ART 신경회로망의 인식성능을 개선하기 위해 불필요한 하향틀의 생성과 변화를 제한하여 효과적인 패턴인식이 가능한 모델을 제안하였다. 또한, 한글의 구조적인 특징을 능동적으로 적용할 수 있게 구성된 위치특징 추출 알고리즘을 적용하였다. 연상부에서는 Hopfield 신경회로망으로, 입력된 이미지 패턴의 복원이 가능한 모델을 구성하였다. 제안하는 시스템은 그 성능을 확인하기 위해 각 부분별 실험을 하였다. 그 결과 인식율이 개선되고 복원이 가능함을 보였다.

  • PDF

OCR 엔진 기반 분류기 애드온 결합을 통한 이미지 내부 텍스트 인식 성능 향상 (Scene Text Recognition Performance Improvement through an Add-on of an OCR based Classifier)

  • 채호열;석호식
    • 전기전자학회논문지
    • /
    • 제24권4호
    • /
    • pp.1086-1092
    • /
    • 2020
  • 일상 환경에서 동작하는 자율 에이전트를 구현하기 위해서는 이미지나 객체에 존재하는 텍스트를 인식하는 기능이 필수적이다. 주어진 이미지에 입력 변환, 특성 인식, 워드 예측을 적용하여 인식된 텍스트에 존재하는 워드를 출력하는 과정에 다양한 딥러닝 모델이 활용되고 있으며, 딥뉴럴넷의 놀라운 객체 인식 능력으로 인식 성능이 매우 향상되었지만 실제 환경에 적용하기에는 아직 부족한 점이 많다. 본 논문에서는 인식 성능 향상을 위하여 텍스트 존재 영역 감지, 텍스트 인식, 워드 예측의 파이프라인에 OCR 엔진과 분류기로 구성된 애드온을 추가하여 기존 파이프라인이 인식하지 못한 텍스트의 인식을 시도하는 접근법을 제안한다. IC13, IC15의 데이터 셋에 제안 방법을 적용한 결과, 문자 단위에서 기존 파이프라인이 인식하는데 실패한 문자의 최대 10.92%를 인식함을 확인하였다.

SEL-RefineMask: A Seal Segmentation and Recognition Neural Network with SEL-FPN

  • Dun, Ze-dong;Chen, Jian-yu;Qu, Mei-xia;Jiang, Bin
    • Journal of Information Processing Systems
    • /
    • 제18권3호
    • /
    • pp.411-427
    • /
    • 2022
  • Digging historical and cultural information from seals in ancient books is of great significance. However, ancient Chinese seal samples are scarce and carving methods are diverse, and traditional digital image processing methods based on greyscale have difficulty achieving superior segmentation and recognition performance. Recently, some deep learning algorithms have been proposed to address this problem; however, current neural networks are difficult to train owing to the lack of datasets. To solve the afore-mentioned problems, we proposed an SEL-RefineMask which combines selector of feature pyramid network (SEL-FPN) with RefineMask to segment and recognize seals. We designed an SEL-FPN to intelligently select a specific layer which represents different scales in the FPN and reduces the number of anchor frames. We performed experiments on some instance segmentation networks as the baseline method, and the top-1 segmentation result of 64.93% is 5.73% higher than that of humans. The top-1 result of the SEL-RefineMask network reached 67.96% which surpassed the baseline results. After segmentation, a vision transformer was used to recognize the segmentation output, and the accuracy reached 91%. Furthermore, a dataset of seals in ancient Chinese books (SACB) for segmentation and small seal font (SSF) for recognition were established which are publicly available on the website.

차량번호판 색상모델에 의한 번호판 영역분할 알고리즘 (An Algorithm for Segmenting the License Plate Region of a Vehicle Using a Color Model)

  • 전영민;차정희
    • 전자공학회논문지CI
    • /
    • 제43권2호
    • /
    • pp.21-32
    • /
    • 2006
  • 번호판인식은 번호판 영역분할, 개별문자 추출, 문자 인식의 세 가지 핵심부분으로 구성된다. 이 가운데 번호판 영역분할의 정확성은 전체 인식률을 결정한다. 본 논문에서는 다양한 도로주변 환경을 고려해야하는 불법주정차 무인단속 현장으로부터 획득된 영상에서 차량의 번호판 영역을 정확하고 빠르게 분할하는 방법을 제안한다. 접근방법은 현장영상으로부터 번호판영역의 분할성능을 높이기 위하여 번호판색상의 수학적 모델을 제시하고, 이를 이용한 이진화를 수행하며, Gaussian Smoothing과 Double Threshold을 이용한 잡영제거, 1-패스 경계추적 레이블링 및 레이블링 이후 MBR을 이용한 번호판 영역후보 판정과 판정된 번호판 영역후보에서 개별문자 추출을 통한 번호판영역 검증과정을 통해 최종적으로 번호판영역을 분할하는 방법이다. 본 연구는 기존방법의 번호판 테두리 훼손에 따른 번호판 영역분할 실패의 문제점을 해결하고 시간소요의 문제를 실시간 안에 처리함으로서 실용적 응용이 가능하게 되었다.