• Title/Summary/Keyword: 문자패턴

Search Result 297, Processing Time 0.022 seconds

Spam Text Filtering by Using Sen2Vec and Feedforward Neural Network (문장 벡터와 전방향 신경망을 이용한 스팸 문자 필터링)

  • Lee, Hyun-Young;Kang, Seung-Shik
    • 한국어정보학회:학술대회논문집
    • /
    • 2017.10a
    • /
    • pp.255-259
    • /
    • 2017
  • 스팸 문자 메시지를 표현하는 한국어의 단어 구성이나 패턴은 점점 더 지능화되고 다양해지고 있다. 본 논문에서는 이러한 한국어 문자 메시지에 대해 단어 임베딩 기법으로 문장 벡터를 구성하여 인공신경망의 일종인 전방향 신경망(Feedforward Neural Network)을 이용한 스팸 문자 메시지 필터링 방법을 제안한다. 전방향 신경망을 이용한 방법의 성능을 평가하기 위하여 기존의 스팸 문자 메시지 필터링에 보편적으로 사용되고 있는 SVM light를 이용한 스팸 문자 메시지 필터링의 정확도를 비교하였다. 학습 및 성능 평가를 위하여 약 10만 개의 SMS 문자 데이터로 학습을 진행하였고, 약 1만 개의 실험 데이터에 대하여 스팸 문자 필터링의 정확도를 평가하였다.

  • PDF

Feature Classification of Hanguel Patterns by Distance Transformation method (거리변환법에 의한 한글패턴의 특징분류)

  • Koh, Chan;Lee, Dai-Young
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.14 no.6
    • /
    • pp.650-662
    • /
    • 1989
  • In this paper, a new algorithm for feature extraction and classification of recognizing Hanguel patterns is proposed. Inputed patterns classify into six basic formal patterns and divided into subregion of Hanguel phoneme and extract the crook feature from position information of the each subregion. Hanguel patterns are defined and are made of the indexed-sequence file using these crook features points. Hanguel patterns are recognized by retrievignt ehses two files such as feature indexed-sequence file and standard dictionary file. Thi paper show that the algorithm is very simple and easily construct the software system. Experimental result presents the output of feature extraction and grouping of input patterns. Proposed algorithm extract the crooked feature using distance transformation method within the rectangle of enclosure the characters. That uses the informationof relative position feature. It represents the 97% of recognition ratio.

  • PDF

Size Transformation of Character Pattern (문자 패턴의 크기변환)

  • 이수연
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.11 no.2
    • /
    • pp.85-92
    • /
    • 1986
  • Hangeul wordprocessor, workstation and I/O device for telematic service are requiring many kinds of characters with various attributes such as size and font. In this paper, we survey computer algorithm that have been studied to transform(reduction, enlargement) built-in character patterns into character patterns with different sizes. Also, evaluation cirteria for such algorithms are mentioned.

  • PDF

A Study on Trend of Character Recognition Technological (문자 인식 기술의 동향 연구)

  • 김영은;조범준
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2004.05b
    • /
    • pp.612-615
    • /
    • 2004
  • This paper presents the trend of character recognition technology through uniting recently announced researches and also this paper can help researches to set their research direction. Range of the investigation is limited to general tendency of character recognition technology of research institution and business, and this paper presents forward research direction.

  • PDF

A Study on Type Classification and Recognition Using Structural Information in Character Pattern of HANGEUL Shape (한글 Shape 문자 Pattern에서의 구조적 정보를 이용한 형식분류와 인식 관한 연구)

  • 전종익;조용주;남궁재찬
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.16 no.2
    • /
    • pp.180-195
    • /
    • 1991
  • In this paper, we studied on new method of recognition using structural information to recognize character pattern in orginal shape of Hangeul. First, for the purpose of knowing location of character in input image. it processed Making block. Second, after we investigated. whether vertical vowel exited or not in character image accordingly the center of gravity of Hangeul. each character was classified into Type of Hangeul by searching location and length for horizontal vowel and short pole. Last, we processed it by means of template matching which calculate Uclid's distance on each Jaso in accordance to type classified. This paper made an experiment on 2350 characters and obtained 98.3% classifing rate and 95.2% recognizing rate.

  • PDF

Online Character Recognition Technique Using PCA (PCA를 이용한 온라인 문자인식 기법)

  • Yoo Jae-Man;Kim Woo-Saeng;Han Jeong-Hoon
    • Journal of Korea Multimedia Society
    • /
    • v.9 no.4
    • /
    • pp.414-420
    • /
    • 2006
  • Online character recognition techniques have been applied in many new fields of PDA, Tablet PC etc. But the recognition techniques can not use such high technologies naturally yet. Hidden Markov Model (HMM) that is much used recently requires high memory space and complex computational tasks because of comparing the input data with entire standard patterns. In this paper we propose a method to recognize the online characters more efficiently. At first we create chain-codes of learning data and recognition data in preprocessing phase, and then we compress dimensions of data using Principal Component Analysis (PCA) and recognize a character compressed data in recognition phrase. Validity of proposed method .is verified. by experiment results.

  • PDF

Structure-Adaptive Self-Organizing Neural Network : Application to Hangul Character Recognition (구조적응 자기조직화 신경망 : 한글 문자인식에의 적용)

  • Lee, Kyoung-Mi;Cho, Sung-Bae;Lee, Yill-Byung
    • Annual Conference on Human and Language Technology
    • /
    • 1995.10a
    • /
    • pp.137-142
    • /
    • 1995
  • 코호넨의 SOFM(Self-Organizing Feature Map)온 빠른 검증 학습이 가능하여 다층 퍼셉트론의 단점을 보완할 수 있는 패턴분류기로 부각되고 있다. 그러나 기본적으로 고정된 크기와 구조의 네트워크를 사용하기 때문에 실재 문제에 적용하기가 쉽지 않다는 문제가 있다. 본 논문에서는 패턴에 대한 사전 정보없이 복잡한 패턴공간을 적응적으로 분할하기 위해 구조적응되는 자기조직화 신경망을 소개하고 이를 인쇄체 한글 문자의 인식에 적용한 결과를 보여준다. 여기에서 제안하는 신경망은 SOFM의 각 셀이 좀더 자세한 SOFM으로 확장될 수 있도록하며, 확률분포가 0인 셀을 제거함으로써 패턴 공간에 보다 근사한 분류를 가능하게 한다. 실제로 이러한 방식이 한글과 같은 복잡한 분류 문제에서 어떻게 작동하는지 설명하고, 한글 완성형 2350자에 대해 실험한 결과를 보여준다.

  • PDF

The Study for the Recognition System of Finger Languages (자화 인식 시스템에 관한 연구)

  • 강민지;최은숙;손영선
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2003.09b
    • /
    • pp.151-154
    • /
    • 2003
  • 본 논문에서는 흑백 CCD 카메라를 이용하여 청각 장애인의 의사전달 수단인 지화 동작을 동영상으로 입력받아 인식하여, 편집 가능한 텍스트 문서로 변환하는 시스템을 구현하였다. 일련의 입력 영상들 중에서 흐린 영상과 선명한 영상의 구분은 영상의 잔상을 이용하였고, 촬영된 연속 영상들의 배열로부터 문자 자소를 구하고, 오토마타를 적용하여 완성된 문자를 문서 편집기에 출력시켰다 획득된 선명한 영상 데이터 중 변화가 심한 손목 부분을 제거한 후, 최대 원형 이동법을 이용하여 손의 무게 중심점을 구하고, 원형 패턴 벡터 알고리즘을 적용하여 지화 해석에 필요한 손을 인식하였다. 손 중심으로부터 거리 스펙트럼을 이용하여 지화 인식에 사용되는 손 모양의 특징 벡터를 추출하고, 퍼지추론을 적용하여 표준 패턴과 입력 패턴의 특징벡터를 비교, 지화 동작을 인식하였다.

  • PDF

Car License Plate Extraction and Recognition Using Vertical/Horizontal Intensity Variation and Circular Pattern Vector (수직 및 수평 명암도 변화값과 원형 패턴벡터를 이용한 차량번호판 추출 및 인식 알고리즘)

    • The KIPS Transactions:PartB
    • /
    • v.8B no.2
    • /
    • pp.195-200
    • /
    • 2001
  • 본 논문에서는 실제 입력 차량 영상으로부터 명암도 변화 정보와 원형 패턴 벡터를 이용하여 차량 번호판을 인식하는 알고리즘을 제안하였다. 일반적으로 차량 영상에서는 번호판 영역에서 문자와 배경이 뚜렷하게 구별되고, 일정한 명암도 변화를 가지면서 번호판 이외의 다른 영역 보다 빌집도가 높은 특성이 있다. 따라서 본 논문에서는 이러한 성질을 이용하여 먼저 명암도 변화값을 사용하여 번호판을 추출하도록 하였으며 영상 입력 과정에서 외부 환경에 따라 차량 영상이 어둡거나 밝게 입력될 경우에도 동일한 추출 성능을 얻기 위하여 밝기 보정 과정을 수행하였다. 또한 추출된 번호판 영역으로부터 입력 문자의 크기, 이동 및 회전에 무관한 특성 추출을 위해 원형 패턴 벡터를 이용하여 차량 번호를 인식하도록 하였다. 제안한 알고리즘을 적용한 결과 번호판 추출이 가능하였으며 기존의 방법에 비해 계산 속도가 향상되어 실시간 처리의 가능성을 제시하였다.

  • PDF

The real-time color pattern recognition system using an SLM and photorefractive crystal(LiNbO$_3$) (SLM과 광굴절 결정(LiNbO$_3$)을 이용하여 실현된 실시간 칼라 패턴인식 시스템)

  • Yun, Jin-Sun;Kim, Nam
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.27 no.3B
    • /
    • pp.267-274
    • /
    • 2002
  • In this paper, the real-time color pattern recognition system is experimented by optical approach using the SLM(TH LCD) and a photorefractive material. In the implemented system, the character patterns to recognize are controlled of an SLM, and a 10mm thick LiNbO$_3$ crystal having high angular selectivity and photorefractive effect is used for recording materials. The shape and color informations of the red or green color patterns are excellently discriminated at independent positions by real-time processing, as the results obtained by proposed optical architecture.