• 제목/요약/키워드: 문자패턴

검색결과 297건 처리시간 0.03초

문자인식을 위한 불 전파와 WPTA 알고리즘에 의한 세선화 알고리즘 (A Thinning Algorithm by the Fire Front' Propagation and WPTA Algorithm for the Character Recognition)

  • 원남식;남인길
    • 한국산업정보학회논문지
    • /
    • 제9권1호
    • /
    • pp.63-68
    • /
    • 2004
  • 본 논문은 다양한 문자 인식에 적용하기 위한 불 전파와 WPTA 알고리즘을 이용한 세선화 알고리즘에 관한 연구이다. 제안된 알고리즘은 각 화소의 깊이 값을 나타내는 깊이정보를 이용하여 원래의 패턴에 매우 유사한 문자의 골격선을 추출할 수 있다. 본 논문에서는 새로운 세선화 알고리즘을 제안하였고, 구현한 후, 수행 결과를 나타내었다.

  • PDF

인지이론과 ART 신경회로망에 기반한 한글 문자 분류 모델 (Hangeul Character Classification Model Based on Cognitive Theory and ART Neural Network)

  • 박중양;박재흥;장재혁
    • 한국콘텐츠학회논문지
    • /
    • 제5권5호
    • /
    • pp.33-42
    • /
    • 2005
  • 본 논문에서는 ART 신경회로망의 성능을 개선하기 위해, 불필요한 클러스터의 생성과 변화를 억제하여 효율적인 패턴 분류가 가능하도록 하는 학습 알고리즘을 제안한다. 또한, 패턴 분류의 정확성을 향상시키기 위해 한글의 구조적 특징을 이용한 위치추출 알고리즘을 적용하였다. 제안하는 학습 알고리즘은 현재 학습되는 패턴과 최초 패턴간의 일치도를 비교한 후 리세트 시스템을 작동케 한다. 그 결과, 신경회로 망은 이미 입력되었던 패턴이 다시 입력되어도 새로운 클러스터의 생성을 방지하여 오인식율을 줄이게 된다.

  • PDF

메타 검색엔진을 위한 페이지 변경 탐지기 설계 (Design of A Page Modification Detector for Meta-search Engines)

  • 박상위;오정석;이상호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.205-207
    • /
    • 2001
  • 웹 상의 HTML 문서들은 수시로 변경되고 있으며, 정보를 검색하는 웹사이트 또한 예외는 아니다. 다수의 웹 검색엔진들의 결과를 통합하는 메타 검색엔진은 각 검색엔진의 정보 변경에 민감해야 된다. 본 논문은, 수시로 변경되는 검색엔진들의 HTML 문서 정보를 메타 검색 엔진에 반영하기 위해, 자동적으로 검색엔진들의 질의 형태 변경과 검색 엔진의 검색 결과 HTML 문서의 구조 변경 탐지는 질의 결과가 반복되는 HTML 태그(tags) 문서 구조를 패턴(pattern)으로 이용한다. 패턴 발견 알고리즘은 문자열에서 규칙적으로 발생하는 패턴을 찾아내는 Jaak Vilo 알고리즘을 기반으로 HTML 문서를 처리할 수 있도록 확장하였다. 발견된 HTML 문서 패턴과 기존의 검색 엔진 HTML 페이지의 구조적 패턴 정보를 비교하여 문서 구조 변경을 탐지한다.

  • PDF

그래프 이론에 의한 패턴인식에 관한 연구 (A Study on Pattern Recognition using Graph Theory)

  • 허정연;김정종
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2009년도 춘계학술발표논문집
    • /
    • pp.722-725
    • /
    • 2009
  • 본 논문에서는 문자인식, 손등 정맥 인식 등에 이용할 수 있는 패턴인식 기법으로 입력된 패턴을 전 처리하여 세선화한 후 유일성이 보장되는 행렬로 변환하는 방법에 관하여 연구 하였다. 입력된 패턴을 세선화 한 후 노드 중심으로 노드에 연결된 에지의 체인 코드와 유크리디안 거리를 노드를 중심으로 가중치와 체인코드를 이용한 행렬을 생성하고, 생성된 행렬의 고유치를 이용하여 인식의 기본 도구로 사용하였다. 이 때 연결된 에지의 방향 코드는 설정된 문턱치 값을 초과하는 변곡에 대하여 새로운 노드를 생성하였다. 이러한 방법을 손등 정맥 패턴 인식에 적용한 결과 인식률이 매우 우수함을 확인할 수 있었다.

  • PDF

마이크로.프로세서를 이용한 한글문자 입출력시스템 (A HANGEUL Character Input Output Terminal Controlled by Microprocessor)

  • 강철희
    • 대한전자공학회논문지
    • /
    • 제15권2호
    • /
    • pp.8-14
    • /
    • 1978
  • 33자의 한글 기본자소(자소)의 크기를 가변시키면서, 9종류의 합성 패턴중에 해당되는 패턴을 찾아 내어 한자를 구성하는 프로세스를 마이크로 프로셋서를 사용하여 실현시킬 때의 제반문제들에 관해 논하고 있다.

  • PDF

키스트로크 다이나믹스 분석을 이용한 모바일 사용자 인증 (Mobile User Authentication using Keystroke Dynamics Analysis)

  • 황성섭;조성준;박성훈
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 2006년도 추계학술대회
    • /
    • pp.652-655
    • /
    • 2006
  • 최근 핸드폰 같은 휴대용 단말기의 용도는 통화 이외에도 예금, 증권, 결제, 신원확인 등과 같은 다양한 어플리케이션으로 발전하고 있다. 본 논문에서는 키스트로크 기반의 사용자 인증을 이용한 모바일 보안강화 방안에 대하여 논의한다. 키스트로크 다이나믹스 패턴분석은 사용자가 특정 문자열을 타이핑할 때의 입력 패턴을 고려한 분석 방법이다. 본 연구는 휴대단말기의 짧은 암호사용의 문제점을 극복하기 위하여 인공리듬과 템포 큐를 활용하였으며, 높은 분류 성능을 보여주었다.

  • PDF

HDLC(High-level Data Link Control) 프로토콜에서 효율적 문자부호 전송을 위한 문자부호화 규칙 (Composition Rule of Character Codes to efficiently transmit the Character Code in HDLC(High-level Data Link Control) Protocol)

  • 홍완표
    • 한국전자통신학회논문지
    • /
    • 제7권4호
    • /
    • pp.753-760
    • /
    • 2012
  • 본 논문은 데이터 통신의 전송효율 측면에서 OSI 표현계층에서 수행되는 문자의 원천부호화에 대하여 연구하였다. 데이터링크 계층의 HDLC와 PPP 프로토콜은 프레임과 프레임간의 식별 및 수신기의 동기화 패턴용으로 프레임의 맨 앞뒤에 FLAG 바이트를 삽입한다. 이 FLAG 바이트는 "01111110"의 8비트열로 구성된다. 그러므로 데이터비트열에서 "0"비트 이후 "1"의 비트가 연속하여 5개 이상 발생될 경우 데이터비트열이 플래그(flag)로 혼동되어 질 수 있다. 이를 방지하기 위해 HDLC에서는 데이터 비트열에 "1"의 비트가 5개 이상 연속될 경우 5번째 비트 다음에 "0"비트를 인위적으로 추가해 주고 있다. 그러므로 문자 부호에 연속 5개의 "1"비트열이 많이 발생하도록 부호화하게 되면 데이터 통신의 전송 효율에 영향을 주게 된다. 본 본문에서는 문자부호에 연속 5개 이상의 비트"1"이 발생 되지 않도록 하는 문자부호화 규칙을 제시하였다.

텍스트의 핑거프린트를 이용한 순위다중패턴매칭 알고리즘 병렬 구현 (A Parallel Implementation of the Order-Preserving Multiple Pattern Matching Algorithm using Fingerprints of Texts)

  • 박소민;김영호;심정섭
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.57-60
    • /
    • 2020
  • 순위다중패턴매칭문제는 길이가 n인 텍스트 T와 패턴들의 집합 P' = {P1,P2…,Pk}가 주어졌을 때, P'에 속하는 패턴들과 상대적인 순위가 일치하는 T의 모든 부분문자열들의 위치를 찾는 문제이다. P'에서 가장 짧은 패턴의 길이가 m, 가장 긴 패턴의 길이를 $\bar{m}$, 모든 패턴들의 길이의 합을 M, q개의 연속된 문자들을 q-그램이라 할 때, 기존에 텍스트의 핑거프린트를 이용하여 순위다중패턴매칭문제를 $O(q!+nqlogq+Mlog\bar{m}+nM)$ 시간에 해결하는 알고리즘이 제시되었다. 본 논문에서는 텍스트의 핑거프린트를 활용하여 O(max(q!,M,n))개의 스레드를 이용하여 순위다중패턴매칭문제를 평균적으로 $O(\bar{m}+qlogq+n/q!)$ 시간에 해결하는 병렬 구현 방법을 제시한다. 실험 결과, n = 1,000,000, k = 1,000, m = 5, q = 3일 때, 본 논문에서 제시하는 병렬 구현 방법은 기존의 순차 알고리즘보다 약 19.8배 빠르게 수행되었다.

인쇄체 한글문자 인식을 위한 계층적 신경망 (A Hierarchical Neural Network for Printed Hangul Character Recognition)

  • 조성배;김진형
    • 인지과학
    • /
    • 제2권1호
    • /
    • pp.33-50
    • /
    • 1990
  • 기존의 방법으로 해결하기 어려운 문제를 풀기 위하여 최근에는 인간늬 두뇌 구조를 모델링한 신경망이 새로운 방법으로 도입되고 있다. 본 논문에서는 여러가지 지각 심리학적 연구에 근거를 두고 신경망을 통한 인쇄체 한글인 식 시스템을 구축한 후, 몇가지 실험을 통하여 신경망 기법이 인간과 유사한 특성을 나타냄을 살펴보았다. 상용하는 990자에 대하여 실험한 결과 오인식 된 문자의 혼동패턴이 기존의 연구결과와 비슷하였으며, 학습하지 않은 문자도 어느정도 인식해 내는 일반화 능력이 있음을 볼 수 있었다. 또, 학습이 잘되지 않는 문자를 좀더 반복하여 경우 학습속도가 향상됨을 볼 수 있었다.

듀얼 SMS 스팸 필터링: 그래프 기반 자질 가중치 기법 (Dual SMS SPAM Filtering: A Graph-based Feature Weighting Method)

  • 황재원;고영중
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.95-99
    • /
    • 2014
  • 본 논문에서는 최근 급속히 증가하여 사회적 이슈가 되고 있는 SMS 스팸 필터링을 위한 듀얼 SMS 스팸필터링 기법을 제안한다. 지속적으로 증가하고 새롭게 변형되는 SMS 문자 필터링을 위해서는 패턴 및 스팸 단어 사전을 통한 필터링은 많은 수작업을 요구하여 부적합하다. 그리하여 기계 학습을 이용한 자동화 시스템 구축이 요구되고 있으며, 효과적인 기계 학습을 위해서는 자질 선택과 자질의 가중치 책정 방법이 중요하다. 하지만 SMS 문자 특성상 문장들이 짧기 때문에 출현하는 자질의 수가 적어 분류의 어려움을 겪게 된다. 이 같은 문제를 개선하기 위하여 본 논문에서는 슬라이딩 윈도우 기반 N-gram 확장을 통해 자질을 확장하고, 확장된 자질로 그래프를 구축하여 얕은 구조적 특징을 표현한다. 학습 데이터에 출현한 N-gram 자질을 정점(Vertex)으로, 자질의 출현 빈도를 그래프의 간선(Edge)의 가중치로 설정하여 햄(HAM)과 스팸(SPAM) 그래프를 각각 구성한다. 이렇게 구성된 그래프를 바탕으로 노드의 중요도와 간선의 가중치를 활용하여 최종적인 자질의 가중치를 결정한다. 입력 문자가 도착하면 스팸과 햄의 그래프를 각각 이용하여 입력 문자의 2개의 자질 벡터(Vector)를 생성한다. 생성된 자질 벡터를 지지 벡터 기계(Support Vector Machine)를 이용하여 각 SVM 확률 값(Probability Score)을 얻어 스팸 여부를 결정한다. 3가지의 실험환경에서 바이그램 자질과 이진 가중치를 사용한 기본 시스템보다 F1-Score의 약 최대 2.7%, 최소 0.5%까지 향상되었으며, 결과적으로 평균 약 1.35%의 성능 향상을 얻을 수 있었다.

  • PDF