• 제목/요약/키워드: 문자패턴

검색결과 297건 처리시간 0.024초

네트워크 침입 탐지 시스템에서 다중 엔트리 동시 비교기를 이용한 고속패턴 매칭기의 설계 및 구현 (Design and Implementation of High-Speed Pattern Matcher Using Multi-Entry Simultaneous Comparator in Network Intrusion Detection System)

  • 전명재;황선영
    • 한국통신학회논문지
    • /
    • 제40권11호
    • /
    • pp.2169-2177
    • /
    • 2015
  • 본 논문은 네트워크 침입 탐지 시스템에서 CAM 및 해시 구조 기반 알고리듬의 비용 한계를 극복하기 위해 RAM을 이용한다. RAM을 이용한 기존 알고리듬의 다중 엔트리 처리 시 실시간 처리속도 지연 문제를 보완한 새로운 패턴 매칭기를 제안한다. 제안된 패턴 매칭기는 Merge FSM 알고리듬을 적용하여 스테이트의 수를 줄이고, RAM을 사용하기 위해 스테이트 블록과 엔트리 블록을 포함한다. 입력된 문자열과 비교할 엔트리문자열이 여러개 존재할 때 엔트리 블록에서 입력된 문자열과 엔트리 문자열들을 동시에 비교한다. 제안된 패턴 매칭기는 Snort 2.9 규칙을 이용하여 검증하였다. 실험결과 기존 탐색 방법과 비교하여 메모리 접근 빈도가 15.8% 감소하였고, 전체 메모리 크기는 2.6% 증가하였으며, 처리속도는 47.1% 증가하였다.

접미사 배열에서의 패턴 검색 알고리즘 (Pattern Search Algorithm in Suffix Arrays)

  • 최용욱;박근수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (A)
    • /
    • pp.958-960
    • /
    • 2004
  • 접미사 배열은 긴 문자열에 대한 효율적인 패턴 검색을 위해 널리 쓰이는 자료 구조로서 지금까지 접미사 배열을 이용하여 텔스트 T 안에서 패턴 P를 검색하는 O(|P|ㆍ|∑|), O(|P|ㆍlog|∑|)시간 알고리즘(|∑|:알파벳 크기)들 이 발표되었다. 본 논문에서는 O(|P|)시간 알고리즘을 제시하고, 기존의 알고리즘들과 비교한 실험 결과를 보여준다.

  • PDF

OSD 메뉴 자동검증을 위한 작업스케줄링 및 패턴 인식 기법 (Job Scheduling and Pattern Recognition for Auto OSD Verification System)

  • 이진석;김호준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.379-381
    • /
    • 2006
  • 본 연구는 디스플레이 제품의 OSD(On Screen Display) 메뉴의 문자 오류 검사 과정을 자동화하는 방법과 FMM 신경망을 이용한 실시간 문자인식 방법을 제안한다. 이는 일반적인 문자인식 문제와는 달리 시스템 환경에 대한 몇 가지 가정과 제약조건을 고려해야 한다. 예컨대 문제의 특성상 카메라 및 TV제어 기기부의 동작과 연동하는 작업 스케줄링 기능과 실시간 분석기능 등의 요건은 시스템개발을 복잡하게 하는 반면, 주어진 OSD 메뉴 데이터로부터 검증과정은 미지 패턴에 대한 인식과정을 단순화하여 일종의 판정(decision) 문제로 고려될 수 있게 한다. 본 연구에서는 디스플레이 제품의 OSD 메뉴와 같이 특수한 구조를 갖는 문서영상에 대한 논리적인 구조분석을 통해서 연속적인 문서영상을 발생시켜서 검증과정을 자동화하는 작업스케줄링 방법을 제안하고 인식의 방법론으로서 수정된 구조의 FMM신경망을 적용한다. 또한 실제 데이터를 사용한 실험결과를 통해 시스템의 유용성을 고찰한다.

  • PDF

지역적 연결요소 및 에지 구조 성분 특징을 이용한 자연이미지로부터 문자영역 검출 (Text Region Detection Using Regional Connected Component and Edge Structure Component Feature From Natural Scene Images)

  • 박종천;황동국;권교현;전병민
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2009년도 춘계학술발표논문집
    • /
    • pp.40-43
    • /
    • 2009
  • 최근 모바일 영상기반 응용 분야에 관한 연구가 활발히 진행되고 있으며 모바일기기로 촬영된 영상에서 문자정보를 추출하고자 하는 많은 연구도 진행되고 있다. 자연이미지로부터 문자정보를 추출을 위한 전단계로 문자영역 검출이 필수적이다. 본 연구는 문자영역의 지역적 에지 및 연결요소 특징을 고려하여 조명 및 복잡한 배경에서도 문자영역을 검출하는 방법을 제안한다. 에지 검출은 캐니-에지 검출기로 추출하고, RGB 컬러분포 패턴을 분석하여 컬러 양자화를 함으로서 연결성분을 추출한다. 각각 추출된 에지 및 연결성분으로부터 문자후보 영역을 검출하고, 각각의 결과를 결합하여 최종적인 문자 후보 영역을 검출하고, 문자 후보 영역에 대한 검증을 수행함으로서 최종적인 문자영역을 검출한다. 제안한 방법은 다양한 환경에서 얻어진 자연이미지를 대상으로 실험한 결과, 에지 및 연결성분의 두 가지 특징을 결합함으로서 자연이미지에 존재하는 다양한 형태의 문자영역을 효과적으로 검출하였다.

  • PDF

모양 분해를 이용한 필기 한글 문자의 골격선 추출 (Extraction of Skeletons from Handwritten Hangul Characters using Shape Decomposition)

  • 홍기천;오일석
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권6호
    • /
    • pp.583-594
    • /
    • 2000
  • 필기 한글 문자 인식을 위한 획 추출 방법으로 많이 사용되는 세선화는 패턴을 왜곡시키는 문제점을 안고 있다. 본 논문은 모양 분해 알고리즘을 사용한 한글 문자의 골격선 추출 방법을 제안한다. 먼저 모양 분해 알고리즘을 사용하여 입력 패턴을 유사 볼록한 부품 집합으로 분해한다. 모양 분해된 패턴에서 결합 부품을 탐지하고, 이 부품과 인접한 부품들로부터 골격선을 구한다. 그 다음 결합 부품과 인접하지 않은 부품들에 대한 골격선을 추출하고 골격선의 연결성을 보장하기 위해서 선분 연장을 수행한다. 본 논문에서 추출한 골격선과 세선화로 추출한 골격선을 비교하기 위하여 다섯 가지 비교 기준을 설정하고, 이를 기반으로 비교 분석하였다. 본 논문에서 제안한 방법이 여러 기준에서 세선화-기반 방법보다 우수함을 보였다.

  • PDF

문자열의 최장 공통 부분문자열과 최대 반복자를 구하기 위한 상수시간 RMESH 알고리즘 (Constant Time RMESH Algorithm for Computing Longest Common Substring and Maximal Repeat of String)

  • 한선미;우진운
    • 정보처리학회논문지A
    • /
    • 제16A권5호
    • /
    • pp.319-326
    • /
    • 2009
  • 문자열 연산이 계산 생물학 분야에 응용되면서 효율적인 문자열 연산을 위한 다양한 자료구조와 알고리즘이 연구되고 있다. 최장 공통 부분 문자열 문제는 두 개 이상의 문자열에서 가장 길게 일치하는 부분문자열을 찾는 연산이며, 최대 반복자 문제는 하나의 문자열에서 두 번 이상 반복되는 부분문자열을 찾는 연산이다. 이 연산은 패턴 매칭, 유사도 측정 등의 문자열 처리 분야에서 중요하게 사용되고 있다. 본 논문에서는 RMESH(Reconfigurable MESH) 구조에서 3-차원 $n{\times}n{\times}n$ 프로세서를 사용하여 두 문자열의 최장 공통 부분문자열을 구하는 알고리즘과 주어진 문자열의 최대 반복자를 찾는 알고리즘을 제안하며, 이 알고리즘들은 모두 O(1) 시간 복잡도를 갖는다.

문자클래스 매칭을 지원하는 정규표현식 매칭 프로세서 구조 (Regular Expression Matching Processor Architecture Supporting Character Class Matching)

  • 윤상균
    • 정보과학회 논문지
    • /
    • 제42권10호
    • /
    • pp.1280-1285
    • /
    • 2015
  • 고속 정규표현식 매칭을 수행하기 위한 여러 종류의 정규표현식 매칭 하드웨어 구조가 연구되었다. 특히 프로그램과 같이 패턴의 갱신이 쉽도록 범용 프로세서와 유사한 방식으로 정규표현식 매칭을 수행하는 ReCPU와 SMPU와 같은 정규표현식 프로세서가 연구되었다. 그렇지만 기존의 정규표현식 프로세서들은 문자클래스 매칭을 위한 별도의 기능을 제공하지 않아서 문자클래스 처리에 비효율적이다. 본 논문에서는 문자클래스 매칭을 지원하는 정규표현식 매칭 프로세서의 명령어 집합을 제시하고, 이에 대한 프로세서 구조를 설계 구현한다. 제시된 프로세서는 문자클래스, 문자 범위와 부정 문자클래스 처리 기능을 포함하고 있어서 문자클래스 매칭을 매우 효율적으로 처리할 수 있다.

이동과 축척과 회전에 불변인 실용적인 패턴 인식 시스템

  • 김회율
    • 전자공학회지
    • /
    • 제21권10호
    • /
    • pp.47-54
    • /
    • 1994
  • 본 논문에서는 물체들의 이동(translation) 축적(scale) 그리고 회전방향(orientation)에 무관하게 물체를 인식하는 실용적인 패턴 인식 시스템을 소개한다. 이 시스템은 2진영상으로 변환하는데 필요한 임계치(threshold)의 큰 변화에도 덜 민감하다. 특징 벡터(feature vector)로 서는 Zernike 모멘트를 사용하였는데 지금까지 잘 알려진 Hu가 제안한 7개의 모멘트 불변수 (moment invariants)와 비교한다. 또한, 실용적인 기계 시각(machine vision) 시스템에 대해 세 가지 중요한 문제로서 패턴 정규화(pattern nomalization), Zernike 모멘트의 신속한 계산, 그리고 k-NN 규칙을 이용한 분류 등을 논의하였다. 실험에서는 임의의 회전 방향에서 문자들의 크기가 10x10 화소(pixel)에서 512x512 화소까지 변하는 서로 다른 크기를 가진 인쇄된 62개의 문자와 숫자 그리고 기호들을 서로 다른 임계치에서 인식하는 것을 보여준다.

  • PDF

동적인 생물체의 패턴 인식 (A Study on Pattern Recognition of Dynamic Object)

  • 강동구;차의영;전태수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.437-439
    • /
    • 2000
  • 본 논문은 연층형 생물체의 형태를 인식하는 방법을 제안한다. 고정된 카메라에 제약된 공간상에서 움직이는 생물체를 인식하기 위하여 다음과 같은 과정을 거친다. 먼저 배경 영상을 추출한 후 배경 영상과 현재 영상의 차영상을 통하여 물체의 이진화 영상을 생성하여 세선화 작업을 거친 후 마지막으로 변환된 이미지에서 대표점을 추출하여 패턴 생성기의 입력 데이터로 사용한다. 생물체의 형태 인식 방법은 문자 인식 방법과 몇 가지 차이점을 가지는데 문자의 경우 'q'와 'b'가 다르게 인식되지만 생물체의 경우 이 두 형태는 단지 하나의 형태가 회전한 결과이므로 두 형태를 동일하게 인식해야 한다. 그러므로 패턴 생성을 위한 입력 데이터도 다른 형태를 띄게 된다. 본 논문에서 제안한 방법은 지렁이, 뱀 등과 같은 물체의 행동 분석을 하기 위한 기초 데이터를 생성하는 좋은 방법이 될 수 있다.

  • PDF

가중치를 갖는 문자의 개수를 서명으로 이용한 DNA 인덱스 구조 (A DNA Index Structure Using Signature by Weighted Number of Characters)

  • 김우철;민준기;박상현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.337-339
    • /
    • 2004
  • 우리는 대규모의 유전자 데이터베이스에서 원하는 패턴을 빠르고 정확하게 찾고 싶어한다 하지만 지금까지 나온 대부분의 검색방법들은 인덱스의 크기를 실제 데 이 터 보다 훨씬 크게 만들어 사용해왔다. 그런 방법들은 기하급수적으로 증가하고 있는 데 이 터를 처 리 하는 데는 비효율적이다. 따라서 인덱스 크기를 실제 데이터보다 작게 만들면서도 원하는 패턴을 빨리 찾을 수 있는 효율적 인 방법 이 필요하다. 이렇게 하기 위해서는 일정한 크기의 데이터를 작은 크기의 데이터로 줄인 후, 이 데이터를 이용하여 인덱스를 만들어야 한다. 이 논문에서는 일정한 크기의 문자열(=윈도우)을 작은 크기의 숫자들(=서명)로 표현해서 인덱스를 구축한 후, 이를 이용해 우리가 원하는 패턴을 최소한의 디스크 접근을 통해 빠르게 찾을 수 있는 방법을 제시한다.

  • PDF