• 제목/요약/키워드: approximate pattern matching

검색결과 12건 처리시간 0.029초

TOLERANT FUZZY PATTERN MATCHING : AN INTRODUCTION

  • DUBOIS, DIDIER;PRADE, HENRI
    • 한국지능시스템학회논문지
    • /
    • 제3권2호
    • /
    • pp.3-17
    • /
    • 1993
  • The fuzzy pattern matching technique has been developed in the framework of fuzzy set and possibility theory in order to take into account the imprecision and the uncertainty pervading values which have to be compared to requirements (which may be fuzzy) in a pattern matching process. This paper restates the basic principles and extends them to situations where (sub)patterns are only required to be satisfied up to a given tolerance (which may be fuzzy), or where the different subparts of a compound pattern may have various levels of importance. Both cases correspond to a weakening of elementary patterns. which can be expressed by a fuzzy relations modelling an approximate equality or an uncertain strict equality respectively. We also study the more sophisticated case where some elementary patterns have not to be satisfied with the highest priority provided that weaker requirements remain satisfied. The fuzzy pattern matching technique applies in a variety of problems including the evaluation of soft queries with respect to a fuzzy database, the evaluation of the fuzzy condition parts of rules in approximate reasoning, or the evaluation of the belonging of an ill-known object to a flexible class in classification problems.

  • PDF

A Novel Cryptosystem Based on Steganography and Automata Technique for Searchable Encryption

  • Truong, Nguyen Huy
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권5호
    • /
    • pp.2258-2274
    • /
    • 2020
  • In this paper we first propose a new cryptosystem based on our data hiding scheme (2,9,8) introduced in 2019 with high security, where encrypting and hiding are done at once, the ciphertext does not depend on the input image size as existing hybrid techniques of cryptography and steganography. We then exploit our automata approach presented in 2019 to design two algorithms for exact and approximate pattern matching on secret data encrypted by our cryptosystem. Theoretical analyses remark that these algorithms both have O(n) time complexity in the worst case, where for the approximate algorithm, we assume that it uses ⌈(1-ε)m)⌉ processors, where ε, m and n are the error of our string similarity measure and lengths of the pattern and secret data, respectively. In searchable encryption, our cryptosystem is used by users and our pattern matching algorithms are performed by cloud providers.

근사 알고리즘을 이용한 순차패턴 탐색 (Searching Sequential Patterns by Approximation Algorithm)

  • 산사볼트가람라흐차;황영섭
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권5호
    • /
    • pp.29-36
    • /
    • 2009
  • 서열데이터베이스에 있는 자주 발현하는 부분 서열을 패턴으로 찾아내는 순차패턴 탐색은 넓은 응용 분야를 가지는 중요한 데이터 마이닝 문제이다. DNA 서열에서 순차패턴이 모티프가 될 수 있으므로 DNA 서열에서 순차패턴을 찾는 것을 연구하였다. 대부분의 기존 마이닝 방법은 순차패턴의 정의에 따라 정확한 정합에 주력하여 노이즈가 있는 환경이나 실제 문제에서 발생하는 부정확한 데이터에 대하여 제대로 작동하지 않을 수 있다. 이러한 문제가 생물 데이터인 DNA 서열에서 자주 나타난다. 이러한 문제를 다루기 위한 근사 정합 방법을 연구하였다. 본 연구의 아이디어는 자주 발생하는 패턴을 근사 패턴이라 부르는 그룹으로 분류할 수 있다는 관찰에서 기반을 둔다. 기존의 Prefixspan 알고리즘은 주어진 긴 서열에서 순차패턴을 잘 찾을 수 있다. 본 연구는 Prefixspan 알고리즘을 개선하여 유사한 순차패턴을 찾을 수 있게 하였다. 실험 결과는 PreFixSpan보다 제안한 방법이 패턴 길이가 4일 때, 근사 순차패턴의 빈도가 5배 높아짐을 보였다.

Finding approximate occurrence of a pattern that contains gaps by the bit-vector approach

  • Lee, In-Bok;Park, Kun-Soo
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2003년도 제2차 연례학술대회 발표논문집
    • /
    • pp.193-199
    • /
    • 2003
  • The application of finding occurrences of a pattern that contains gaps includes information retrieval, data mining, and computational biology. As the biological sequences may contain errors, it is important to find not only the exact occurrences of a pattern but also approximate ones. In this paper we present an O(mnk$_{max}$/w) time algorithm for the approximate gapped pattern matching problem, where m is the length of the text, H is the length of the pattern, w is the word size of the target machine, and k$_{max}$ is the greatest error bound for subpatterns.

  • PDF

근사 패턴매칭을 이용한 대화형 도우미 에이전트의 개발 (Development of a Conversational Help Agent Using Approximate Pattern Matching)

  • 김수영;조성배
    • 인지과학
    • /
    • 제13권4호
    • /
    • pp.1-8
    • /
    • 2002
  • 인터넷의 성장에 따라 많은 웹사이트가 생기고, 더 많은 정보가 웹사이트에 등록되었다. 웹사이트에 등록되는 정보가 많을수록, 사용자가 원하는 정보를 얻기가 쉽지 않다. 따라서, 사용자가 원하는 정보를 쉽게 찾을 수 있도록, 웹사이트 내에 전문(full-text) 검색엔진을 도입하기도 한다. 본 논문에서는 사용자가 자연어를 이용한 대화를 통해 웹사이트 내의 정보를 습득할 수 있도록 하는 대화형 도우미 에이전트를 개발한다. 제안한 방법은 전통적인 자연어 처리 기법이 아닌 인공지능의 패턴매칭에 기반한다. 사용자가 문장을 입력하면, 한글 전처리과정을 통해 사용자의 문장을 분석하고, 이미 작성되어 있는 지식과의 매칭을 통해 사용자에게 알맞은 대답을 제시한다. 지식은 XML 형식으로 저장되며, 사용자가 입력한 문장과 아주 똑같지 않더라도, 어느 정도의 유사도를 가지고 대답을 이끌어낼 수 있다. 실험결과 동일한 의미를 가진 다양한 형태의 문장을 입력했을 경우에도 동일 패턴임을 인식하여, 사용자가 원하는 결과를 낼 수 있었다.

  • PDF

k개의 오차를 허용하는 순위 패턴 매칭 (Order preserving matching with k mismatches)

  • 이인복
    • 스마트미디어저널
    • /
    • 제9권2호
    • /
    • pp.33-38
    • /
    • 2020
  • 순위 패턴 매칭 문제는 패턴과 텍스트가 주어졌을 때, 텍스트의 부분 문자열 중 패턴과 순위 동형을 만족하는 것들을 찾는 문제이다. 이 논문에서는 순위 패턴 매칭에 k개의 오차를 허용하는 문제를 푸는 알고리즘을 제안한다. 제안하는 알고리즘은 기존의 알고리즘에 비하여 간단하고 구현이 쉬우며, 평균적인 경우 선형 시간 복잡도를 가진다. 또한 실험을 통해서, 제안된 알고리즘이 현실적인 데이터에 대해서 효율적으로 동작함을 보인다.

GPU을 이용한 다중 고정 길이 패턴을 갖는 DNA 시퀀스에 대한 k-Mismatches에 의한 근사적 병열 스트링 매칭 (Parallel Approximate String Matching with k-Mismatches for Multiple Fixed-Length Patterns in DNA Sequences on Graphics Processing Units)

  • 호 티엔 루안;김현진;오승록
    • 전기학회논문지
    • /
    • 제66권6호
    • /
    • pp.955-961
    • /
    • 2017
  • In this paper, we propose a parallel approximate string matching algorithm with k-mismatches for multiple fixed-length patterns (PMASM) in DNA sequences. PMASM is developed from parallel single pattern approximate string matching algorithms to effectively calculate the Hamming distances for multiple patterns with a fixed-length. In the preprocessing phase of PMASM, all target patterns are binary encoded and stored into a look-up memory. With each input character from the input string, the Hamming distances between a substring and all patterns can be updated at the same time based on the binary encoding information in the look-up memory. Moreover, PMASM adopts graphics processing units (GPUs) to process the data computations in parallel. This paper presents three kinds of PMASM implementation methods in GPUs: thread PMASM, block-thread PMASM, and shared-mem PMASM methods. The shared-mem PMASM method gives an example to effectively make use of the GPU parallel capacity. Moreover, it also exploits special features of the CUDA (Compute Unified Device Architecture) memory structure to optimize the performance. In the experiments with DNA sequences, the proposed PMASM on GPU is 385, 77, and 64 times faster than the traditional naive algorithm, the shift-add algorithm and the single thread PMASM implementation on CPU. With the same NVIDIA GPU model, the performance of the proposed approach is enhanced up to 44% and 21%, compared with the naive, and the shift-add algorithms.

자동검사 시스템을 위한 컴퓨터 비젼의 연구 (An Automatic Inspection System Using Computer Vision)

  • 장동식
    • 산업공학
    • /
    • 제4권2호
    • /
    • pp.43-51
    • /
    • 1991
  • A line search method is developed to locate all the conerpoints of 2-dimensional polygon images for inspection purposes. This optimization-based method is used to approximate a 2-D curved object by a polygon. This scheme is also developed for inspection of objects in industrial environment. The inspection includes dimensional verification and pattern matching which compares a 2-D image of an object to a pattern image. The method proves to be computationally efficient and accurate for real time application.

  • PDF

근사 주기를 이용한 새로운 랜덤성 테스트 기법 (New Randomness Testing Methods using Approximate Periods)

  • 임지혁;이선호;김동규
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권6호
    • /
    • pp.742-746
    • /
    • 2010
  • 기존의 패턴 매칭을 이용한 랜덤성 테스트를 개선하기 위하여, 근사 주기에 기반한 새로운 랜덤성 테스트를 제안한다. 근사 주기를 활용하면 랜덤수열에서 비슷한 부분이 반복되는 것을 찾아낼 수 있지만, 계산 시간이 오래 걸리는 단점이 있다. 본 논문에서는 근사주기를 계산하는 시간복잡도를 O($n^3$)에서 O($n^2$)으로 줄임으로써, O($n^2$)의 시간복잡도를 가지는 새로운 랜덤성 테스트를 제안한다. 그리고 AES 암호알고리즘을 이용한 의사 랜덤수열(pseudo random number)과 실제 랜덤수열(true random number)에 제안한 테스트를 적용하여 실험하였다.

Relaxation을 이용한 2차원 물체의 형상매칭에 관한 연구 (A Study on Shape Matching of Two-Dimensional Object using Relaxation)

  • 곽윤식;이대령
    • 한국통신학회논문지
    • /
    • 제18권1호
    • /
    • pp.133-142
    • /
    • 1993
  • 본 논문은 2차원 물체의 형상 매칭에 관한것으로 다각근사화된 단순 2차원 물체에 적용하였다. 많은 형상 매칭 방법론이 수학적 벡터의 의현에 기초를 두고 확솔적인 패턴 인식을 사용하고 있다. 유출된 형상의 다양성과 많은 데이타량은 형상의 전체적인 구조의 관계를 나타내는데 단점을 갖고 있다. 본 논문에서는 영상을 다 각근사적 과정를 통하여 Relaxation 라벨링 기술을 이용함으로써 형상 매칭의 지점을 해결하였다.

  • PDF