Efficient Retrieval of Similar Shape-Based Subsequences for Sequence Database

시퀀스 데이터베이스를 위한 모양기반의 유사 부분시퀀스 검색

  • 이정화 (한림대학교 컴퓨터공학부) ;
  • 윤지희 (한림대학교 컴퓨터공학부)
  • Published : 1999.10.01

Abstract

시퀀스 데이터(sequence data)에서는 각 데이터 값보다는 전후 그들 사이의 변화추세 등이 더 큰 정보로 작용하는 것이 일반적이다. 본문에서는 시퀀스 데이터베이스를 대상으로 하여 주어진 시퀀스 패턴과 모양이 유사한 모든 부분시퀀스를 검색해 내는 새로운 방식을 제안한다. 본 방식에서는 시퀀스 데이터의 모양 추출을 위한 데이터 변환, 유사 모양 패턴 클러스터링, 새로운 유사도 계산 방식 등을 도입함으로써, 기존의 방식이 매우 제한적인 패턴만을 유사패턴으로 간주하던 것에 비하여, 패턴이 데이터축 혹은 타임축으로 각각 확대, 축소, 이동된 경우에도 유사패턴으로 검색이 가능하다.

Keywords