Fast Index Construction in Distortion-Free Time-Series Subsequence Matching

왜곡 제거 시계열 서브시퀀스 매칭에서 빠른 인덱스 구성법

  • Gil, Myeong-Seon (Department of Computer Science, Kangwon National University) ;
  • Kim, Bum-Soo (Department of Computer Science, Kangwon National University) ;
  • Moon, Yang-Sae (Department of Computer Science, Kangwon National University) ;
  • Kim, Jin-Ho (Department of Computer Science, Kangwon National University)
  • 길명선 (강원대학교 컴퓨터과학과) ;
  • 김범수 (강원대학교 컴퓨터과학과) ;
  • 문양세 (강원대학교 컴퓨터과학과) ;
  • 김진호 (강원대학교 컴퓨터과학과)
  • Published : 2011.06.29

Abstract

본 논문에서는 기존 단일 인덱스 기반의 왜곡 제거 시계열 서브시퀀스 매칭의 인덱스 구성 알고리즘을 분석하여 보다 효율적인 인덱스 구성 알고리즘을 제안하였다. 기존 왜곡 제거 시계열 서브시퀀스 매칭의 단일 인덱스 구성 알고리즘은 대용량 시계열 데이터인 경우 왜곡 제거를 고려해야 되는 많은 윈도우로 인해 실제 인덱스 생성에 매우 많은 시간이 걸린다. 본 논문에서는 기존 선형 제거 서브시퀀스 매칭의 인덱스 구성 알고리즘을 예로서 인덱스를 구성하는 각 과정을 체계적으로 분석하여, 각 과정에서 필요한 연산 횟수를 줄이는 방법을 제안한다. 이를 위해, 저차원 변환하는 과정에서 발생하는 중복되는 연산들을 한 번씩 미리 수행하여 배열에 저장한 후 재사용하는 DF-버컷(DF-bucket)씨의 개념을 제시한다. 실험 결과, 저장 후 재사용 원칙에 따라 인덱스 구성의 효율성을 증대시킨 접근법이 그렇지 않은 접근법에 비해서 인덱스 구성 시간을 평균 32% 에서 55% 까지 줄인 것으로 나타났다.

Keywords

Acknowledgement

Supported by : 한국연구재단