Direct Construction Algorithms for Compressed Suffix Arrays in Linear Time

압축된 써픽스 배열을 직접 구축하는 선형시간 알고리즘

  • 성종희 (부산대학교 컴퓨터공학과) ;
  • 전정은 (부산대학교 컴퓨터공학과) ;
  • 김동규 (부산대학교 컴퓨터공학과)
  • Published : 2003.04.01

Abstract

써픽스 배열은 써픽스 트리와 더불어 바이오인포매틱스(bioinformatics) 등에 널리 사용되는 전체 텍스트(full-text)의 인덱스 자료구조이다. 여러 응용분야에서 처리해야하는 데이터양의 기하급수적인 증가에 따라, 써픽스 배열을 압축하여 저장해야 하는 필요성이 커지고 있다. Grossi와 Vitter는 주어진 스트링의 써픽스 배열이 있을 경우, 작은 저장 공간을 사용하는 압축된 써픽스 배열(compressed suffix arrays)을 정의하였다. 본 논문에서는 주어진 스트링에서 써픽스 배열을 구축할 필요 없이, 직접적으로 압축된 써픽스 배열을 구축하는 선형시간 알고리즘을 제시한다.

Keywords