DOI QR코드

DOI QR Code

A update-efficient disk-based inverted index structure

효율적인 갱신이 가능한 디스크 기반 역색인 구조

  • Park, Eun Ju (Dept. of Computer Science, Sookmyung Women's University) ;
  • Lee, Ki Yong (Dept. of Computer Science, Sookmyung Women's University)
  • 박은주 (숙명여자대학교 컴퓨터과학과) ;
  • 이기용 (숙명여자대학교 컴퓨터과학과)
  • Published : 2015.10.28

Abstract

소셜 네트워크 서비스(SNS)로 인해 스트리밍 환경에서 발생되는 데이터들이 급격하게 증가하고 있다. 이러한 많은 데이터 사이에서 특정 키워드를 담고 있는 문서를 찾고자 한다. 문서를 찾는 대표적인 색인인 역색인을 사용한다. 그러나 데이터가 증가하게 되면 데이터를 참조하는 색인의 크기 또한 증가한다. 결국 데이터뿐만 아니라 색인 또한 디스크에 저장되어야 한다. 본 논문에서는 역색인을 지수적으로 증가시키면서 관리하는 방법을 다룬다. 새로운 문서는 가장 작은 역색인에 저장이 되고, 후에 더 큰 역색인으로 옮겨지게 된다. 매번 전체 역색인을 읽지 않고 작은 역색인을 갱신함으로서 갱신부하를 줄이게 된다.

Keywords