Finding the Time Sensitive Frequent Itemsets in Data Streams

데이터 스트림에서 시간을 고려한 상대적인 빈발항목 탐색

  • Park Tae-Su (Dept. of Computer Science & Information Engineering, Inha University) ;
  • Chun Seok-Ju (Dept. of Computer Education, Seoul University of Education) ;
  • Lee Ju-Hong (Dept. of Computer Science & Information Engineering, Inha University) ;
  • Park Sang-Ho (Dept. of Computer Science & Information Engineering, Inha University)
  • 박태수 (인하대학교 컴퓨터정보공학과) ;
  • 전석주 (서울교육대학교 컴퓨터교육학과) ;
  • 이주홍 (인하대학교 컴퓨터정보공학과) ;
  • 박상호 (인하대학교 컴퓨터정보공학과)
  • Published : 2005.11.01

Abstract

최근 들어 저장장치의 발전과 네트워크의 발달로 인하여 대용량의 데이터가 매우 빠르게 증가되고 있다. 또한, 대용량의 데이터에 내재되어 있는 정보를 빠른 시간 내에 처리하여 새로운 지식을 창출하려는 요구가 증가하고 있다. 연속적이고 빠르게 증가하는 데이터를 지칭하는 데이터 스트림에서 데이터 마이닝 기법을 이용하여 시간이 흐름에 따라 변하고, 무한적으로 증가하는 데이터 스트림에서의 빈발항목을 찾는 연구가 활발하게 진행되고 있다. 하지만 기존의 연구들은 시간의 흐름에 따른 빈발항목 탐색방법을 적절히 제시하지 못하고 있으며 단지 집계를 이용하여 빈발항목을 탐색하고 있다. 본 논문에서는 데이터 스트림에서 시간적 측면을 고려하여 상대적인 빈발항목을 탐색하기 위한 새로운 알고리즘을 제안한다. 논문에서 제안하는 알고리즘의 성능은 다양한 실험을 통해서 검증된다.

Keywords