DOI QR코드

DOI QR Code

Mining Association Rules in Multidimensional Stream Data

다차원 스트림 데이터의 연관 규칙 탐사 기법

  • 김대인 (전남대학교 전자컴퓨터정보통신공학부) ;
  • 박준 (전남대학교 전산학과) ;
  • 김홍기 (동신대학교 컴퓨터학과) ;
  • 황부현 (전남대학교 전자컴퓨터정보통신공학부)
  • Published : 2006.10.31

Abstract

An association rule discovery, a technique to analyze the stored data in databases to discover potential information, has been a popular topic in stream data system. Most of the previous researches are concerned to single stream data. However, this approach may ignore in mining to multidimensional stream data. In this paper, we study the techniques discovering the association rules to multidimensional stream data. And we propose a AR-MS method reflecting the characteristics of stream data since make the summarization information by one data scan and discovering the association rules for significant rare data that appear infrequently in the database but are highly associated with specific event. Also, AR-MS method can discover the maximal frequent item of multidimensional stream data by using the summarization information. Through analysis and experiments, we show that AR-MS method is superior to other previous methods.

연관 규칙 탐사는 데이터베이스를 분석하여 잠재되어 있는 지식을 발견하기 위한 기법으로 스트림 데이터 시스템에서 연관 규칙 탐사에 대한 연구가 활발하게 진행되고 있다. 그러나 대부분의 연구들은 센서에서 수집되는 단일 스트림 데이터에 관한 것이며 다차원 스트림 데이터간의 연관 정보는 간과하고 있다. 본 논문에서는 다차원 스트림 데이터간의 연관 규칙을 탐사할 수 있는 AR-MS 방법을 제안한다. AR-MS 방법은 한 번의 데이터 스캔으로 연관 규칙 탐사에 필요한 요약 정보를 구축함으로써 스트림 데이터의 특성을 반영하며, 자주 발생하지는 않지만 특정 이벤트와 빈번하게 발생하는 의미 있는 희소 항목 집합에 대한 연관 규칙을 탐사할 수 있다. 또한 AR-MS 방법은 구축된 요약 정보를 사용하여 다차원 스트림 데이터간의 최대 빈발 항목 집합에 대한 연관 규칙도 탐사한다. 그리고 다양한 실험을 통하여 제안하는 방법이 기존의 방법들에 비하여 우수함을 확인하였다.

Keywords

References

  1. B. Brian, S. Babu, M. Datar, R. Motwani, and J. Widom, 'Models and Issues in Data Stream Systems,' In Proc. of PODS, March, 2002 https://doi.org/10.1145/543613.543615
  2. M. J. Franklin, S. R. Jeffery, S. Krishnamurthy, F. Reiss, S. Rizvi, E. Wu, O. Cooper, A. Edakkunni, and W. Hong, 'Design Consideration for High Fan-in Systems: The HiFi Approach,' In Proc. of CIDR, pp.290-304, Jan., 2005
  3. M. M. Gaber, A. Zaslavsky, and S. Krishnaswamy, 'Mining Data Streams: A Review,' SIGMOD Record, Vol.34, No.2, pp.18-26, June, 2005 https://doi.org/10.1145/1083784.1083789
  4. G. S. Manku and R. Motwani, 'Approximate Frequency Counts over Data Streams,' In Proc. of VLDB, pp.346-357, 2002
  5. R. C. Oliver, K. Smettem, M. Kran, and K. Mayer, 'Fielding Testing a Wireless Sensor Network for Reactive,' In Proc. of ISSNIP, pp.7-12, Dec., 2004
  6. A. Deligiannakis, Y. Kotidis, and N. Roussopoulos, 'Hierarchical In-Network Data Aggregation with Quality Guarantees,' LNCS(EDBT 2004), pp.658-675, March, 2004
  7. R. Agrawal and R. Srikant, 'Fast Algorithms for mining association rule,' In Proc. of VLDB, Sep., 1994
  8. G. Chen, X. Wu, and X. Zhu, 'Mining Sequential Patterns Across Data Streams,' Univ. of Vermont Computer Science Technical Report(CS-05-04), March, 2005
  9. J. Pei, J. Han, B. Mortazavi-Asl, J. Wang, H. Pinto, Q. Chen, U. Dayal, and M. Hsu, 'Mining Sequential Patterns by Pattern-Growth: The PrefixSpan Approach,' IEEE Transactions on Knowledge and Data Engineering, Vol.16, No.11, Nov., 2004 https://doi.org/10.1109/TKDE.2004.77
  10. H. Han, H. Ryoo, and H. Patrick, 'An Infrastructure of Stream Data Mining, Fusion and Management for Monitored Patients,' In Proc. of 19th IEEE International Symposium on CBMS 2006, pp.461-468, June, 2006 https://doi.org/10.1109/CBMS.2006.39
  11. K. Kuramitsu, 'Finding Periodic Outliers over a Monogenetic Event System,' In Proc. of UDM05, pp.97-104, April, 2005 https://doi.org/10.1109/UDM.2005.9
  12. H. Li, S. Lee, and M. Shan, 'Online Mining (Recently) Maximal Frequent Itemsets over Data Streams,' In Proc. of RIDE-SDMA '05, pp.11-18, April, 2005 https://doi.org/10.1109/RIDE.2005.13
  13. 하단심, 황부현, '상대 지지도를 이용한 의미 있는 희소 항목에 대한 연관 규칙 탐사 기법' 정보과학회 논문지 데이터베이스 제 28권 제 4호, pp.577-586, 2001
  14. 장중혁, 이원석, '데이터 스트림에서 개방 데이터 마이닝 기반의 빈발항목 탐색,' 정보처리학회 논문지 D 제10-D권 제 3호, pp.447-458, 2003 https://doi.org/10.3745/KIPSTD.2003.10D.3.447
  15. 한승철, 강현철, 'XML 스트림 데이터에 대한 연속 질의 처리 시스템,' 정보처리학회 논문지 D 제11-D권 제7호, pp.1375-1384, 2004 https://doi.org/10.3745/KIPSTD.2004.11D.7.1375

Cited by

  1. Discovering Temporal Relation Considering the Weight of Events in Multidimensional Stream Data Environment vol.10, pp.2, 2010, https://doi.org/10.5392/JKCA.2010.10.2.099