Design and Implementation of a Data Mining Query Processor

데이터 마이닝 질의 처리를 위한 질의 처리기 설계 및 구현

  • 김충석 (신라대학교 컴퓨터정보공학부) ;
  • 김경창 (홍익대학교 컴퓨터공학과)
  • Published : 2001.04.01

Abstract

A data mining system includes various data mining functions such as aggregation, association and classification, among others. To express these data mining function, a powerful data mining query language is needed. In addition, a graphic user interface(GUI) based on the data mining query language is needed for users. In addition, processing a data mining query targeted for a data warehouse, which is the appropriate data repository for decision making, is needed. In this paper, we first build a GUI to enable users to easily define data mining queries. We then propose a data mining query processing framework that can be used to process a data mining query targeted for a data warehouse. We also implement a schema generate a data warehouse schema that is needed to build a data warehouse. Lastly, we show the implementation details of a query processor that can process queries that discover association rules.

데이터 마이닝 시스템은 기본적으로 요약화, 연관화와 분류화 등 다양한 유형의 데이터 마이닝 기능을 포함한다. 이들 기능을 수행하기 위해서 포괄적으로 표현하기 위한 강력한 데이터 마이닝 질의 언어가 요구되며, 사용자에게 보다 친숙한 마이닝 환경을 제공하기 위해서 그래픽 사용자 인터페이스(GUI)를 이용한 데이터 마이닝 질의 언어의 개발이 중요하게 언급된다. 뿐만 아니라 데이터 마이닝 그 자체로서 독립적인 수행이 아니라 수많은 데이터를 포함하며, 의사결정에 적합한 구조로 설계되어 있는 데이터 웨어하우스와 연관된 데이터 마이닝 질의 처리가 필요하다. 본 논문에서는 먼저 GUI를 통하여 사용자가 쉽게 데이터 마이닝 질의를 수행할 수 있도록 한다. 또한 질의를 처리하기 위한 데이터 마이닝 질의 처리 프레임워크를 제시한다. 데이터마이닝 질의의 대상은 데이터 웨어하우스에 저장되어 있는 데이터이기 때문에 데이터 웨어하우스의 구축이 필요하다. 본 논문에서는 데이터 웨어하우스 구축에 필요한 스키마 생성을 위해서 스키마 생성기를 아울러 개발하여 이용한다. 마지막으로 연관 규칙 발견을 위한 데이터 마이닝 질의를 처리하기 위한 질의 처리기의 구현 내용을 보인다.

Keywords

References

  1. U.M. Fayyad, G. Piatetsky-Shapiro, P. Smyth, and R. Uthurusamy, Advances in knowledge Discovery and Data Mining. AAAI/MIT Press, 1996
  2. Alex Berson, Stephen J. Smith. Data Warehousing, Data Mining, & OLAP. McGraw-Hill, 1997
  3. I. Mumick, D. Quass, and B. Mumick, 'Maintenance of data cubes and summary tables in a warehouse,' In Proceedings of the ACM-SIGMOD Conference, Tucson, Arizona, 1997 https://doi.org/10.1145/253262.253277
  4. Rosa Meo, Giuseppe Psaila, Stefano Ceri, 'A New SQL-like Operator for Mining Association Rules,' in Proceedings of the 22nd VLDB Conference, pp.122-133, 1996
  5. Jiawei Han, Jenny Y. Chiang, Sonny Chee, Jianping Chen, Qing Chen, etc. 'DBMner : A System for Data Mining in Relational Database and Data Warehouses,' in URL : http://db.cs.sfu.ca/(for research group)
  6. Jawei Han, Yongjian Fu, Wei Wang, Krzysztof Koperski, Osmar Zaiane, 'DMQL : A Data Mining Query Language for Relational Databases,' in URL : http://db.cs.sfu.ca/(for research group)
  7. G. Piatetsky-Shapiro, and W. J. Frawley, Knowledge Discovery in Databases. AAAI/MIT Press 1991
  8. W. H. Inmon 'The Data Warehouse and Data Mining,' In Communications of the ACM, November 1996/Vol. 39. No. 11 page 49-57 https://doi.org/10.1145/240455.240470
  9. Tomasz Imielinski, Heikki Mannila 'A Database Perspective on Knowledge Discovery,' In Communications of the ACM November, 1996/Vol.39. No.11 page 58-64 https://doi.org/10.1145/240455.240472
  10. R. Agrawal and R. Srikant, 'Fast Algorithms for Mining Association Rules in Large Databases,' Proc, 20th Int'l Conf. Very Large Data Bases, pp.487-500, Sept. 1994
  11. 정병화, 이현창, 김경창, '데이터 웨어하우스를 위한 스키마 생성기설계 및 구현', 한국 정보과학회, 제25권 1호, 봄 학술발표논문집, 1998
  12. A. Gupta, V. Harinarayan, D. Quass, 'Aggregate-Query Processing in Data Warehousing Environments,' Proc 21st Int'l Conf. Very Large Data Bases, pp.358-369, 1995