Efficient Multiple Joins using the Synchronization of Page Execution Time in Limited Processors Environments

한정된 프로세서 환경에서 체이지 실행시간 동기화를 이용한 효율적인 다중 결합

  • Lee, Kyu-Ock (Korea Institute of Machinery and Materials) ;
  • Weon, Young-Sun (Dept.of Information Computer Engineering, Ajou University) ;
  • Hong, Man-Pyo (Dept.of Information Computer Engineering, Ajou University)
  • 이규옥 (한국기계연구원) ;
  • 원영선 (아주대학교 정보및 컴퓨터공학부) ;
  • 홍만표 (아주대학교 정보및 컴퓨터공학부)
  • Published : 2001.12.01

Abstract

In the relational database systems the join operation is one of the most time-consuming query operations. Many parallel join algorithms have been developed 개 reduce the execution time Multiple hash join algorithm using allocation tree is one of the most efficient ones. However, it may have some delay on the processing each node of allocation tree, which is occurred in tuple-probing phase by the difference between one page reading time of outer relation and the processing time of already read one. This delay problem was solved by using the concept of synchronization of page execution time with we had proposed In this paper the effects of the performance improvements in each node of the allocation tree are extended to the whole allocation tree and the performance evaluation about that is processed. In addition we propose an efficient algorithm for multiple hash joins in limited number of processor environments according to the relationship between the number of input relations in the allocation tree and the number of processors allocated to the tree. Finally. we analyze the performance by building the analytical cost model and verify the validity of it by various performance comparison with previous method.

관계형 데이타베이스 시스템에서 결합 연산자는 데이타 베이스 절의를 구성하는 연산자들 중 가장 많은 처리시간을 요구한다. 따라서 이러한 결합 연산자를 효율적으로 처리하기 위해 많은 병렬 알고리즘들이 수개되었다. 그 중 다중 해쉬 결합 질의의 처리를 위해 할당트리를 이용한 방법이 가장 우수한 것으로 알려져 와싸. 그러나 이 방법은 할당 트리의 각 노트에서 필연적인 지연이 발생되는데 이는 루플 실험단계에서 외부 릴레이션을 디스트로부터 페이지 단위로 읽는 비용과 이미 읽는 페이지에 대한 해쉬 결합 비용간의 실행시간 차이에 의해 발생하게 된다. 이는 페이지 실행시간 동기화 기법을 이용하여 할당 트라 한 노드에서의 실행시간을 줄일 수 있었다. 본 논문에서는 한 노드에서의 성능 개선 효과를 할당 트리 전체로 확장하여 전체 다중 해쉬 결합의 성능 분석을 수행하였으며 한정된 프로세서 환경 하에서 입력 릴레이션 수와 할당된 프로세서 수와의 관게에 따른 효율적인 다중 해쉬 결합 알고리즘을 제안하였다. 그리고 분석적 비용 모형을 세워 기존 방식과의 다양한 성늘 분석을 통해 비용 모형의 타당성을 입증하였다.

Keywords

References

  1. Hu-I Hsiao, Ming-Syan Chen, and Philip S. Yu, 'On Parallel Execution of Multiple Pipelined Hash Jois,' Proc. ACM SIGMOD, pp.185-196, May 1994
  2. Ming-Syan Chen, Ming-Ling Lo, Philip S. Yu, and Honesty C. Young, 'Using Segmented Right-Deep Trees for the Execution of Pipelined Hash Joins,' 18th international Conference on VLDB, pp.15-26, August 1992
  3. Ming-Syan Chen, Mingling Lo, Philip S. Yu, and Honesty C. Young, ' Applying Segmented Right-Deep Trees to Pipelining Hash Joins,' IEEE Trans. on Knowledge and Data Engineering, Vol. 7, No.4, August 1995 https://doi.org/10.1109/69.404036
  4. Donovan A. Schneider and D.J. DeWitt, 'Tradeoffs in Processing Complex Join Queries via Hashing in Multiprocessor Database Machines,' Proceedings of the 16th VLDB Conference, pp.469-480, August 1990
  5. Mingling Lo, Ming -Svun Chen, C. V. Ravishankar, and Philip S. Yu, 'On Optimal Processor Allocation to Support Pipelined Hash Joins,' Proc. ACM SIGMOD, pp.69-78, May 1993 https://doi.org/10.1145/170035.170053
  6. Ming-Syan Chen, P.S. Yu, and K.L. Wu, 'Scheduling and Processor Allocation for Parallel Execution of Multi- Join Queries,' Proc. 8th international Conf. Data Engineering, pp.58-67, Feb. 1992
  7. Hui-I Hsiao, Ming-Svan Chen, 'Parallel Execution of Hash Joins in Parallel Databases,' IEEE Transactions on Parallel and Distributed Systems, Vol. 8, No.8, pp.872-883, Aug. 1997 https://doi.org/10.1109/71.605772
  8. D.J.DeWitt, and J. Gray, 'Parallel Database System: The Future of High Performance Database System,' Comm. of ACM, pp.85-·98, June 1992 https://doi.org/10.1145/129888.129894
  9. 이규옥, 원영선, 홍만표, '페이지 실행시간 동기화 기법을 이용한 다중 파이프라인 해쉬 결합', 정보과학회 논문지: 시스템 및 이론, 제27권, 제7호, pp.639-649, 2000
  10. Kyuock Lee, Youngsun Wmn, and Manpyo Hong, 'Multiple Pipelined Hash Joins Using Synchronization of Page Execution Time,' Int'l Conf. PDPTA'2000, Vol. V, pp. 2863-2869, June, 26-29. 2000