Optimization Methods of Adaptive Multi-Stage Distance Joins

적응적 다단계 거리 조인의 최적화 기법

  • 신효섭 (서울대학교 컴퓨터공학부) ;
  • 문봉기 (미국 아리조나대학교 전산학과) ;
  • 이석호 (서울대학교 컴퓨터 공학부)
  • Published : 2001.09.01

Abstract

The distance join is a spatial join which finds data pairs in the order of distance when associating two spatial data sets. This paper proposes several methods to optimize the adaptive multi-stage distance join, presented in [1]. First, we optimize the sweeping index formula which is used for selecting sweeping axis during plane sweeping. Second, to improve the performance of a priority queue used for maintaining node pairs, we propose to use the maximum distance of a node pair as the second priority of the queue. Moreover, we compare trade-offs in estimating the cut-off distance between under uniformity assumption of data distribution and non-uniformity assumption. The experiments show that the proposed methods greatly improve the performance of the algorithm in CPU cost as well as in I/O cost.

거리조인은 두 공간 데이터 집합 사이의 데이터쌍을 거리 상 가까운 순으로 검색하는 공간조인이다. 본 논문에서는 [1]에서 제시한 적응식 다단계 거리 조인 기법을 최적화하기 위한 기법들을 제안한다. 첫째, 평면 스위핑 축 선택을 위해 사용되는 스위핑 인덱스 공식을 최적화한다. 둘째, 노드쌍을 관리하는데 사용한 메인큐의 성능 향상을 위하여 노드쌍의 최대 거리값을 큐의 2차 우선 순위로 적용하는 기법을 제안한다. 또한, 균등 분포 및 비균등 분포 가정하의 한계 거리값 예측 기법의 장단점을 비교한다. 실험 결과는 제안하는 기법들을 통하여 알고리즘의 성능이 CPU 비용과 I/O 비용 면에서 크게 향상되었음을 보여준다.

Keywords

References

  1. Hyoseop Shin, Bongki Moon, Sukho Lee, 'Adaptive Multi-Stage Distance Join Processing,' ACM SIGMOD Conference 2000, Dallas, America, May, 14 - 19, 2000 https://doi.org/10.1145/335191.335428
  2. 신효섭, 이석호, '공간 데이타베이스에서 최근접 K쌍을 찾는 효율적 기법', 정보과학회 논문지: 데이타베이스, 27권 2호, pp.238-246, 2000
  3. Hjaltason G. R. and Samet H., 'Incremental Distance Join Algorithms for Spatial Databases,' Proc. of ACM SIGMOD Conf., 1998 https://doi.org/10.1145/276305.276326
  4. Guttman A., 'R-Trees: A Dynamic Index Structure for Spatial Searching.' Proc.of ACM SIGMOD, 1984 https://doi.org/10.1145/602259.602266
  5. Beckmann N., Kriegel H. P., Schneider R., Seeger B., 'The R*-tree: An Efficient and Robust Access Method for Points and Rectangles,' Proc. of ACM SIGMOD, 1990 https://doi.org/10.1145/93597.98741
  6. Sellis T., Roussopoulos N., Faloutsos C., 'The R+-Tree: A Dynamic Index for Multi-Dimensional Objects,' Proc. of VLDB conf. 1987
  7. Berchtold S., Keim D., Kriegel H. P., 'The X-Tree; An Index Structure for High-Dimensional Data,' Proc. of VLDB conf. 1996
  8. Henrich A., 'The $LSD^h$-tree: An Access Structure for Feature Vectors,' Proc. of ICDE, 1998
  9. Robinson J. T., 'The K-D-B-tree: A Search Structure for Large Multidimensional Dynamic Indexes,' Proc. of ACM SIGMOD, 1981 https://doi.org/10.1145/582318.582321
  10. Arge L., Procepiue O., Ramaswamy S., Suel T., Vitter J. S., 'Scalable Sweeping-Based Spatial Join,' Proc. of VLDG conf., 1998
  11. Brinkhoff T., Kriegel H. P., Seeger B., 'Efficient Processing of Spatial Joins Using R-Trees,' Proc. of ACM SIGMOD, 1993 https://doi.org/10.1145/170036.170075
  12. Patel J. M. and DeWitt D. J., 'Partition Based Spatial-Merge Join,' Proc. of ACM SIGMOD, 1996 https://doi.org/10.1145/235968.233338
  13. Christos Faloutsos, Bernhard Seeger, Agma J. M. Traina, Caetano Traina Jr, 'Spatial Join Selectivity Using Power Laws,' ACM SGMOD Conference 2000, Dallas, America, May 14 - 19, 2000