Combining R-trees and Signature Files for Handling k-Nearest Neighbor Queries with Non-spatial Predicates

비공간 검색 조건이 포함된 k-최근접 질의 처리를 위한 R-트리와 시그니쳐 파일의 결합

  • 박동주 (서울대학교 컴퓨터공학부) ;
  • 김형주 (서울대학교 컴퓨터공학부)
  • Published : 2000.12.01

Abstract

멀티미디어 데이터베이스에서 k-최근접 질의는 가장 일반적이며, 비공간 검색 조건이 포함된 경우가 많다. 현재까지 이러한 질의를 위한 여러 기법 중에서 Hjaltason과 Samet이 제안한 점증적 최근접 알고리즘에 가장 유용하다고 알려져 있다. 질의 처리를 위해 상위 연산자가 k보다 많은 객체를 요구할 때, 이 알고리즘은 처음부터 질의를 재실행하지 않고 다음 객체를 전달할 수 있기 때문이다. 그런데, 이 알고리즘에서 사용하는 R-트리는 결국에는 비공간 검색조건을 만족시키지 않을 투플 후보들을 부분적으로 제거할 수가 없기 때문에 비효율적이다. 본 논문에서 우리는 이 알고리즘을 보완한 RS-트리 기반 점증적 최근접 알고리즘을 제안한다. RS-트리는 R-트리와, 그 보조 트리로서 계층적 시스니쳐 파일을 기반으로 하는 S-트리로 구성된다. S-트리는 R-트리를 탐색하는 과정에서 많은 불필요한 투플을 제거하는 역할을 수행한다. 본 논문에서는 실험을 통해 RS-트리가 Hjaltason과 Samet의 알고리즘의 성능을 향상시킬 수 있음을 보인다.

Keywords

References

  1. G. R. Hjaltason and H. Samet. Distance Browsing in Spatial Databases. ACM Transactions on Database Systems, 24(2), June 1999 https://doi.org/10.1145/320248.320255
  2. S. Berchtold, C. Bohm, D. A. Keim, and H.-P. Kriegel. A Cost Model For Nearest Neighbor Search in High-Dimensional Data Space. In Proc. of the 16th ACM SIGACT-SIGMOD-SIGART Symposium on Principles of Database Systems, May 1997 https://doi.org/10.1145/263661.263671
  3. A. J. Broder. Strategies for Efficient Incremental Nearest Neighbor Search. Pattern Recognition, 23(1-2), January 1990 https://doi.org/10.1016/0031-3203(90)90057-R
  4. A. Henrich. A Distance-scan Algorithm for Spatial Access Structures. In Proc. of the Second ACM Workshop on Geographic Information Systems, December 1994
  5. N. Roussopoulos, S. Kelley, and F. Vincent. Nearest Neighbor Queries. In Proc. of the ACM SIGMOD Conf., May 1995
  6. Ronald Fagin. Fuzzy Queries in Multimedia Database Systems. In Proc. of the 16th ACM SIGACT-SIGMOD-SIGART Symposium on Principles of Database Systems, June 1998 https://doi.org/10.1145/275487.275488
  7. Walter W. Chang and Hans J. Schek. A Signature Access Method for the Startbust Database System. In Proc. of the 15th Int'l Conf. on Very Large Data Bases, August 1989
  8. J. M. Patel et al. Building a Scaleable Geo-Spatial DBMS: Technology, Implement ation, and Evaluation. In Proc. of the ACM SIGMOD Conf., June 1997
  9. S. Grumbach, P. Rigaux, and L. Segoufin. The DEDALE System for Complex Spatial Queries. In Proc. of the ACM SIGMOD Conf., June 1998 https://doi.org/10.1145/276304.276324
  10. V. E. Ogle and M. Stonebraker. Chabot: Retrieval from a Relational Database of Images. IEEE Computer, 28(9), September 1995 https://doi.org/10.1109/2.410150
  11. M. Flickner et al. Query by Image and Video Content: The QBIC System. IEEE Computer, 28(9), September 1995 https://doi.org/10.1109/2.410146
  12. T. Seidl and H.-P. Kriegel. Optimal Multi-Step k-Nearest Neighbor Search. In Proc. of the ACM SIGMOD Conf., June 1998 https://doi.org/10.1145/276304.276319
  13. R. Weber, H.-J. Schek, and S. Blott. A Quantitative Analysis and Performance Study for Similarity-Search Methods in High-Dimensional Spaces. In Proc. of 24rd International Conf. on Very Large Data Bases, August 1998
  14. S. Berchtold, C. Bohm, B. Braunmuller, D. A. Keim, and H.-P. Kriegel. Fast Parallel Similarity Search in Multimedia Databases. In Proc. of the ACM SIGMOD Conf., June 1997 https://doi.org/10.1145/253262.253263
  15. S. Arya, D. M. Mount, N. S. Netanyahu, R. Silverman, and A. Y. Wu. An Optimal Algorithm for Approximate Nearest Neighbor Searching Fixed Dimensions. Journal of the ACM, 45(6), Nov. 1998 https://doi.org/10.1145/293347.293348
  16. S.B. Yao. Approximating Block Accesses in Database Organization. Communications of the ACM, 20(4), April 1977 https://doi.org/10.1145/359461.359475
  17. N. Beckmann, H. P. Kriegel, R. Schneider, and B. Seeger. The R*-tree: An Efficient And Robust Access Method for Points and Rectangles. In Proc. of the ACM SIGMOD Conf., June 1990
  18. C. Faloutsos and S. Christodoulakis. Optimal Signature Extraction and Information Loss. ACM Transactions on Database Systems, 12(3), September 1987 https://doi.org/10.1145/27629.214285