An Approximate k-Nearest Neighbor Search Algorithm for Content- Based Multimedia Information Retrieval

내용 기반 멀티미디어 정보 검색을 위한 근사 k-최근접 데이타 탐색 알고리즘

  • 송광택 (전북대학교 컴퓨터공학과) ;
  • 장재우 (전북대학교 컴퓨터공학과)
  • Published : 2000.06.30

Abstract

The k-nearest neighbor search query based on similarity is very important for content-based multimedia information retrieval(MIR). The conventional exact k-nearest neighbor search algorithm is not efficient for the MIR application because multimedia data should be represented as high dimensional feature vectors. Thus, an approximate k-nearest neighbor search algorithm is required for the MIR applications because the performance increase may outweigh the drawback of receiving approximate results. For this, we propose a new approximate k-nearest neighbor search algorithm for high dimensional data. In addition, the comparison of the conventional algorithm with our approximate k-nearest neighbor search algorithm is performed in terms of retrieval performance. Results show that our algorithm is more efficient than the conventional ones.

내용 기반 멀티미디어 정보 검색에서 유사성에 기반한 k-최근접 데이타 탐색 질의는 매우 중요한 질의이다 일반적으로 멀티미디어 데이타는 고차원 특정 벡터로 표현되기 때문에 기존의 k-최근접 탐색 알고리즘은 멀티미디어 정보 검색에 효율적이지 못하다. 따라서 이러한 응용을 위해서는 다소 근사적 검색 결과를 가져오더라도 빠른 검색 성능을 제공하는 근사 k-최근접 탐색 알고리즘이 요구된다. 이를 위해 본 논문에서는 고차원 데이타를 위한 새로운 근사 k-최근접 탐색 알고리즘을 제안한다. 아울러, 제안하는 근사 k-최근접 탐색 알고리즘을 기존의 알고리즘과 검색 성능변에서 성능 평가를 수행한다. 성능 평가 결과, 기존 알고리즘의 검색 성능을 크게 개선할 수 있었다.

Keywords

References

  1. Beckmann N., Kriegel H.-P, Schneider R., Seeger B., 'The R*-tree: An Efficient and Robust Access Method for Points and Rectangles,' Proc. ACM SIGMOD Int. Conf. on Management of Data, Atlantic City, NJ, 1990, pp. 322-331
  2. K.I. Lin, H. Jagadish, C. Faloutsos, 'The TV-tree: An Index Structure for High Dimensional Data,' VLDB Journal, Vol. 3, pp. 517-542, 1994 https://doi.org/10.1007/BF01231606
  3. D. A. White and R. Jain, 'Similarity Indexing with the SS-tree,' In Proc. Intl. Conf. on Data, Engineering, pp. 516-523, 1996 https://doi.org/10.1109/ICDE.1996.492202
  4. D.A. White and R. Jain, 'Similarity Indexing : Algorithms and Performance,' In Proc. of the SPIE : Storage and Retrieval for Image and Video Databases IV, Vol. 2670, pp. 62-75, 1996
  5. Berchtold S., Keim D., Kriegel H.-P., 'The X-tree: An Index Structure for High-Dimensional Data,' 22nd Conf. on Very Large Databases, 1996, Bombay, India
  6. Roussopoulos N., Kelley S., Vincent F., 'Nearest Neighbor Queries,' Proc. ACM SIGMOD Int. Conf. on Management of Data, 1995, pp. 71-79
  7. Arya, S. et al., 'An Optimal Algorithm for Approximate Nearest Neighbor Searching,' In Proc. ACM-SIAM Symposium on Discrete Algorithms, pp. 573-582, 1994
  8. 노웅기, 황규영, '멀티미디어 내용기반 검색을 위한 빠른k-최근접 객체 탐색 알고리즘,' '97 한국정보과학회 가을 학술 발표논문집, Vol. 24, No. 2, pp. 167-170, 1997
  9. S. Berchtold, C. Bohm, D. Keim, and H. -P. Kriegel, 'A Cost Model for Nearest Neighbor Search in High-Dimensional Data Space,' In Proceesings of ACM PODS Symposium on Principles of Database System, 1997 https://doi.org/10.1145/263661.263671
  10. Myron Flickner and et. al., 'Query by Image and Video Content: The QBIC System,' IEEE Computer, 28(9), 1995 https://doi.org/10.1109/2.410146