Analysis of k-Nearest Neighbor Search in High-Demensional Vector Spaces

고차원 벡터 공간에서 k-최근접 검색에 관한 분석

  • 최승락 (한국과학기술원 전산하과) ;
  • 곽태영 (한국과학기술원 전산하과) ;
  • 신봉근 (한국과학기술원 전산하과) ;
  • 이윤준 (한국과학기술원 전산하과) ;
  • 김명호 (한국과학기술원 전산하과)
  • Published : 1998.10.01

Abstract

지금까지 제시된 최근접 질의 알고리즘은다소간의 cklms 있으나 기본적으로 질의 점과 MBR간의 최소거리에 기반한 분기와 한정 기법을 이용하고 있다. 그러나 차원이 증가함에 따라 질의 구와 겹치는 노드가 급속히 증가하기 때문에 최근접 질의 알고리즘의 성능은 매우 비효율적이다. 이러한 문제를 해결하기 위해서 MBR 간의 중첩을 줄이고 MBR 내에 가급적 많은 점을 포함할 수 있는 다양한 다차원 색인 구조가 제시도 되었다. 그러나 우리의 실험에 의하면 이러한 방법이 근본적인 해결책이 되지 못함을 알 수 있다. 고차원 백터 공간 모델이 가지는 문제로써 임의의 질의 점으로부터 모든 데이터 점들까지의 거리가 차원이 올라감에 따라 유사해지는 현상 때문에 비효율적인 성능이 나옴을 본 논문에서 지적한다.

Keywords