초록
고차원 공간상의 벡터들 간의 유클리드 거리를 빠르게 계산하는 것은 멀티미디어 정보 검색을 위하여 매우 중요하다. 본 논문에서는 고차원 공간상의 두 벡터들 간의 유클리드 거리를 효과적으로 근사하는 방법을 제안한다. 이러한 근사를 위하여 두 벡터들의 놈(norm)을 사용하는 방법이 기존에 제안된 바 있다. 그러나 기존의 방법은 두 벡터간의 각도 성분을 무시하므로 근사 오차가 매우 커지는 문제점을 가진다. 본 연구에서 제안하는 방법은 기준 벡터라 부르는 별도의 벡터를 이용하여 추정된 두 벡터간의 각도 성분을 그들을 위한 유클리드 거리 근사에 사용한다. 이 결과, 각도 성분을 무시하는 기존의 방법과 비교하여 근사 오차를 크게 줄일 수 있다. 또한, 제안된 방법에 의한 근사 값은 유클리드 거리 보다 항상 작다는 것을 이론적으로 증명하였다. 이는 제안된 방법을 이용하여 멀티미디어 정보 검색을 수행할 때 착오 기각이 발생하지 않음을 의미하는 것이다. 다양한 실험에 의한 성능 평가를 통하여 제안하는 방법의 우수성을 규명한다.
It is crucial to compute the Euclidean distance between two vectors efficiently in high dimensional space for multimedia information retrieval. In this paper, we propose an effective method for approximating the Euclidean distance between two high-dimensional vectors. For this approximation, a previous method, which simply employs norms of two vectors, has been proposed. This method, however, ignores the angle between two vectors in approximation, and thus suffers from large approximation errors. Our method introduces an additional vector called a reference vector for estimating the angle between the two vectors, and approximates the Euclidean distance accurately by using the estimated angle. This makes the approximation errors reduced significantly compared with the previous method. Also, we formally prove that the value approximated by our method is always smaller than the actual Euclidean distance. This implies that our method does not incur any false dismissal in multimedia information retrieval. Finally, we verify the superiority of the proposed method via performance evaluation with extensive experiments.