• 제목/요약/키워드: Approximate Nearest Neighbor

검색결과 25건 처리시간 0.027초

내용 기반 멀티미디어 정보 검색을 위한 근사 k-최근접 데이타 탐색 알고리즘 (An Approximate k-Nearest Neighbor Search Algorithm for Content- Based Multimedia Information Retrieval)

  • 송광택;장재우
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제27권2호
    • /
    • pp.199-208
    • /
    • 2000
  • 내용 기반 멀티미디어 정보 검색에서 유사성에 기반한 k-최근접 데이타 탐색 질의는 매우 중요한 질의이다 일반적으로 멀티미디어 데이타는 고차원 특정 벡터로 표현되기 때문에 기존의 k-최근접 탐색 알고리즘은 멀티미디어 정보 검색에 효율적이지 못하다. 따라서 이러한 응용을 위해서는 다소 근사적 검색 결과를 가져오더라도 빠른 검색 성능을 제공하는 근사 k-최근접 탐색 알고리즘이 요구된다. 이를 위해 본 논문에서는 고차원 데이타를 위한 새로운 근사 k-최근접 탐색 알고리즘을 제안한다. 아울러, 제안하는 근사 k-최근접 탐색 알고리즘을 기존의 알고리즘과 검색 성능변에서 성능 평가를 수행한다. 성능 평가 결과, 기존 알고리즘의 검색 성능을 크게 개선할 수 있었다.

  • PDF

The privacy protection algorithm of ciphertext nearest neighbor query based on the single Hilbert curve

  • Tan, Delin;Wang, Huajun
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권9호
    • /
    • pp.3087-3103
    • /
    • 2022
  • Nearest neighbor query in location-based services has become a popular application. Aiming at the shortcomings of the privacy protection algorithms of traditional ciphertext nearest neighbor query having the high system overhead because of the usage of the double Hilbert curves and having the inaccurate query results in some special circumstances, a privacy protection algorithm of ciphertext nearest neighbor query which is based on the single Hilbert curve has been proposed. This algorithm uses a single Hilbert curve to transform the two-dimensional coordinates of the points of interest into Hilbert values, and then encrypts them by the order preserving encryption scheme to obtain the one-dimensional ciphertext data which can be compared in numerical size. Then stores the points of interest as elements composed of index value and the ciphertext of the other information about the points of interest on the server-side database. When the user needs to use the nearest neighbor query, firstly calls the approximate nearest neighbor query algorithm proposed in this paper to query on the server-side database, and then obtains the approximate nearest neighbor query results. After that, the accurate nearest neighbor query result can be obtained by calling the precision processing algorithm proposed in this paper. The experimental results show that this privacy protection algorithm of ciphertext nearest neighbor query which is based on the single Hilbert curve is not only feasible, but also optimizes the system overhead and the accuracy of ciphertext nearest neighbor query result.

이동객체의 궤적에 대한 연속 최근접 질의에 관한 연구 (Study on Continuous Nearest Neighbor Query on Trajectory of Moving Objects)

  • 정지문
    • 디지털융복합연구
    • /
    • 제3권1호
    • /
    • pp.149-163
    • /
    • 2005
  • Researches for NN(nearest neighbor) query which is often used in LBS system, have been worked. However. Conventional NN query processing techniques are usually meaningless in moving object management system for LBS since their results may be invalidated as soon as the query and data objects move. To solve these problems, in this paper we propose a new nearest neighbor query processing technique, called CTNN, which is possible to meet continuous trajectory nearest neighbor query processing. The proposed technique consists of Approximate CTNN technique which has quick response time, and Exact CTNN technique which makes it possible to search accurately nearest neighbor objects. Experimental results using GSTD datasets shows that the Exact CTNN technique has high accuracy, but has a little low performance for response time. They also shows that the Approximate CTNN technique has low accuracy comparing with the Exact CTNN, but has high response time.

  • PDF

공간 데이터베이스 시스템에서 근사 k-최대근접질의의 처리방법 (The Method to Process Approximate k-Nearest Neighbor Queries in Spatial Database Systems)

  • 선휘준;김홍기
    • 한국컴퓨터산업학회논문지
    • /
    • 제4권4호
    • /
    • pp.443-448
    • /
    • 2003
  • 공간 데이터베이스 시스템에서는 주어진 위치에서 가장 근접한 k개의 객체를 찾는 근사 k-최대 근접질의가 자주 발생한다. 근사 k-최대 근접 질의의 성능을 높이기 위해서는 색인에서 검색되는 노드의 수를 최소화할 수 있어야 한다. 본 논문에서는 기존의 알고리즘을 확장하여 동적인 공간 데이터베이스 환경에서 R-트리 유형의 색인 구조를 이용한 근사 k-최대 근접 질의 처리방법을 제안하고 그 성능을 평가 한다. 실험결과에 의하면, 제안된 방법은 객체의 분포 형태, 질의 크기 그리고 근사율에 관계없이 항상 낮은 디스크 접근 횟수를 보였다.

  • PDF

이동객체의 궤적에 대한 연속 최근접 질의에 관한 연구 (Study on Continuous Nearest Neighbor Query on Trajectory of Moving Objects)

  • 정지문
    • 한국디지털정책학회:학술대회논문집
    • /
    • 한국디지털정책학회 2005년도 춘계학술대회
    • /
    • pp.517-530
    • /
    • 2005
  • Researches for NN(nearest neighbor) query which is often used in LBS system, have been worked. However, Conventional NN query processing techniques are usually meaningless in moving object management system for LBS since their results may be invalidated as soon as the query and data objects move. To solve these problems, in this paper we propose a new nearest neighbor query processing technique, called CTNN, which is possible to meet continuous trajectory nearest neighbor query processing. The proposed technique consists of Approximate CTNN technique which has quick response time, and Exact CTNN technique which makes it possible to search accurately nearest neighbor objects. Experimental results using GSTD datasets showed that the Exact CTNN technique has high accuracy, but has a little low performance for response time. They also showed that the Approximate CTNN technique has low accuracy comparing with the Exact CTNN, but has high response time.

  • PDF

Locality-Sensitive Hashing Techniques for Nearest Neighbor Search

  • Lee, Keon Myung
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제12권4호
    • /
    • pp.300-307
    • /
    • 2012
  • When the volume of data grows big, some simple tasks could become a significant concern. Nearest neighbor search is such a task which finds from a data set the k nearest data points to queries. Locality-sensitive hashing techniques have been developed for approximate but fast nearest neighbor search. This paper introduces the notion of locality-sensitive hashing and surveys the locality-sensitive hashing techniques. It categories them based on several criteria, presents their characteristics, and compares their performance.

추가 학습이 빈번히 필요한 비포장도로에서 주행로 탐색에 적합한 GLSL 기반 ALNN Algorithm (GLSL based Additional Learning Nearest Neighbor Algorithm suitable for Locating Unpaved Road)

  • 구본우;김준겸;이은주
    • 한국정보전자통신기술학회논문지
    • /
    • 제12권1호
    • /
    • pp.29-36
    • /
    • 2019
  • 국방 분야에서 무인 차량의 주행로는 포장 도로 뿐만 아니라, 자주 다양한 변화를 갖는 야지의 비포장 도로 등이 포함된다. 이 무인 차량은 주로 험지나 오지에서 감시 및 정찰, 진지 방어 등을 수행하므로 자율 주행을 위해서 예측하지 못했던 다양한 주행로와 환경을 수시로 접하게 되며, 이에 따라 추가 학습이 필요하다. 본 논문에서는 'Forgetting' 문제를 피하면서 거리 비교와 Class 비교를 통해 빠르게 추가 학습이 가능하도록 Approximate Nearest Neighbor를 수정한 GPU 기반 Additional Learning Nearest Neighbor(ALNN) 알고리즘을 제안한다. 또 ALNN 알고리즘은 학습 데이터가 누적될수록 연산 속도가 저하되는 문제가 있고, 본 연구에서는 OpenGL Shading Language 기반의 GPU 병렬 처리를 사용하여 이를 해결하였다. ALNN 알고리즘은 기존의 학습 데이터에 영향을 주지 않으면서 빠르게 추가 학습이 가능하여, 빈번히 실시간으로 재학습이 필요한 국방 등의 분야에 활용될 수 있다.

도로 네트워크 데이타베이스에서 근사 색인을 이용한 k-최근접 질의 처리 (k-Nearest Neighbor Querv Processing using Approximate Indexing in Road Network Databases)

  • 이상철;김상욱
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권5호
    • /
    • pp.447-458
    • /
    • 2008
  • 본 논문에서는 도로 네트워크 데이타베이스에서 정적 객체의 k-최근접 이웃 질의를 효율적으로 처리하기 위한 방안을 논의한다. 기존의 여러 기법들은 인덱스를 사용하지 못했는데, 이는 네트워크 거리가 순서화 된 거리함수가 아니며 삼각 부등식(triangular inequality) 성질 또한 만족하지 못하기 때문이다. 이러한 기존 기법들은 질의 처리 시 심각한 성능 저하의 문제를 가진다. 선계산된 네트워크 거리를 이용하는 또 다른 기법은 저장 공간의 오버헤드가 크다는 문제를 갖는다. 본 논문에서는 이러한 두 가지 문제점들을 동시에 해결하기 위하여 객체들 간의 네트워크 거리를 근사하여 객체들에 대한 인덱스를 구축하고, 이를 이용하여 k-최근접 이웃 질의를 처리하는 새로운 기법을 제안한다. 이를 위하여 본 논문에서는 먼저 네트워크 공간상의 객체를 유클리드 공간상으로 사상하기 위한 체계적인 방법을 제시한다. 특히, 삼각 부등식 성질을 만족시키기 위하여 평균 네트워크 거리라는 새로운 거리 개념을 제시하고, 유클리드 공간으로의 사상을 위하여 FastMap 기법을 사용한다. 다음으로, 평균 네트워크 거리와 FastMap을 사용하여 네트워크 공간상의 객체들로 인덱스를 구축하는 근사 색인 알고리즘을 제시한다. 또한, 구축한 인덱스를 사용하여 k-최근접 이웃 질의를 효과적으로 수행하는 알고리즘을 제안한다. 마지막으로, 실제 도로 네트워크를 이용한 다양한 실험을 통하여 제안된 기법의 우수성을 규명한다.

이동객체의 궤적에 대한 연속 최근접 질의 처리 (Continuous Nearest Neighbor Query Processing on Trajectory of Moving Objects)

  • 지정희;최보윤;김상호;류근호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권5호
    • /
    • pp.492-504
    • /
    • 2004
  • 최근 위치 기반 서비스 기술에 관한 관심이 증가하면서, 시간에 따라 연속적으로 변하는 이동 객체에 관한 많은 연구들이 활발하게 수행되고 있다. 또한 이 시스템들이 자주 사용되는 질의 처리 기법 중 하나인 최근접(nearest neighbor, NN) 질의에 대한 연구도 다양하게 수행되고 있다. 그러나, 기존의 최근접 질의 처리 기법들은 질의와 객체가 이동하면 그들이 결과가 유효하지 않게 되므로, LBS를 위한 이동객체 관리 시스템에는 적합하지 않을 수 있다. 이러한 문제들을 해결하기 위해서 이동객체에 대한 정확하고 연속적인 질의 처리가 가능한 새로운 최 근접 질의 처리 기법을 제안하였으며, 이를 연속 궤적 최근접(continuous trajectory NN, CTNN) 질의라 부른다. 이 논문에서는 빠른 응답 시간을 얻기 위한 근사 연속 궤적 최근접(approximate CTNN, ACTNN) 질의 처리 기법과 정확한 최근접 탐색을 가능하게 하는 정확 연속 궤적 최근접(exact CTNN, ECTNN) 질의 처리 기법을 제안하였다. 우리는 여러 데이타 셋을 기반으로 실험을 하였으며, 실험결과는 제안된 ECTNN 기법의 경우 정확도는 상당히 높은 반면, 응답시간은 약간 낮은 성능을 보였다 또한 ACTNN 기법의 경우 정확도는 ECTNN 기법에 비해 낮은 반면, 응답시간은 높은 성능을 보였다. 제안된 기법들은 항해 시스템, 교통 통제 시스템, 물류정보 시스템 등 각종 위치 기반 서비스에 다양하게 사용될 수 있고, 특히 질의 객체와 데이타 객체가 모두 이동 점 객체이면서 이들의 궤적 정보를 미리 파악할 수 있는 경우에 가장 적합하다.

병렬 Shifted Sort 알고리즘의 Warp 단위 CUDA 구현 최적화 (Optimization of Warp-wide CUDA Implementation for Parallel Shifted Sort Algorithm)

  • 박태정
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권4호
    • /
    • pp.739-745
    • /
    • 2017
  • 본 논문에서는 GPU 병렬 처리 하드웨어 아키텍처 내 최소 물리적 스레드 실행 단위(warp) 내에서 shifted sort 기반 k개 최근접 이웃 검색 기법을 구현하는 방법을 논의하고 일반적으로 동일한 목적으로 널리 사용되는 GPU 기반 kd-tree 및 CPU 기반 ANN 라이브러리와 비교한 결과를 제시한다. 또한 많은 애플리케이션에서 k가 비교적 작은 값이 필요한 경우가 많다는 사실을 고려해서 k가 warp 내부에서 직접 처리 가능한 2, 4, 8, 16개일 때 최적화에 집중한다. 구현 세부에서는 사용한 CUB 공개 라이브러리의 루프 내 메모리 관리 방법, GPU 하드웨어 직접 명령 적용 방법 등의 최적화 방법을 논의한다. 실험 결과, 제안하는 방법은 기존의 GPU 기반 유사 방법에 비해 데이터 지점과 질의 지점의 개수가 각각 $2^{23}$개 일 때 16배 이상의 빠른 처리 속도를 보였으며 이러한 경향은 처리해야 할 데이터의 크기가 커지면 더욱 더 커지는 것으로 판단된다.