• 제목/요약/키워드: K-Nearest Neighbor algorithm

검색결과 265건 처리시간 0.026초

병렬 Shifted Sort 알고리즘의 Warp 단위 CUDA 구현 최적화 (Optimization of Warp-wide CUDA Implementation for Parallel Shifted Sort Algorithm)

  • 박태정
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권4호
    • /
    • pp.739-745
    • /
    • 2017
  • 본 논문에서는 GPU 병렬 처리 하드웨어 아키텍처 내 최소 물리적 스레드 실행 단위(warp) 내에서 shifted sort 기반 k개 최근접 이웃 검색 기법을 구현하는 방법을 논의하고 일반적으로 동일한 목적으로 널리 사용되는 GPU 기반 kd-tree 및 CPU 기반 ANN 라이브러리와 비교한 결과를 제시한다. 또한 많은 애플리케이션에서 k가 비교적 작은 값이 필요한 경우가 많다는 사실을 고려해서 k가 warp 내부에서 직접 처리 가능한 2, 4, 8, 16개일 때 최적화에 집중한다. 구현 세부에서는 사용한 CUB 공개 라이브러리의 루프 내 메모리 관리 방법, GPU 하드웨어 직접 명령 적용 방법 등의 최적화 방법을 논의한다. 실험 결과, 제안하는 방법은 기존의 GPU 기반 유사 방법에 비해 데이터 지점과 질의 지점의 개수가 각각 $2^{23}$개 일 때 16배 이상의 빠른 처리 속도를 보였으며 이러한 경향은 처리해야 할 데이터의 크기가 커지면 더욱 더 커지는 것으로 판단된다.

드론 배달 경로를 위한 효율적인 휴리스틱 알고리즘 (Efficient Heuristic Algorithms for Drone Package Delivery Route)

  • 요나탄;테메스겐;김재훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 춘계학술발표대회
    • /
    • pp.168-170
    • /
    • 2016
  • Drone package delivery routing problem is realistic problem used to find efficient route of drone package delivery service. In this paper, we present an approach for solving drone routing problem for package delivery service using two different heuristics algorithms, genetic and nearest neighbor. We implement and analyze both heuristics algorithms for solving the problem efficiently with respect to cost and time. The respective experimental results show that for the range of customers 10 to 50 nearest neighbor and genetic algorithms can reduce the tour length on average by 34% and 40% respectively comparing to FIFO algorithm.

Guitar Tab Digit Recognition and Play using Prototype based Classification

  • Baek, Byung-Hyun;Lee, Hyun-Jong;Hwang, Doosung
    • 한국컴퓨터정보학회논문지
    • /
    • 제21권9호
    • /
    • pp.19-25
    • /
    • 2016
  • This paper is to recognize and play tab chords from guitar musical sheets. The musical chord area of an input image is segmented by changing the image in saturation and applying the Grabcut algorithm. Based on a template matching, our approach detects tab starting sections on a segmented musical area. The virtual block method is introduced to search blanks over chord lines and extract tab fret segments, which doesn't cause the computation loss to remove tab lines. In the experimental tests, the prototype based classification outperforms Bayesian method and the nearest neighbor rule with the whole set of training data and its performance is similar to that of the support vector machine. The experimental result shows that the prediction rate is about 99.0% and the number of selected prototypes is below 3.0%.

알고리즘 수정에 의한 홉필드 모델의 성능 개선 (Dummy Stored Memory Algorithm for Hopfield Model)

  • 오상훈;윤태훈;김재창
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1987년도 전기.전자공학 학술대회 논문집(I)
    • /
    • pp.41-44
    • /
    • 1987
  • Recently Hopfield proposed a model for content-addressable memory, which has been shown to be capable of storing information in a distributed fashion and determining the nearest-neighbor. Its application is, however, inherently limited to the case that the number of l's in each stored vector is nearly the same as the number of O's in that vector. If not the case, the model has high probability of failure in finding the nearest-neighbor. In this work, a modification of the Hopfield's model, which works well irrespective of the number of l's (or O's) in each stored vector, is suggested.

  • PDF

k-Nearest Neighbor 알고리즘을 이용한 도심 내 주요 도로 구간의 교통속도 단기 예측 방법 (Short-Term Prediction of Vehicle Speed on Main City Roads using the k-Nearest Neighbor Algorithm)

  • 모하메드 아리프 라시이디;김정민;류광렬
    • 지능정보연구
    • /
    • 제20권1호
    • /
    • pp.121-131
    • /
    • 2014
  • 교통속도는 교통 문제를 해결하기 위한 중요한 지표 중 하나이다. 이를 이용하여 교통혼잡 탐지, 주행 시간 예측, 도로 설계와 같은 다양한 문제 해결에 활용할 수 있다. 따라서 정확한 교통속도 예측은 지능형 교통 시스템의 개발에 있어 필수적인 요소라고 할 수 있다. 본 논문에서는 대한민국 부산시의 특정 도로를 대상으로 교통 속도에 대한 분석 및 예측을 수행하였다. 과거 연구에서는 대상 도로의 속도 예측을 위해 과거 대상 도로의 교통속도 이력 데이터만을 사용하였다. 그러나 실제 대상 도로의 교통 상황은 인접한 도로의 교통 상황의 영향을 받게 된다. 따라서 본 논문에서는 실제 부산시의 과거 교통속도 이력 데이터를 기반으로 대상 도로와 인접 도로를 모두 고려하여 교통속도 예측 모델의 학습을 위한 속성을 추출하였다. 이와 같이 후보 속성들을 추출 한 후 선형 회귀 (linear regression), 모델 트리 (model tree) 및 k-nearest neighbor (k-NN) 기법을 이용하여 속성의 부분집합 선택 (feature subset selection)과 교통속도 예측 모델 생성을 수행하였다. 실험 결과 주어진 교통 데이터에서 k-NN 기법은 선형 회귀 및 모델 트리 기법에 비해 평균절대백분율오차 (mean absolute percent error, MAPE)와 제곱근평균제곱오차 (root mean squared error, RMSE) 측면에서 더 나은 성능을 보임을 확인하였다.

도로망에서 움직이는 k-최원접 이웃 질의를 위한 일괄 처리 알고리즘 (Batch Processing Algorithm for Moving k-Farthest Neighbor Queries in Road Networks)

  • 조형주
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.223-224
    • /
    • 2021
  • Recently, k-farthest neighbor (kFN) queries have not as much attention as k-nearest neighbor (kNN) queries. Therefore, this study considers moving k-farthest neighbor (MkFN) queries for spatial network databases. Given a positive integer k, a moving query point q, and a set of data points P, MkFN queries can constantly retrieve k data points that are farthest from the query point q. The challenge with processing MkFN queries in spatial networks is to avoid unnecessary or superfluous distance calculations between the query and associated data points. This study proposes a batch processing algorithm, called MOFA, to enable efficient processing of MkFN queries in spatial networks. MOFA aims to avoid dispensable distance computations based on the clustering of both query and data points. Moreover, a time complexity analysis is presented to clarify the effect of the clustering method on the query processing time. Extensive experiments using real-world roadmaps demonstrated the efficiency and scalability of the MOFA when compared with a conventional solution.

  • PDF

Nearest Neighbor Based Prototype Classification Preserving Class Regions

  • Hwang, Doosung;Kim, Daewon
    • Journal of Information Processing Systems
    • /
    • 제13권5호
    • /
    • pp.1345-1357
    • /
    • 2017
  • A prototype selection method chooses a small set of training points from a whole set of class data. As the data size increases, the selected prototypes play a significant role in covering class regions and learning a discriminate rule. This paper discusses the methods for selecting prototypes in a classification framework. We formulate a prototype selection problem into a set covering optimization problem in which the sets are composed with distance metric and predefined classes. The formulation of our problem makes us draw attention only to prototypes per class, not considering the other class points. A training point becomes a prototype by checking the number of neighbors and whether it is preselected. In this setting, we propose a greedy algorithm which chooses the most relevant points for preserving the class dominant regions. The proposed method is simple to implement, does not have parameters to adapt, and achieves better or comparable results on both artificial and real-world problems.

대용량 자료에 대한 밀도 적응 격자 기반의 k-NN 회귀 모형 (Density Adaptive Grid-based k-Nearest Neighbor Regression Model for Large Dataset)

  • 유의기;정욱
    • 품질경영학회지
    • /
    • 제49권2호
    • /
    • pp.201-211
    • /
    • 2021
  • Purpose: This paper proposes a density adaptive grid algorithm for the k-NN regression model to reduce the computation time for large datasets without significant prediction accuracy loss. Methods: The proposed method utilizes the concept of the grid with centroid to reduce the number of reference data points so that the required computation time is much reduced. Since the grid generation process in this paper is based on quantiles of original variables, the proposed method can fully reflect the density information of the original reference data set. Results: Using five real-life datasets, the proposed k-NN regression model is compared with the original k-NN regression model. The results show that the proposed density adaptive grid-based k-NN regression model is superior to the original k-NN regression in terms of data reduction ratio and time efficiency ratio, and provides a similar prediction error if the appropriate number of grids is selected. Conclusion: The proposed density adaptive grid algorithm for the k-NN regression model is a simple and effective model which can help avoid a large loss of prediction accuracy with faster execution speed and fewer memory requirements during the testing phase.

대규모 무리 짓기에서 이웃 에이전트 탐색의 개선된 알고리즘 (An Improved Algorithm of Searching Neighbor Agents in a Large Flocking Behavior)

  • 이재문;정인환
    • 한국멀티미디어학회논문지
    • /
    • 제13권5호
    • /
    • pp.763-770
    • /
    • 2010
  • 본 논문은 무리 짓기에서 공간분할 방법의 성능을 개선하는 알고리즘을 제안한다. 무리 짓기에서 여러 특성중의 하나는 두 에이전트가 공간적으로 가깝게 있다면 많은 공동 이웃들을 공유한다는 것이다. 본 논문은 이 특성을 적용하여 공간분할 방법을 개선한다. 기존의 공간분할 방법이 한 번에 하나의 에이전트에 대한 k개의 가장 가까운 이웃 에이전트들을 찾는 것에 반하여, 제안하는 방법은 에이전트들이 공간적으로 가까이 있다면 그들에 대하여 동시에 k개의 가장 가까운 이웃 에이전트들을 계산한다. 제안된 알고리즘은 구현되었으며, 그것의 성능은 기존의 공간분할 방법과 실험적으로 비교되었다. 비교의 결과로부터 제안하는 알고리즘이 기존의 방법을 평균적으로 33%정도 개선한다는 것을 알 수 있었다.

유전자 알고리즘을 이용한 사례기반추론 시스템의 최적화: 주식시장에의 응용 (Optimization of Case-based Reasoning Systems using Genetic Algorithms: Application to Korean Stock Market)

  • 김경재;안현철;한인구
    • Asia pacific journal of information systems
    • /
    • 제16권1호
    • /
    • pp.71-84
    • /
    • 2006
  • Case-based reasoning (CBR) is a reasoning technique that reuses past cases to find a solution to the new problem. It often shows significant promise for improving effectiveness of complex and unstructured decision making. It has been applied to various problem-solving areas including manufacturing, finance and marketing for the reason. However, the design of appropriate case indexing and retrieval mechanisms to improve the performance of CBR is still a challenging issue. Most of the previous studies on CBR have focused on the similarity function or optimization of case features and their weights. According to some of the prior research, however, finding the optimal k parameter for the k-nearest neighbor (k-NN) is also crucial for improving the performance of the CBR system. In spite of the fact, there have been few attempts to optimize the number of neighbors, especially using artificial intelligence (AI) techniques. In this study, we introduce a genetic algorithm (GA) to optimize the number of neighbors to combine. This study applies the novel approach to Korean stock market. Experimental results show that the GA-optimized k-NN approach outperforms other AI techniques for stock market prediction.