• 제목/요약/키워드: k-최근접

검색결과 283건 처리시간 0.031초

랜덤 투영 앙상블 기법을 활용한 적응 최근접 이웃 판별분류기법 (Random projection ensemble adaptive nearest neighbor classification)

  • 강종경;전명식
    • 응용통계연구
    • /
    • 제34권3호
    • /
    • pp.401-410
    • /
    • 2021
  • 판별분류분석에서 널리 이용되는 k-최근접 이웃 분류 방법은 고정된 이웃의 수만을 고려하여 자료의 국소적 특징을 반영하지 못하는 한계가 있다. 이에 자료의 국소적 구조를 고려하여 이웃의 개수를 선택하는 적응 최근접이웃방법이 개발된 바 있다. 고차원 자료의 분석에 있어서는 k-최근접 이웃 분류를 사용하기 전에 랜덤 투영 기법 등을 활용하여 차원 축소를 수행하는 것이 일반적이다. 이렇게 랜덤 투영시킨 다수의 분류 결과들을 면밀히 조합하여 투표를 통해 최종 할당을 하는 기법이 최근 개발된 바 있다. 본 연구에서는 고차원 자료에서의 분석을 위해 적응 최근접이웃방법과 랜덤 투영 앙상블 기법을 조합한 새로운 판별분류 기법을 제안하였다. 제안된 방법은 기존에 개발된 방법에 비해 분류 정확성 측면에서 더 뛰어남을 모의실험 및 실제 사례 분석을 통해 확인하였다.

최근접 이웃 규칙 기반 프로토타입 선택과 편의-분산을 이용한 성능 평가 (Nearest-neighbor Rule based Prototype Selection Method and Performance Evaluation using Bias-Variance Analysis)

  • 심세용;황두성
    • 전자공학회논문지
    • /
    • 제52권10호
    • /
    • pp.73-81
    • /
    • 2015
  • 이 논문은 프로토타입 선택 방법을 제안하고, 편의-분산 분해를 이용하여 최근접 이웃 알고리즘과 프로토타입 기반 분류 학습의 일반화 성능 비교 평가에 있다. 제안하는 프로토타입 분류기는 클래스 영역 내에서 가변 반지름을 이용한 다차원 구를 정의하고, 적은 수의 프로토타입으로 구성된 새로운 훈련 데이터 집합을 생성한다. 최근접 이웃 분류기는 새 훈련 집합을 이용하여 테스트 데이터의 클래스를 예측한다. 평균 기대 오류의 편의와 분산 요소를 분해하여 최근접 이웃 규칙, 베이지안 분류기, 고정 반지름을 이용한 프로토타입 선택 방법, 제안하는 프로토타입 선택 방법의 일반화 성능을 비교한다. 실험에서 제안하는 프로토타입 분류기의 편의-분산 변화 추세는 모든 훈련 데이터를 사용하는 최근접 이웃 알고리즘과 비슷한 편의-분산 추세를 보였으며, 프로토타입 선택 비율은 전체 데이터의 평균 약 27.0% 이하로 나타났다.

모바일 객체의 방향성을 고려한 최근접 질의 처리 (Nearest Neighbor Query Processing using the Direction of Mobile Object)

  • 이응재;정영진;최현미;류근호;이성호
    • 한국공간정보시스템학회 논문지
    • /
    • 제6권1호
    • /
    • pp.59-71
    • /
    • 2004
  • 최근접 질의 (NN: Nearest Neighbor Query)는 질의요청자와 가상 가까운 곳에 위치한 대상 객체를 검색하기 위한 질의로서, 모바일 환경에서 빈번하게 사용되는 질의 유형이다. 이 논문에서는 모바일 환경에서 방향 성분을 가지며 연속적으로 이동하는 질의 요청자가 요구하는 최근접 대상 객체를 검색하기 위한 질의 처리 방법을 제안한다. 제안된 방법은 모바일 환경에서 특정 방향 성분을 갖고 위치를 이동하는 질의요청자의 방향 속성을 반영하여 최근접 객체를 검색할 수 있도록 유클리디안 거리 정보뿐만 아니라 사용자의 진행 방향을 고려하여 최근섭 대상 객체를 검색한다. 제안된 방법은 모바일 환경에서 최근섭 객체의 검색 기능을 요구하는 교통 정보 시스템, 관광정보 시스템, 위치 기반 추천 시스템과 같은 응용 분야에 적용할 수 있다.

  • PDF

공간 네트워크 데이터베이스에서 실체화 기법을 이용한 범위 및 k-최근접 질의처리 알고리즘 (Range and k-Nearest Neighbor Query Processing Algorithms using Materialization Techniques in Spatial Network Databases)

  • 김용기;니하드 카림 초우더리;이현조;장재우
    • 한국공간정보시스템학회 논문지
    • /
    • 제9권2호
    • /
    • pp.67-79
    • /
    • 2007
  • 최근 LBS(location-based service) 및 텔레매틱스(telematics) 응용의 효율적인 지원을 위해, 유클리디언(Euclidean) 공간을 대신하여 실제 도로나 철도와 같은 공간 네트워크(network)를 고려한 연구가 활발하게 수행중이다. 그러나 기존 연구에서의 범위 질의 및 k-최근접 질의 처리 알고리즘은 범위나 k 값의 증가에 따라 검색에 필요한 노드 검색 및 거리 계산의 비용 증가로 인하여 선형적인 성능 감소를 보인다. 따라서, 본 논문에서는 공간 네트워크를 위한 기존 질의처리 알고리즘의 성능을 향상시키기 위해, 실체화 기법을 이용한 효율적인 범위 및 k-최근접 질의처리 알고리즘을 제안한다. 아울러, 기존 알고리즘과의 성능 비교를 통하여 제안하는 알고리즘이 우수함을 보인다.

  • PDF

DNN 모델을 이용한 기계 학습 기반 k-최근접 질의 처리 최적화 기법 (k-NN Query Optimization Scheme Based on Machine Learning Using a DNN Model)

  • 위지원;최도진;이현병;임종태;임헌진;복경수;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제20권10호
    • /
    • pp.715-725
    • /
    • 2020
  • 본 논문에서는 고차원의 특징 벡터에서 질의와 가장 가까운 k개의 데이터를 찾는 k-최근접 질의 최적화 방법을 제안한다. k-최근접 질의는 k개의 데이터를 포함할 가능성이 있는 범위를 기반으로 범위 질의로 변환되어 처리하는 기법이다. 본 논문에서는 처리 비용을 감소시키고 검색 속도를 가속화 할 수 있는 최적의 범위를 도출하기 위해 k-최근접 질의 처리 시 DNN 모델을 이용한 최적화 기법을 제안한다. 제안하는 기법은 온라인 모듈과 오프라인 모듈로 구성된다. 온라인 모듈에서는 클라이언트로부터 요청을 받아 실제 질의를 처리한다. 오프라인 모듈에서는 과거 최적화 기법의 결과를 학습 로그로 사용한 DNN 모델로 최적의 범위를 도출하고 온라인 모듈로 전달한다. 제안하는 기법의 우수성 및 타당성의 입증을 위하여 다양한 성능 평가를 수행한다.

A Batch Processing Algorithm for Moving k-Nearest Neighbor Queries in Dynamic Spatial Networks

  • Cho, Hyung-Ju
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권4호
    • /
    • pp.63-74
    • /
    • 2021
  • 위치 기반 서비스(LBS)는 가장 바쁜 시간에 동시에 도착하는 최단 경로 및 k-최근접 이웃 질의를 포함한 다양한 공간 질의를 효과적으로 처리한다. 동시에 도착하는 공간 질의를 빠르게 처리하기 위한 간단한 해결 방법은 LBS 서버를 추가하는 것이다. 이 방법은 서비스 운영 비용을 많이 증가시킨다. 최근에는 공유 가능한 계산을 사용하여 일련의 질의를 한꺼번에 모아서 처리하는 일괄 처리 방법이 제안되었다. 본 연구에서는 교통 상황에 따라 각 도로 구간의 이동 시간이 빈번하게 변하는 동적 공간 네트워크에서 움직이는 k-최근접 이웃 질의를 한꺼번에 처리하는 방법을 연구한다. 순차적 질의 처리를 기반으로 하는 LBS 서버는 중복 계산으로 인해 한꺼번에 요청이 들어오는 움직이는 k-최근접 이웃 질의를 효과적으로 처리하지 못한다. 본 연구의 목표는 움직이는 k-최근접 이웃 질의를 한꺼번에 처리하고 공유 가능한 계산을 재사용하여 알고리즘을 효율성을 개선한다. 실제 지도 데이터를 사용한 실험 평가는 최신 방법보다 제안된 방법이 우수하다는 것을 보여준다.

밀도 기반의 k-최근접 질의 처리 (A Density-based k-Nearest Neighbors Query Method)

  • 장인성;한은영;조대수
    • 한국지리정보학회지
    • /
    • 제6권4호
    • /
    • pp.59-70
    • /
    • 2003
  • 공간 데이터베이스 관리시스템에서 제공하는 공간 질의는 많은 디스크 참조와 CPU 처리시간을 필요로 한다. 이 중에서 k-최근접 질의는 많은 디스크 참조를 요구하는 질의로써 지금까지 많은 연구가 이루어져 왔다. 트리 구조의 색인을 사용하는 k-최근접 질의 처리방법은 조건을 만족하지 않는 노드를 가지치기 기법을 사용하여 노드 방문횟수를 줄인다. 그러나 이 방법은 가지치기 과정에서 불필요한 디스크 참고가 발생하여 성능을 저하시키는 단점을 가지고 있다. 본 논문에서는 가지치기 기법 대신 주어진 k개의 최근접 객체가 존재할 영역을 미리 예측함으로써 디스크 참조횟수를 줄이는 방법을 제시한다. 이 영역을 예측하기 위해서 본 연구에서는 데이터 분포에 대한 밀도를 이용하였다. 실험에 의하면 이러한 방법은 기존의 가지치기 기법을 이용한 방법에 비해서 최고 22%,평균 7% 정도의 디스크 참조횟수의 감소 효과가 있음을 알 수 있다.

  • PDF

빅데이터 환경에서 연속 질의 처리를 위한 리버스 k-최근접 질의 처리 기법 (Reverse k-Nearest Neighbor Query Processing Method for Continuous Query Processing in Bigdata Environments)

  • 임종태;박선용;서기원;이민호;복경수;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제14권10호
    • /
    • pp.454-462
    • /
    • 2014
  • 최근 위치 측정 기술과 모바일 기기들의 발달과 함께 위치 기반 서비스가 중요하게 연구되고 있다. 위치기반서비스를 제공하기 위해 많은 연구자들이 맵리듀스를 활용한 다양한 질의 처리 기법을 제안하였다. 그 중에 하나가 맵리듀스를 활용한 리버스 k-최근접 질의 처리 기법이다. 하지만 기존 기법들은 연속 리버스 k-최근접 질의 처리를 수행하기 위해 많은 처리 비용이 요구된다. 본 논문에서는 맵리듀스를 활용한 효율적인 연속 리버스 k-최근접 질의 처리 기법을 제안한다. 제안하는 기법은 60도 가지치기 기법을 이용한다. 제안하는 기법은 60도 가지치기 기법을 활용하여 모니터링 영역을 생성하고 모니터링을 수행하여 결과 업데이트을 수행하기 때문에 효율적으로 결과 업데이트를 수행한다. 또한, 본 논문에서는 제안하는 기법의 우수성을 보이기 위해 기존 기법과의 성능평가를 수행한다.

그룹핑 k-NN을 위한 유연한 최근접 객체 검색 (Flexible Nearest Neighbor Search for Grouping kNN)

  • 송두희;박광진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.469-470
    • /
    • 2015
  • 우리는 그룹핑 k-최근접 (Grouping k Nearest Neighbor; GkNN)질의를 지원하기 위하여 유연한 최근접객체(Flexible Nearest Neighbor; FNN)검색 방법을 제안한다. GkNN이란 기존에 제안된 kNN과 다르게 질의자가 요청한 k개의 객체를 모두 확인한 후에 이동 경로의 총합이 가장 작은 k개의 객체를 검색하는 방법이다. 기존 연구에서 제안된 최근접 객체들 (Nearest Neighborhood; NNH) 또한 이 문제를 해결하기 위하여 제안되었다. 그러나 NNH의 문제점은 객체 k와 p가 고정되어 있기 때문에 이동 환경에서 q에서 C까지의 거리가 증가하는 것이다. FNN의 환경은 NNH의 환경과 유사하다. 우리는 NNH의 q에서 집합 C 중 거리 중 가장 짧은 $c_i$ 선택한 후 q에서 $c_i$에 포함된 객체들 모두 검색하는 이동 경로의 총합과 FNN의 이동경로의 총 합을 비교하여 NNH의 문제점을 해결하였다.

효과적인 근사 k-최근접 분산 처리를 위한 질의 할당 기법 (Query Allocation Method for Efficient Distributed Processing of an Approximate k-Nearest Neighbor Query)

  • 최도진;임종태;복경수;유재수
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2018년도 춘계 종합학술대회 논문집
    • /
    • pp.9-10
    • /
    • 2018
  • 모바일 기기의 대중화 및 위치 인식 기술의 발달로 다양한 위치 기반 서비스가 제공되고 있다. 많은 위치 기반 서비스에서는 현재 위치에서 가장 가까운 k개의 아이템을 찾는 k-최근접 질의가 빈번하게 활용되고 있다. 본 논문에서는 효율적인 k-최근접 분산 질의 처리를 질의 할당 기법을 제안한다. 질의 처리 할당을 위해 질의 통계 값을 활용한 질의 모형을 정의하고 규칙 기반의 질의 할당을 수행한다. 성능 평가를 통해 제안하는 기법의 우수성을 보인다.

  • PDF