• 제목/요약/키워드: Nearest neighborhood

검색결과 56건 처리시간 0.025초

데이터 분포에 기반한 유사 군집 선택법 (Neighborhood Selection with Intrinsic Partitions)

  • 김계현;최승진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.428-432
    • /
    • 2007
  • We present a novel method for determining k nearest neighbors, which accurately recognizes the underlying clusters in a data set. To this end, we introduce the "tiling neighborhood" which is constructed by tiling a number of small local circles rather than a single circle, as existing neighborhood schemes do. Then we formulate the problem of determining the tiling neighborhood as a minimax optimization, leading to an efficient message passing algorithm. For several real data sets, our method outperformed the k-nearest neighbor method. The results suggest that our method can be an alternative to existing for general classification tasks, especially for data sets which have many missing values.

  • PDF

유전알고리즘을 이용한 최적 k-최근접이웃 분류기 (Optimal k-Nearest Neighborhood Classifier Using Genetic Algorithm)

  • 박종선;허균
    • Communications for Statistical Applications and Methods
    • /
    • 제17권1호
    • /
    • pp.17-27
    • /
    • 2010
  • 분류분석에 사용되는 k-최근접이웃 분류기에 유전알고리즘을 적용하여 의미 있는 변수들과 이들에 대한 가중치 그리고 적절한 k를 동시에 선택하는 알고리즘을 제시하였다. 다양한 실제 자료에 대하여 기존의 여러 방법들과 교차타당성 방법을 통하여 비교한 결과 효과적인 것으로 나타났다.

차분진화 알고리즘을 이용한 Nearest Prototype Classifier 설계 (Design of Nearest Prototype Classifier by using Differential Evolutionary Algorithm)

  • 노석범;안태천
    • 한국지능시스템학회논문지
    • /
    • 제21권4호
    • /
    • pp.487-492
    • /
    • 2011
  • 본 논문에서는 가장 단순한 구조를 가진 Nearest Prototype Classifier의 성능 개선을 위해 차분 진화 알고리즘을 적용하여 prototype의 위치를 결정하는 방법을 제안하였다. 차분 진화 알고리즘을 이용하여 prototype의 위치 벡터가 결정이 되며, 차분 진화 알고리즘에 의해 결정된 prototype의 class label을 결정하기 위한 class label 결정 알고리즘도 제안하였다. 제안된 알고리즘의 성능 평가를 위해 기존의 패턴 분류기와 비교 결과를 보인다.

공간이웃정보를 고려한 공간회귀분석 (A study on the spatial neighborhood in spatial regression analysis)

  • 김수정
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권3호
    • /
    • pp.505-513
    • /
    • 2017
  • 최근, 더욱 상세하고 정확한 추정 결과를 위해 소지역추정(small area estimation; SAE)의 연구가 많이 진행되고 있다. 그 중 공간회귀모형 (spatial regression model)을 이용한 방법이 주를 이루고 있는데 이를 사용하기 위해서는 공간이웃 (spatial neighbor)의 정의가 필요하다. 본 연구에서는 공간이웃을 정의하는 방법으로 도로네 삼각망 (Delaunay triangulation; DT)을 소개하고 k-최근접 (k-nearest neighbor; KNN)과 비교하여 분석한다. 두 가지 공간이웃을 정의하는 방법중에서 어떤 방법으로 이웃을 정의하는 것이 효율적인지 알아보기 위해 시뮬레이션을 실시하였고, 지가 (land price)데이터를 이용하여 실 데이터를 분석하였다.

그룹핑 k-NN을 위한 유연한 최근접 객체 검색 (Flexible Nearest Neighbor Search for Grouping kNN)

  • 송두희;박광진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.469-470
    • /
    • 2015
  • 우리는 그룹핑 k-최근접 (Grouping k Nearest Neighbor; GkNN)질의를 지원하기 위하여 유연한 최근접객체(Flexible Nearest Neighbor; FNN)검색 방법을 제안한다. GkNN이란 기존에 제안된 kNN과 다르게 질의자가 요청한 k개의 객체를 모두 확인한 후에 이동 경로의 총합이 가장 작은 k개의 객체를 검색하는 방법이다. 기존 연구에서 제안된 최근접 객체들 (Nearest Neighborhood; NNH) 또한 이 문제를 해결하기 위하여 제안되었다. 그러나 NNH의 문제점은 객체 k와 p가 고정되어 있기 때문에 이동 환경에서 q에서 C까지의 거리가 증가하는 것이다. FNN의 환경은 NNH의 환경과 유사하다. 우리는 NNH의 q에서 집합 C 중 거리 중 가장 짧은 $c_i$ 선택한 후 q에서 $c_i$에 포함된 객체들 모두 검색하는 이동 경로의 총합과 FNN의 이동경로의 총 합을 비교하여 NNH의 문제점을 해결하였다.

KNN 알고리즘을 활용한 고속도로 통행시간 예측 (Expressway Travel Time Prediction Using K-Nearest Neighborhood)

  • 신강원;심상우;최기주;김수희
    • 대한토목학회논문집
    • /
    • 제34권6호
    • /
    • pp.1873-1879
    • /
    • 2014
  • 실시간 자료를 반영한 통행시간 예측 기법은 다양하지만 관련 연구 검토 결과 과거이력데이터가 충분하다면 타 모형에 비해 K 최대근접이웃(K-Nearest Neighbors)의 정확도가 우수하므로 본 연구에서는 이에 대한 적용 방법 도출 및 가능성 평가를 목적으로 한다. 본 연구에서는 KNN의 입력 자료로 TCS 교통량 및 DSRC 구간통행시간의 실시간 및 과거 이력자료, 경로통행시간 이력자료를 활용하였다. 통행시간 예측치는 TCS 교통량 및 DSRC 구간통행시간의 실시간 자료와 유사한 경로통행시간을 탐색한 후 이를 가중평균하여 산출하였다. 예측 기법을 적용한 결과 DSRC 구간통행시간의 가중치가 증가할수록 정확도는 증가하였으며, 이는 실시간 교통상황 변화를 DSRC 구간통행시간이 잘 반영하기 때문이다. 그러나 TCS 교통량을 기반으로 한 경우 역시 정확도의 차이가 크지 않으며, 변화 추이도 유사하게 나타났다. 이러한 결과를 볼 때 향후 대용량의 과거이력자료가 축적될 경우 예측오차는 더욱 감소될 것으로 기대된다.

패널조사 웨이브 무응답의 대체방법 비교 (Comparisons of Imputation Methods for Wave Nonresponse in Panel Surveys)

  • 김규성;박인호
    • 한국조사연구학회지:조사연구
    • /
    • 제11권1호
    • /
    • pp.1-18
    • /
    • 2010
  • 본 논문에서는 패널조사에서 발생하는 웨이브 무응답을 대체하는 방법을 고찰하였다. 패널조사에서는 이전 조사 데이터를 무응답 대체에 활용할 수 있기 때문에 이러한 성질을 이용하면 횡단면 무응답 대체보다 더 효과적인 웨이브 무응답 대체법을 찾을 수 있다. 먼저 웨이브 무응답 대체를 사용하는 해외의 주요 패널조사를 살펴보고, 웨이브 무응답 대체방법 중 종단면 회귀대체법, 이월대체법, 최근방 회귀대체법, 그리고 행렬대체법을 고찰하였다. 그리고 웨이브 무응답 대체법의 성능을 비교하기 위하여 한국복지패널 데이터를 대상으로 모의실험을 실시하였다. 성능을 비교하기 위하여 평균대체, 회귀대체, 비대체, 최근방 대체, 핫덱 대체를 고려하였고 성능평가 지표로는 예측 정확성 지표와 추정 정확성 지표를 이용하였다. 모의실험 결과 비대체, 행렬대체는 두 지표 모두 우수했고, 회귀대체, 종단면 회귀대체, 이월대체는 예측 정확성은 우수한 반면 추정 정확성은 다소 떨어졌으며, 반대로 최근방 회귀대체, 최근방 대체, 핫덱 대체는 예측 정확성은 떨어지나 추정 정확성은 높은 것으로 나타났다. 마지막으로 평균 대체는 두 지표 모두 좋지 않았다.

  • PDF

이웃 참조 위치가 없는 경우를 개선한 실내 위치 추정 사전 컷-오프 방식 (An Improved Preliminary Cut-off Indoor Positioning Scheme in Case of No Neighborhood Reference Point)

  • 박병관;김동준;손주영;최종민
    • 한국멀티미디어학회논문지
    • /
    • 제20권1호
    • /
    • pp.74-81
    • /
    • 2017
  • In learning stage of the preliminary Cut-off indoor positioning scheme, RSSI and UUID data received from beacons at each reference point(RP) are stored in fingerprint map. The fingerprint map and real-time beacon information are compared to identify the nearest K reference points through which the user position is estimated. If the number of K is zero, this scheme cannot estimate user position. We have improved the preliminary Cut-off scheme to get the estimated user position even in the case. The improved scheme excludes the beacon of the weakest signal received by user mobile device and identifies neighborhood reference points using the other beacon information. This procedure are performed repetitively until K > 0. The simulation results confirm that the proposed scheme outperforms K-Nearest-Neighbor (KNN), Cluster KNN and the conventional Cut-off scheme in terms of accuracy while the constraints are guaranteed to be satisfied.

고객 맞춤 서비스를 위한 HPPS(Hybrid Preference Prediction System) 설계 (A Design of HPPS(Hybrid Preference Prediction System) for Customer-Tailored Service)

  • 정은희;이병관
    • 한국멀티미디어학회논문지
    • /
    • 제14권11호
    • /
    • pp.1467-1477
    • /
    • 2011
  • 본 논문에서는 고객 맞춤 서비스의 선호도를 정확하게 예측하기 위하여 사용자 프로파일 분석, 사용자간 유사도 분석을 이용한 HPPS(Hybrid Preference Prediction System) 설계를 제안한다. 기존의 NBCFA(Neighborhood Based Collaborative Filtering Algorithm)과 달리, 본 논문은 첫째, 선호도 예측식에서 이웃의 상품 평가가 없을 경우 상품에 대한 평균값을 이용하도록 하였고, 둘째, 선호도 예측식에서 사용자의 특성을 분석한 가중치를 반영하도록 하였고, 끝으로, 인접 이웃을 선정할 때 유사도, 상품 평가 여부, 평가 횟수를 반영하여 HPPS에 선호도의 정확도를 향상시켰다. 따라서 첫째와 둘째의 선호도 예측식을 이용하면 HPPS의 정확도는 기존의 NBCFA에 비해 97.24% 향상되었고, 인접이웃 선정방식에서도 HPPS 시스템의 정확도가 75% 향상되었다.

Analysis of Urban Distribution Pattern with Satellite Imagery

  • Roh, Young-Hee;Jeong, Jae-Joon
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2007년도 Proceedings of ISRS 2007
    • /
    • pp.616-619
    • /
    • 2007
  • Nowadays, urbanized area expands its boundary, and distribution of urbanized area is gradually transformed into more complicated pattern. In Korea, SMA(Seoul Metropolitan Area) has outstanding urbanized area since 1950s. But it is ambiguous whether urban distribution is clustered or dispersed. This study aims to show the way in which expansion of urbanized area impacts on spatial distribution pattern of urbanized area. We use quadrat analysis, nearest-neighbor analysis and fractal analysis to know distribution pattern of urbanized area in time-series urban growth. The quadrat analysis indicates that distribution pattern of urbanized area is clustered but the cohesion is gradually weakened. And the nearest-neighbor analysis shows that point patterns are changed that urbanized area distribution pattern is progressively changed from clustered pattern into dispersed pattern. The fractal dimension analysis shows that 1972's distribution dimension is 1.428 and 2000's dimension is 1.777. Therefore, as time goes by, the complexity of urbanized area is more increased through the years. As a result, we can show that the cohesion of the urbanized area is weakened and complicated.

  • PDF