• 제목/요약/키워드: Nearest Neighbor Analysis

검색결과 257건 처리시간 0.025초

Plurality Rule-based Density and Correlation Coefficient-based Clustering for K-NN

  • Aung, Swe Swe;Nagayama, Itaru;Tamaki, Shiro
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제6권3호
    • /
    • pp.183-192
    • /
    • 2017
  • k-nearest neighbor (K-NN) is a well-known classification algorithm, being feature space-based on nearest-neighbor training examples in machine learning. However, K-NN, as we know, is a lazy learning method. Therefore, if a K-NN-based system very much depends on a huge amount of history data to achieve an accurate prediction result for a particular task, it gradually faces a processing-time performance-degradation problem. We have noticed that many researchers usually contemplate only classification accuracy. But estimation speed also plays an essential role in real-time prediction systems. To compensate for this weakness, this paper proposes correlation coefficient-based clustering (CCC) aimed at upgrading the performance of K-NN by leveraging processing-time speed and plurality rule-based density (PRD) to improve estimation accuracy. For experiments, we used real datasets (on breast cancer, breast tissue, heart, and the iris) from the University of California, Irvine (UCI) machine learning repository. Moreover, real traffic data collected from Ojana Junction, Route 58, Okinawa, Japan, was also utilized to lay bare the efficiency of this method. By using these datasets, we proved better processing-time performance with the new approach by comparing it with classical K-NN. Besides, via experiments on real-world datasets, we compared the prediction accuracy of our approach with density peaks clustering based on K-NN and principal component analysis (DPC-KNN-PCA).

퍼지 소속도를 갖는 Fisherface 방법을 이용한 얼굴인식 (Face Recognition using Fisherface Method with Fuzzy Membership Degree)

  • 곽근창;고현주;전명근
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권6호
    • /
    • pp.784-791
    • /
    • 2004
  • 본 논문에서는 퍼지논리에 기초한 Fisherface 얼굴인식 방법의 확장을 다룬다. Fisherface 얼굴인식 방법은 주성분 분석 기법만을 이용하는 경우에 비해 조명의 방향, 얼굴의 포즈, 감정과 같은 변동에 대해 민감하지 않은 장점을 가지고 있다. 그러나, Fisherface 방법을 포함한 얼굴인식의 다양한 방법들은 입력 벡터가 한 클래스에 할당되어질 때 그 클래스에서 소속의 정도를 0 또는 1로서 나타낸다. 따라서 이러한 방법들은 얼굴영상들이 조명이나 보는 각도로 인해 변형이 생기는 경우에 인식률이 저하되는 문제가 있다. 본 논문에서는 PCA에 의해 변환된 특징벡터에 퍼지 소속도를 할당하는 것으로, 퍼지 소속도는 퍼지 kNN(k-Nearest Neighbor)으로부터 얻어진다. 실험 결과 ORL, Yale 얼굴 데이타베이스에서 기존의 인식방법 보다 향상된 인식 성능을 보임을 알 수 있었다.

태양광 발전 이상감지를 위한 아웃라이어 추정 방법에 대한 연구 (A study on the outlier data estimation method for anomaly detection of photovoltaic system)

  • 서종관;이태일;이휘성;박점배
    • 전기전자학회논문지
    • /
    • 제24권2호
    • /
    • pp.403-408
    • /
    • 2020
  • 태양광 발전은 특성상 간헐성과 불확실성이 항상 존재하기 때문에 정확한 예측은 어려우며, 실시간 발전량 진단을 위한 이상감지 기술이 중요하다. 본 논문에서는 다양한 파라미터의 상관관계를 도출하고 최근접 이웃 알고리즘을 적용하여 정상데이터와 비정상데이터를 분류한다. 두 분류의 결과는 발전 시스템의 결함에 의한 아웃라이어와 구름 등에 의해 단기간 동안 발생하는 부분 음영 및 전체 음영의 일시적인 전력손실을 보여준다. 100kW 발전소 데이터를 대상으로 머신러닝 분석을 수행하여 테스트 결과를 산출하였으며 실제 이상치와 이상치 후보지를 검증하였다.

키스트로크 인식을 위한 패턴분류 방법 (Pattern Classification Methods for Keystroke Identification)

  • 조태훈
    • 한국정보통신학회논문지
    • /
    • 제10권5호
    • /
    • pp.956-961
    • /
    • 2006
  • 키스트로크 시간간격은 컴퓨터사용자의 검증 및 인식에서 분별적인 특징이 될 수 있다. 본 논문은 키스트로크 시간간격을 특징으로, 신경망의 역전파 알고리즘과 Bayesian 분류기, 그리고 k-NN을 이용한 분류기의 사용자 인식 성능을 비교 실험하였다. 실험 결과, 사용자당 샘플의 개수가 작을 경우에는 k-NN 알고리즘이 가장 성능이 좋았고, 사용자당 샘플의 개수가 많을 경우에는 Bayesian 분류기의 성능이 가장 뛰어난 결과를 보였다. 따라서 웹기반 온라인 사용자인식을 위해서는 사용자별 키스트로크 샘플의 수에 따라 k-NN이나 Bayesian 분류기를 선택적으로 사용하는 것이 바람직할 것으로 보인다.

칼라 이미지 스케일의 보간 (Interpolation of Color Image Scales)

  • 김성환;정성환;이준환
    • 감성과학
    • /
    • 제10권3호
    • /
    • pp.289-297
    • /
    • 2007
  • 칼라 이미지 스케일은 칼라 전문가들의 지식에 의해 획득되고, 형용사와 대응되는 칼라(들)을 선택하기 위해 동일한 형용사 이미지 스케일들에서 형용사들과 칼라를 표현한다. 이들은 이미지 스케일을 얻기 위한 실험과 통계분석의 어려움 때문에 일반적으로, 단지 제한된 수의 칼라들만이 이미지 스케일에 위치한다. 이는 칼라를 선택하는 과정을 비전문가에게 어렵게 만든다. 본 논문에서는 이미지 스케일에 따라 연속적인 칼라를 제공하는 퍼지 K-근접 이웃 보간 방법에 기초를 둔 칼라 이미지 스케일의 보간 방법을 제안한다. 실험의 결과들은 보간된 이미지 스케일은 칼라 선택 과정에 있어 실용적으로 유용하게 사용될 수 있을 것이라 본다.

  • PDF

IEEE 754 부동 소수점 32비트 float 변수의 Morton Code 변환 분석 (Analysis of Morton Code Conversion for 32 Bit IEEE 754 Floating Point Variables)

  • 박태정
    • 디지털콘텐츠학회 논문지
    • /
    • 제17권3호
    • /
    • pp.165-172
    • /
    • 2016
  • GPU 기반 병렬처리에서 대규모 데이터의 인접 정보 검색(nearest neighbor search)에서 Morton code의 역할이 점점 더 중요하게 부각되고 있으며 그 응용 사례도 점차 증가하고 있다. 본 논문에서는 Tero Karras가 제안한 float 형 변수에 기반한 $[0,1]^3$ 공간 내의 3차원 기하 정보를 32비트 unsigned int형 Morton code로 변경하는 기존의 방법을 논의하고 그 기하학적인 의미를 분석함으로써, 보다 높은 해상도를 구현할 수 있는 64비트 unsigned long long형의 Morton code 변환 알고리듬을 제안한다. 제안하는 알고리듬은 GPU에서 구현되었을 때 CPU에서 실행하는 것보다 약 1000배 수준의 성능 향상을 달성한다.

열역학법을 이용한 DNA hybridization 특성 검출 및 해석 (Detection and Analysis of DNA Hybridization Characteristics by using Thermodynamic Method)

  • 김도균;권영수
    • 대한전기학회논문지:전기물성ㆍ응용부문C
    • /
    • 제51권6호
    • /
    • pp.265-270
    • /
    • 2002
  • The determination of DNA hybridization reaction can apply the molecular biology research, clinic diagnostics, bioengineering, environment monitoring, food science and application area. So, the improvement of DNA hybridization detection method is very important for the determination of this hybridization reaction. Several molecular biological techniques require accurate predictions of matched versus mismatched hybridization thermodynamics, such as PCR, sequencing by hybridization, gene diagnostics and antisense oligonucleotide probes. In addition, recent developments of oligonucleotide chip arrays as means for biochemical assays and DNA sequencing requires accurate knowledge of hybridization thermodynamics and population ratios at matched and mismatched target sites. In this study, we report the characteristics of the probe and matched, mismatched target oligonucleotide hybridization reaction using thermodynamic method. Thermodynamic of 5 oligonucleotides with central and terminal mismatch sequences were obtained by measured UV-absorbance as a function of temperature. The data show that the nearest-neighbor base-pair model is adequate for predicting thermodynamics of oligonucleotides with average deviations for $\Delta$H$^{0}$ , $\Delta$S$^{0}$ , $\Delta$G$_{37}$ $^{0}$ and T$_{m}$, respectively.>$^{0}$ and T$_{m}$, respectively.

Improvement of location positioning using KNN, Local Map Classification and Bayes Filter for indoor location recognition system

  • Oh, Seung-Hoon;Maeng, Ju-Hyun
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권6호
    • /
    • pp.29-35
    • /
    • 2021
  • 본 논문에서는 위치 측위의 정확도를 높일 수 있는 방안으로 KNN(K-Nearest Neighbor)과 Local Map Classification 및 Bayes Filter를 융합한 기법을 제안한다. 먼저 이 기법은 Local Map Classification이 실제 지도를 여러 개의 Cluster로 나누고, 다음으로 KNN으로 Cluster들을 분류한다. 그리고 Bayes Filter가 획득한 각 Cluster의 확률을 통하여 Posterior Probability을 계산한다. 이 Posterior Probability으로 로봇이 위치한 Cluster를 검색한다. 성능 평가를 위하여 KNN과 Local Map Classification 및 Bayes Filter을 적용하여서 얻은 위치 측위의 결과를 분석하였다. 분석 결과로 RSSI 신호가 변하더라도 위치 정보는 한 Cluster에 고정되면서 위치 측위의 정확도가 높아진다는 사실을 확인하였다.

이동객체궤적에 대한 효율적인 최근접 이웃 검색 (Efficient Nearest Neighbor Search on Moving Object Trajectories)

  • 김규재;박영희;조우현
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2014년도 추계학술대회
    • /
    • pp.418-421
    • /
    • 2014
  • 스마트폰과 같은 이동 통신 매체의 발달과 LTE, NFC, RFID 등 무선통신의 발달로 실시간으로 이동 객체의 위치데이터를 수집하여 활용하는 위치 기반의 서비스들이 다방면의 개발에 이용되고 있다. 이에 따라 대용량의 이동객체 위치 데이터들을 효율적으로 저장하는 방법과 여러 질의를 좀 더 빠르게 처리할 수 있는 방법들에 대한 연구들이 진행 중이다. 본 논문에서는 Douglas-Peucker 알고리즘을 응용하여 대용량의 이동객체궤적 데이터를 단순화하여 색인 구조를 생성하고 이 색인 구조를 이용하여 최근접 이웃 검색 질의를 효율적으로 처리할 수 있는 알고리즘을 제안한다. 제안된 방법으로 대용량의 데이터가 더 적은 양의 데이터로 단순화 되고 얼마나 더 효율적으로 질의를 처리하는지 실험을 통하여 확인하였다.

  • PDF

Spatial Point-pattern Analysis of a Population of Lodgepole Pine

  • Chhin, Sophan;Huang, Shongming
    • Journal of Forest and Environmental Science
    • /
    • 제34권6호
    • /
    • pp.419-428
    • /
    • 2018
  • Spatial point-patterns analyses were conducted to provide insight into the ecological process behind competition and mortality in two lodgepole pine (Pinus contorta Dougl. ex Loud. var. latifolia Engelm.) stands, one in the Lower Foothills, and the other in the Upper Foothills natural subregions in the boreal forest of Alberta, Canada. Spatial statistical tests were applied to live and dead trees and included Clark-Evans nearest neighbor statistic (R), nearest neighbor distribution function (G(r)), and a variant of Ripley's K function (L(r)). In both lodgepole pine plots, the results indicated that there was significant regularity in the spatial point-pattern of the surviving trees which indicates that competition has been a key driver of mortality and forest dynamics in these plots. Dead trees generally showed a clumping pattern in higher density patches. There were also significant bivariate relationships between live and dead trees, but the relationships differed by natural subregion. In the Lower Foothills plot there was significant attraction between live and dead tees which suggests mainly one-sided competition for light. In contrast, in the Upper Foothills plot, there was significant repulsion between live and dead trees which suggests two-sided competition for soil nutrients and soil moisture.