• 제목/요약/키워드: centroid classifier

검색결과 15건 처리시간 0.028초

Modifying linearly non-separable support vector machine binary classifier to account for the centroid mean vector

  • Mubarak Al-Shukeili;Ronald Wesonga
    • Communications for Statistical Applications and Methods
    • /
    • 제30권3호
    • /
    • pp.245-258
    • /
    • 2023
  • This study proposes a modification to the objective function of the support vector machine for the linearly non-separable case of a binary classifier yi ∈ {-1, 1}. The modification takes into account the position of each data item xi from its corresponding class centroid. The resulting optimization function involves the centroid mean vector, and the spread of data besides the support vectors, which should be minimized by the choice of hyper-plane β. Theoretical assumptions have been tested to derive an optimal separable hyperplane that yields the minimal misclassification rate. The proposed method has been evaluated using simulation studies and real-life COVID-19 patient outcome hospitalization data. Results show that the proposed method performs better than the classical linear SVM classifier as the sample size increases and is preferred in the presence of correlations among predictors as well as among extreme values.

전자메일 분류를 위한 나이브 베이지안 학습과 중심점 기반 분류의 성능 비교 (Performance Comparison of Naive Bayesian Learning and Centroid-Based Classification for e-Mail Classification)

  • 김국표;권영식
    • 산업공학
    • /
    • 제18권1호
    • /
    • pp.10-21
    • /
    • 2005
  • With the increasing proliferation of World Wide Web, electronic mail systems have become very widely used communication tools. Researches on e-mail classification have been very important in that e-mail classification system is a major engine for e-mail response management systems which mine unstructured e-mail messages and automatically categorize them. In this research we compare the performance of Naive Bayesian learning and Centroid-Based Classification using the different data set of an on-line shopping mall and a credit card company. We analyze which method performs better under which conditions. We compared classification accuracy of them which depends on structure and size of train set and increasing numbers of class. The experimental results indicate that Naive Bayesian learning performs better, while Centroid-Based Classification is more robust in terms of classification accuracy.

Robust 2-D Object Recognition Using Bispectrum and LVQ Neural Classifier

  • HanSoowhan;woon, Woo-Young
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 1998년도 추계학술대회 학술발표 논문집
    • /
    • pp.255-262
    • /
    • 1998
  • This paper presents a translation, rotation and scale invariant methodology for the recognition of closed planar shape images using the bispectrum of a contour sequence and the learning vector quantization(LVQ) neural classifier. The contour sequences obtained from the closed planar images represent the Euclidean distance between the centroid and all boundary pixels of the shape, and are related to the overall shape of the images. The higher order spectra based on third order cumulants is applied to tihs contour sample to extract fifteen bispectral feature vectors for each planar image. There feature vector, which are invariant to shape translation, rotation and scale transformation, can be used to represent two0dimensional planar images and are fed into a neural network classifier. The LVQ architecture is chosen as a neural classifier because the network is easy and fast to train, the structure is relatively simple. The experimental recognition processes with eight different hapes of aircraft images are presented to illustrate the high performance of this proposed method even the target images are significantly corrupted by noise.

  • PDF

A Contour Descriptors-Based Generalized Scheme for Handwritten Odia Numerals Recognition

  • Mishra, Tusar Kanti;Majhi, Banshidhar;Dash, Ratnakar
    • Journal of Information Processing Systems
    • /
    • 제13권1호
    • /
    • pp.174-183
    • /
    • 2017
  • In this paper, we propose a novel feature for recognizing handwritten Odia numerals. By using polygonal approximation, each numeral is segmented into segments of equal pixel counts where the centroid of the character is kept as the origin. Three primitive contour features namely, distance (l), angle (${\theta}$), and arc-tochord ratio (r), are extracted from these segments. These features are used in a neural classifier so that the numerals are recognized. Other existing features are also considered for being recognized in the neural classifier, in order to perform a comparative analysis. We carried out a simulation on a large data set and conducted a comparative analysis with other features with respect to recognition accuracy and time requirements. Furthermore, we also applied the feature to the numeral recognition of two other languages-Bangla and English. In general, we observed that our proposed contour features outperform other schemes.

준감독 학습 알고리즘을 위한 능동적 레이블 데이터 선택 (Active Selection of Label Data for Semi-Supervised Learning Algorithm)

  • 한지호;박은해;박동철;이윤식;민수영
    • 전기전자학회논문지
    • /
    • 제17권3호
    • /
    • pp.254-259
    • /
    • 2013
  • 본 논문에서는 준감독 학습 알고리즘(Semi-Supervised Learning Algorithm)의 학습데이터에 필요한 소수의 레이블 데이터를 능동적으로 선택하기 위한 무감독경쟁학습 알고리즘인 VCNN(Vector Centroid Neural Network)을 제안한다. 준감독 학습 알고리즘에서 레이블 데이터의 선택은 학습 결과 큰 영향을 미치고, 레이블 데이터를 선택하는데 있어 많은 비용과 전문적인 지식이 필요하다. 본 논문에서 능동적이고 효율적인 레이블 데이터 선택을 검증하기 위하여 UCI database 와 caltech dataset 을 이용하여 실험한 결과, 기존의 레이블 데이터 선택 방법과 비교하여 안정된 분류 결과와 최소의 오차율을 나타냈다.

요분석 시스템의 분류기 설계에 관한 연구 (A Study on the Design of Classifier for Urine Analysis System)

  • 전계록;김기련;예수영;김철한;정도운;조진호
    • 대한의용생체공학회:의공학회지
    • /
    • 제24권3호
    • /
    • pp.193-201
    • /
    • 2003
  • 본 연구에서는 요분석 시스템의 분류기를 설계하기 위하여 전처리 및 퍼지 알고리듬을 적용하였다. 데이터 전처리 과정은 무채색의 측정치로 구성된 보정용 곡선으로 요분석용 스트립의 측정치를 정규화하는 과정과 삼자극치를 이용한 연산 과정으로 구성하였다. 표준 시약에 의한 분류 실험을 통해 종형의 멤버쉽함수로 측정치를 퍼지화하고 min 추론과 무게중심법의 비퍼지화 과정으로 검사 항목의 농도를 정성적으로 분석할 수 있는 퍼지 분류기를 구성하였다. 표준 시약과 환자 요 검체의 관계에 의해 멤버쉽함수를 보정한 후 구성된 분류기를 통해 환자 요검체를 측정하여 분류 결과를 관찰함으로써 설계된 요분석용 분류기의 임상 적용 가능성을 검토하였다. 실험 결과는 모든 검사 항목에 대해 기준 장비의 검사 결과와 만족할 만한 일치도를 보였다.

실시간 학습 방법을 이용한 베어링 고장진단 성능 개선 (Performance Improvement of Bearing Fault Diagnosis Using a Real-Time Training Method)

  • 조윤정;김재영;김종면
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제7권4호
    • /
    • pp.551-559
    • /
    • 2017
  • 본 논문에서는 베어링 고장진단 성능을 개선하기 위해 실시간 학습 방법을 제안한다. 기존 베어링 고장진단의 문제점은 학습되지 않은 상태에 대해 올바른 분류를 할 수 없다는 점이다. 제안한 4단계 실시간 학습 방법은 새로운 상태를 실시간으로 인지 및 학습하여 새로운 상태의 데이터를 올바르게 분류할 수 있다. 1단계에서는 학습 정보에서 각 클래스의 무게중심과 그 클래스 내 각 특징벡터 사이의 유클리디안 거리를 계산하여 각 클래스별로 거리의 최대값을 계산한다. 2단계에서는 새로 취득된 데이터의 특징벡터와 각 클래스의 무게중심 사이의 유클리디안 거리를 계산하고 각 클래스별 최대 허용 거리와 비교한다. 3단계에서는 새로 취득된 데이터들과 각 클래스 내 무게중심 사이의 거리가 각 클래스의 최대 허용 거리보다 모두 클 경우 새로운 상태의 데이터로 인지하고 새로운 상태 인지 횟수를 증가시킨다. 마지막 4단계에서는 새로운 상태 인지 회수가 10보다 클 경우 새로운 상태의 클래스를 생성하기 위해 새로운 상태로 인지된 10개의 데이터를 새로운 상태의 클래스로 지정하고 분류기를 재학습시킨다. 제안한 방법의 성능을 검증하기 위해 실제 베어링 결함 데이터를 사용하여 제안한 실시간 학습 방법의 효율성을 검증하였다.

문헌간 유사도를 이용한 SVM 분류기의 문헌분류성능 향상에 관한 연구 (Improving the Performance of SVM Text Categorization with Inter-document Similarities)

  • 이재윤
    • 정보관리학회지
    • /
    • 제22권3호
    • /
    • pp.261-287
    • /
    • 2005
  • 이 논문의 목적은 SVM(지지벡터기계) 분류기의 성능을 문헌간 유사도를 이용해서 향상시키는 것이다. SVM은 효과적인 기계학습 시스템으로서 최고 수준의 문헌자동분류 기술로 인정받고 있다. 이 연구에서는 문헌 벡터 자질 표현에 기반한 SVM 문헌자동분류를 제안하였다. 제안한 방식은 분류 자질로 색인어 대신 문헌 벡터를, 자질 값으로 가중치 대신 벡터유사도를 사용한다. 제안한 방식에 대한 실험 결과, SVM 분류기의 성능을 향상시킬 수 있었다. 실행 효율 향상을 위해서 문헌 벡터 자질 선정 방안과 범주 센트로이드 벡터를 사용하는 방안을 제안하였다. 실험 결과 소규모의 벡터 자질 집합만으로도 색인어 자질을 사용하는 기존 방식보다 나은 성능을 얻을 수 있었다.

Support Vector Machine을 이용한 선에코 특성 분석 및 탐지 방법 (Analysis and Detection Method for Line-shaped Echoes using Support Vector Machine)

  • 이한수;김은경;김성신
    • 한국지능시스템학회논문지
    • /
    • 제24권6호
    • /
    • pp.665-670
    • /
    • 2014
  • SVM은 학습 데이터를 두 개의 집단으로 분리시키는 최적의 초평면을 찾는 이진 분류기로서 우수한 성능 때문에 다양한 분야에서 귀납 추론, 이진 분류, 예측 등을 목적으로 사용되는 알고리즘이다. 또한 대표적인 블랙박스 모델 중 하나이기 때문에 학습 후 생성되는 SVM의 해석에 대한 연구도 활발히 진행되고 있다. 본 논문에서는 SVM 알고리즘을 이용하여 기상 레이더의 데이터 내에 비교적 높은 빈도로 발생하여 기상 예보의 정확도를 감소시키는 비강수에코 중 하나인 선에코를 자동으로 탐지하는 방법에 대한 연구를 수행하였다. 학습 데이터로는 평균 반사도, 크기, 발생 형태, 중심 고도 등과 같은 특성을 활용하였는데, 이는 기상 레이더 데이터에 저장된 다양한 데이터 중 반사도 값을 선택한 후 클러스터링 기법을 통해 추출한 것이다. 이와 같이 학습된 SVM 분류기를 실제 사례를 바탕으로 하여 검증하였으며, Decision Tree 알고리즘을 적용하여 생성한 분류기의 해석을 수행하였다.

Automated Classification of Audio Genre using Sequential Forward Selection Method

  • Lee Jong Hak;Yoon Won lung;Lee Kang Kyu;Park Kyu Sik
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2004년도 학술대회지
    • /
    • pp.768-771
    • /
    • 2004
  • In this paper, we propose a content-based audio genre classification algorithm that automatically classifies the query audio into five genres such as Classic, Hiphop, Jazz, Rock, Speech using digital signal processing approach. From the 20 second query audio file, 54 dimensional feature vectors, including Spectral Centroid, Rolloff, Flux, LPC, MFCC, is extracted from each query audio. For the classification algorithm, k-NN, Gaussian, GMM classifier is used. In order to choose optimum features from the 54 dimension feature vectors, SFS (Sequential Forward Selection) method is applied to draw 10 dimension optimum features and these are used for the genre classification algorithm. From the experimental result, we verify the superior performance of the SFS method that provides near $90{\%}$ success rate for the genre classification which means $10{\%}$-$20{\%}$ improvements over the previous methods

  • PDF