• 제목/요약/키워드: centroid mean vector

검색결과 3건 처리시간 0.045초

Modifying linearly non-separable support vector machine binary classifier to account for the centroid mean vector

  • Mubarak Al-Shukeili;Ronald Wesonga
    • Communications for Statistical Applications and Methods
    • /
    • 제30권3호
    • /
    • pp.245-258
    • /
    • 2023
  • This study proposes a modification to the objective function of the support vector machine for the linearly non-separable case of a binary classifier yi ∈ {-1, 1}. The modification takes into account the position of each data item xi from its corresponding class centroid. The resulting optimization function involves the centroid mean vector, and the spread of data besides the support vectors, which should be minimized by the choice of hyper-plane β. Theoretical assumptions have been tested to derive an optimal separable hyperplane that yields the minimal misclassification rate. The proposed method has been evaluated using simulation studies and real-life COVID-19 patient outcome hospitalization data. Results show that the proposed method performs better than the classical linear SVM classifier as the sample size increases and is preferred in the presence of correlations among predictors as well as among extreme values.

An Incremental Similarity Computation Method in Agglomerative Hierarchical Clustering

  • Jung, Sung-young;Kim, Taek-soo
    • 한국지능시스템학회논문지
    • /
    • 제11권7호
    • /
    • pp.579-583
    • /
    • 2001
  • In the area of data clustering in high dimensional space, one of the difficulties is the time-consuming process for computing vector similarities. It becomes worse in the case of the agglomerative algorithm with the group-average link and mean centroid method, because the cluster similarity must be recomputed whenever the cluster center moves after the merging step. As a solution of this problem, we present an incremental method of similarity computation, which substitutes the scalar calculation for the time-consuming calculation of vector similarity with several measures such as the squared distance, inner product, cosine, and minimum variance. Experimental results show that it makes clustering speed significantly fast for very high dimensional data.

  • PDF

Support Vector Machine을 이용한 선에코 특성 분석 및 탐지 방법 (Analysis and Detection Method for Line-shaped Echoes using Support Vector Machine)

  • 이한수;김은경;김성신
    • 한국지능시스템학회논문지
    • /
    • 제24권6호
    • /
    • pp.665-670
    • /
    • 2014
  • SVM은 학습 데이터를 두 개의 집단으로 분리시키는 최적의 초평면을 찾는 이진 분류기로서 우수한 성능 때문에 다양한 분야에서 귀납 추론, 이진 분류, 예측 등을 목적으로 사용되는 알고리즘이다. 또한 대표적인 블랙박스 모델 중 하나이기 때문에 학습 후 생성되는 SVM의 해석에 대한 연구도 활발히 진행되고 있다. 본 논문에서는 SVM 알고리즘을 이용하여 기상 레이더의 데이터 내에 비교적 높은 빈도로 발생하여 기상 예보의 정확도를 감소시키는 비강수에코 중 하나인 선에코를 자동으로 탐지하는 방법에 대한 연구를 수행하였다. 학습 데이터로는 평균 반사도, 크기, 발생 형태, 중심 고도 등과 같은 특성을 활용하였는데, 이는 기상 레이더 데이터에 저장된 다양한 데이터 중 반사도 값을 선택한 후 클러스터링 기법을 통해 추출한 것이다. 이와 같이 학습된 SVM 분류기를 실제 사례를 바탕으로 하여 검증하였으며, Decision Tree 알고리즘을 적용하여 생성한 분류기의 해석을 수행하였다.