• 제목/요약/키워드: k-mean clustering

검색결과 282건 처리시간 0.027초

An Overview of Unsupervised and Semi-Supervised Fuzzy Kernel Clustering

  • Frigui, Hichem;Bchir, Ouiem;Baili, Naouel
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제13권4호
    • /
    • pp.254-268
    • /
    • 2013
  • For real-world clustering tasks, the input data is typically not easily separable due to the highly complex data structure or when clusters vary in size, density and shape. Kernel-based clustering has proven to be an effective approach to partition such data. In this paper, we provide an overview of several fuzzy kernel clustering algorithms. We focus on methods that optimize an fuzzy C-mean-type objective function. We highlight the advantages and disadvantages of each method. In addition to the completely unsupervised algorithms, we also provide an overview of some semi-supervised fuzzy kernel clustering algorithms. These algorithms use partial supervision information to guide the optimization process and avoid local minima. We also provide an overview of the different approaches that have been used to extend kernel clustering to handle very large data sets.

A Study on the Gen Expression Data Analysis Using Fuzzy Clustering

  • Choi, Hang-Suk;Cha, Kyung-Joon;Park, Hong-Goo
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2005년도 춘계 학술발표회 논문집
    • /
    • pp.25-29
    • /
    • 2005
  • Microarry 기술의 발전은 유전자의 기능과 상호 관련성 그리고 특성을 파악 가능하게 하였으며, 이를 위한 다양한 분석 기법들이 소개되고 있다. 본 연구에서 소개하는 fuzzy clustering 기법은 genome 영역의 expression 분석에 가장 널리 사용되는 기법중 비지도학습(unsupervized) 분석 기법이다. Fuzzy clustering 기법을 효모(yeast) expression 데이터를 이용하여 분류하여 hard k-means와 비교 하였다.

  • PDF

국부 확률을 이용한 데이터 분류에 관한 연구 (A Study on Data Clustering Method Using Local Probability)

  • 손창호;최원호;이재국
    • 제어로봇시스템학회논문지
    • /
    • 제13권1호
    • /
    • pp.46-51
    • /
    • 2007
  • In this paper, we propose a new data clustering method using local probability and hypothesis theory. To cluster the test data set we analyze the local area of the test data set using local probability distribution and decide the candidate class of the data set using mean standard deviation and variance etc. To decide each class of the test data, statistical hypothesis theory is applied to the decided candidate class of the test data set. For evaluating, the proposed classification method is compared to the conventional fuzzy c-mean method, k-means algorithm and Discriminator analysis algorithm. The simulation results show more accuracy than results of fuzzy c-mean method, k-means algorithm and Discriminator analysis algorithm.

Fine-Grained Mobile Application Clustering Model Using Retrofitted Document Embedding

  • Yoon, Yeo-Chan;Lee, Junwoo;Park, So-Young;Lee, Changki
    • ETRI Journal
    • /
    • 제39권4호
    • /
    • pp.443-454
    • /
    • 2017
  • In this paper, we propose a fine-grained mobile application clustering model using retrofitted document embedding. To automatically determine the clusters and their numbers with no predefined categories, the proposed model initializes the clusters based on title keywords and then merges similar clusters. For improved clustering performance, the proposed model distinguishes between an accurate clustering step with titles and an expansive clustering step with descriptions. During the accurate clustering step, an automatically tagged set is constructed as a result. This set is utilized to learn a high-performance document vector. During the expansive clustering step, more applications are then classified using this document vector. Experimental results showed that the purity of the proposed model increased by 0.19, and the entropy decreased by 1.18, compared with the K-means algorithm. In addition, the mean average precision improved by more than 0.09 in a comparison with a support vector machine classifier.

수화 시의 형태학적 특징에 따른 건해삼의 등급 분류 시스템 개발 (Sea Cucumber (Stichopus japonicus) Grading System Based on Morphological Features during Rehydration Process)

  • 이충욱;윤원병
    • 한국식품영양과학회지
    • /
    • 제46권3호
    • /
    • pp.374-380
    • /
    • 2017
  • 본 연구에서는 건해삼의 수화도에 따른 등급 분류를 확립하고자 하였다. 건해삼은 영상분석을 통하여 건해삼의 길이, 너비, 부피, 겉넓이의 형태학적 특징을 추출하였다. 측정된 data를 이용하여 k-mean clustering을 실시, 95개의 건해삼을 3개의 등급으로 분류하여 $30^{\circ}C$에서 40시간 수화실험을 실시하였다. 건해삼의 k-mean clustering을 실시한 결과 건해삼의 부피와 겉넓이는 건해삼의 등급을 가장 잘 나타낼 수 있는 인자였다. 등급별 수분 함량은 grade1은 71.23%, grade2는 75.60%, grade3는 85.62%를 확인하였다. 본 수화속도의 차이는 등급별 해삼이 동일한 수화 flux를 갖는 것을 고려하였을 때, 해삼의 수화는 겉넓이에 지배적임을 확인할 수 있다. 해삼의 수화는 물의 물질전달을 통해 이루어지며 Fick의 확산법칙에 따라 겉넓이가 커질수록 물질전달 속도가 증가함을 본 연구의 수화실험 결과에서도 확인할 수 있었다. 본 연구에서는 건해삼의 등급을 분류하여 최적의 수분 함량(75%)을 충족하기 위한 등급별 수화시간을 도출하였다. 본 연구에서 도출된 건해삼의 등급판별은 "수화도에 따른 건해삼의 품질 변화"에 대한 추가적인 연구를 통해 등급별 최적의 수화시간의 도출이 가능하다.

레이더 자료의 군집화를 통한 Mean Field Rainfall Bias의 보정 (Adjustment of the Mean Field Rainfall Bias by Clustering Technique)

  • 김영일;김태순;허준행
    • 한국수자원학회논문집
    • /
    • 제42권8호
    • /
    • pp.659-671
    • /
    • 2009
  • 본 연구에서는 레이더 강우량 자료의 편차보정에 사용되는 G/R비의 정확도를 향상시키기 위하여 fuzzy c-means 방법을 사용한 자료의 군집화를 적용하였다. 대상 레이더자료는 광덕산 레이더기지의 자료로서 유효범위 100km이내의 자료를 대상으로 지상관측망인 기상청의 AWS(Automatic Weather System) 지점에서 관측한 자료와의 비교를 통하여 G/R비를 구하였다. G/R비를 구하는데 있어서 전체 유효범위를 대상으로 동일한 방법을 사용한 경우와 레이더 자료의 군집화를 통해서 지형적인 효과를 고려한 경우를 비교하였으며, AWS 실측강우량과 G/R비를 통한 레이더 강우량 자료의 비교를 위하여 절대상대오차와 평균제곱근오차 등을 비교분석하였다. 그 결과 전체유효범위를 대상으로 동일하게 G/R비를 적용하여 구한 레이더 강우량에 비하여 군집분석을 이용하여 지형효과를 고려한 G/R비를 적용한 레이더 강우량의 오차가 더 적게 나타났다.

클러스터링 기반 RBFNNs를 이용한 기상레이더 패턴분류기 설계 : 비교 연구 및 해석 (Design of Meteorological Radar Pattern Classifier Using Clustering-based RBFNNs : Comparative Studies and Analysis)

  • 최우용;오성권
    • 한국지능시스템학회논문지
    • /
    • 제24권5호
    • /
    • pp.536-541
    • /
    • 2014
  • 기상레이더를 통해 취득된 데이터에는 지형에코, 파랑에코, 이상에코, 그리고 청천에코등이 존재한다. 각 에코는 여러 종류의 비강수에코이고, 이 비강수에코를 제거하기 위해 각 에코들의 특성을 분석하였다. 기상레이더 데이터는 매우 방대한 양이기 때문에 전처리 절차를 통해 분석된다. 본 논문에서는 클러스터링 기반 방사형 기저함수 신경회로망(RBFNNs : Radial Basis Function Neural Networks)과 에코 판단 모듈을 이용하여 기상레이더 데이터에서 강수에코와 비강수에코들을 구별하기 위한 에코 패턴분류기를 설계하였다. HCM(Hard C-Mean) 클러스터링 기반 RBFNNs 와 FCM(Fuzzy C-Mean) 클러스터링 기반 RBFNNs를 이용하여 출력성능은 비교 및 분석된다.

K-Mean 군집을 기반으로 하는 소프트 아일랜드 모델 (Soft Island Model based on K-means Clustering)

  • 고톱수렌 이칭허를러;신성윤;이현창
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제62차 하계학술대회논문집 28권2호
    • /
    • pp.561-562
    • /
    • 2020
  • 연구에서, k-Mean 군집화에 기반 한 다중 집단이 다수의 전략의 앙상블을 실현하기 위해 제안되어, 모집단의 유사한 개체가 동일한 돌연변이 전략을 구현하는 새로운 DE 변이체, 즉 KSDE를 생성하고 유사하지 않은 하위 집단 소프트 아일랜드 모델(SIM)을 통해 정보를 마이그레이션 한다.

  • PDF

Markov Chain Monte Carlo를 이용한 반도체 결함 클러스터링 파라미터의 추정 (Estimation of Defect Clustering Parameter Using Markov Chain Monte Carlo)

  • 하정훈;장준현;김준현
    • 산업경영시스템학회지
    • /
    • 제32권3호
    • /
    • pp.99-109
    • /
    • 2009
  • Negative binomial yield model for semiconductor manufacturing consists of two parameters which are the average number of defects per die and the clustering parameter. Estimating the clustering parameter is quite complex because the parameter has not clear closed form. In this paper, a Bayesian approach using Markov Chain Monte Carlo is proposed to estimate the clustering parameter. To find an appropriate estimation method for the clustering parameter, two typical estimators, the method of moments estimator and the maximum likelihood estimator, and the proposed Bayesian estimator are compared with respect to the mean absolute deviation between the real yield and the estimated yield. Experimental results show that both the proposed Bayesian estimator and the maximum likelihood estimator have excellent performance and the choice of method depends on the purpose of use.

Magnetoencephalography Interictal Spike Clustering in Relation with Surgical Outcome of Cortical Dysplasia

  • Jeong, Woorim;Chung, Chun Kee;Kim, June Sic
    • Journal of Korean Neurosurgical Society
    • /
    • 제52권5호
    • /
    • pp.466-471
    • /
    • 2012
  • Objective : The aim of this study was to devise an objective clustering method for magnetoencephalography (MEG) interictal spike sources, and to identify the prognostic value of the new clustering method in adult epilepsy patients with cortical dysplasia (CD). Methods : We retrospectively analyzed 25 adult patients with histologically proven CD, who underwent MEG examination and surgical resection for intractable epilepsy. The mean postoperative follow-up period was 3.1 years. A hierarchical clustering method was adopted for MEG interictal spike source clustering. Clustered sources were then tested for their prognostic value toward surgical outcome. Results : Postoperative seizure outcome was Engel class I in 6 (24%), class II in 3 (12%), class III in 12 (48%), and class IV in 4 (16%) patients. With respect to MEG spike clustering, 12 of 25 (48%) patients showed 1 cluster, 2 (8%) showed 2 or more clusters within the same lobe, 10 (40%) showed 2 or more clusters in a different lobe, and 1 (4%) patient had only scattered spikes with no clustering. Patients who showed focal clustering achieved better surgical outcome than distributed cases (p=0.017). Conclusion : This is the first study that introduces an objective method to classify the distribution of MEG interictal spike sources. By using a hierarchical clustering method, we found that the presence of focal clustered spikes predicts a better postoperative outcome in epilepsy patients with CD.