• 제목/요약/키워드: Cluster validation

검색결과 61건 처리시간 0.021초

고차원 (유전자 발현) 자료에 대한 군집 타당성분석 기법의 성능 비교 (Comparison of the Cluster Validation Methods for High-dimensional (Gene Expression) Data)

  • 정윤경;백장선
    • 응용통계연구
    • /
    • 제20권1호
    • /
    • pp.167-181
    • /
    • 2007
  • 유전자 발현 자료(gene expression data)는 전형적인 고차원 자료이며, 이를 분석하기 위한 여러 가지 군집 알고리즘(clustering algorithm)과 군집 결과들을 검증하는 군집타당성분석 기법(cluster validation technique)이 제안되고 있지만, 이들 군집 타당성을 분석하는 기법의 성능에 대한 비교, 평가는 매우 드물다. 본 논문에서는 저차원의 모의실험 자료와 실제 유전자 발현 자료에 대하여 군집 타당성분석 기법들의 성능을 비교하였으며, 그 결과 내적 측도에서는 Dunn 지수, Silhouette 지수 순으로 뛰어났고 외적 측도에서는 Jaccard 지수가 성능이 가장 우수한 것으로 평가되었다.

유전자 발현 자료를 이용한 군집 타당성분석 기법 비교 (Comparison of the Cluster Validation Techniques using Gene Expression Data)

  • 정윤경;백장선
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 한국데이터정보과학회 2006년도 PROCEEDINGS OF JOINT CONFERENCEOF KDISS AND KDAS
    • /
    • pp.63-76
    • /
    • 2006
  • 유전자 발현 자료(gene expression data)를 분석하기 위한 여러 가지 군집 알고리즘(clustering algorithm)과 군집 결과들을 검증하는 척도, 즉 군집 타당성분석 기법(cluster validation technique)이 제안되고 있지만, 이틀 군집 타당성을 분석하는 기법들에 대한 성능의 비교 평가는 매우 드물다. 본 논문에서는 모의 생성 자료로 몇 가지 특정 상황을 연출하여 군집 타당성 분석 기법들을 비교해 보고, 실제 유전자 발현 자료 두 가지에 대해서도 이들 기법의 성능을 비교 평가해 보았다.

  • PDF

Fuzzy Classification Using EM Algorithm

  • Lee Sang-Hoon
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2005년도 Proceedings of ISRS 2005
    • /
    • pp.675-677
    • /
    • 2005
  • This study proposes a fuzzy classification using EM algorithm. For cluster validation, this approach iteratively estimates the class-parameters in the fuzzy training for the sample classes and continuously computes the log-likelihood ratio of two consecutive class-numbers. The maximum ratio rule is applied to determine the optimal number of classes.

  • PDF

Validation Measures of Bicluster Solutions

  • Lee, Young-Rok;Lee, Jeong-Hwa;Jun, Chi-Hyuck
    • Industrial Engineering and Management Systems
    • /
    • 제8권2호
    • /
    • pp.101-108
    • /
    • 2009
  • Biclustering is a method to extract subsets of objects and features from a dataset which are characterized in some way. In contrast to traditional clustering algorithms which group objects similar in a whole feature set, biclustering methods find groups of objects which have similar values or patterns in some features. Both in clustering and biclustering, validating how much the result is informative or reliable is a very important task. Whereas validation methods of cluster solutions have been studied actively, there are only few measures to validate bicluster solutions. Furthermore, the existing validation methods of bicluster solutions have some critical problems to be used in general cases. In this paper, we review several well-known validation measures for cluster and bicluster solutions and discuss their limitations. Then, we propose several improved validation indices as modified versions of existing ones.

A Cluster validity Index for Fuzzy Clustering

  • Lee, Haiyoung
    • 한국지능시스템학회논문지
    • /
    • 제9권6호
    • /
    • pp.621-626
    • /
    • 1999
  • In this paper a new cluster validation index which is heuristic but able to eliminate the monotonically decreasing tendency occurring in which the number of cluster c gets very large and close to the number of data points n is proposed. We review the FCM algorithm and some conventional cluster validity criteria discuss on the limiting behavior of the proposed validity index and provide some numerical examples showing the effectiveness of the proposed cluster validity index.

  • PDF

시간 경로 마이크로어레이 자료의 군집 분석에 관한 고찰 (A Review of Cluster Analysis for Time Course Microarray Data)

  • 손인석;이재원;김서영
    • 응용통계연구
    • /
    • 제19권1호
    • /
    • pp.13-32
    • /
    • 2006
  • 생물학자들은 시간에 따라 발현 수준이 변화하는 유전자의 군집화를 시도하고 있다. 지금까지는 마이크로어레이 자료의 군집분석에 관한 연구의 경우 군집 방법 자체를 비교하는 연구가 주를 이루었다. 그러나 군집화 이전에 의미있는 변화를 보이는 유전자 선택에 따라 군집화 결과가 달라지기 때문에, 군집 분석에 있어서 유전자 선택 단계도 중요하게 고려되어야 한다. 따라서, 본 논문에서는 시간 경로 마이크로어레이 자료를 군집 분석하는데 있어서 유전자 선택, 군집 방법 선택, 군집평가 방법 선택 등 3가지 요인을 고려한 폭 넓은 비교 연구를 하였다.

새로운 클러스터 평가 지표 (A Novel Cluster Validation Index)

  • 서석태;손세호;이인근;정혜천;권순학
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2005년도 추계학술대회 학술발표 논문집 제15권 제2호
    • /
    • pp.171-174
    • /
    • 2005
  • 기존의 클러스터 평가 지표(cluster validation index)는 클러스터의 개수가 커질수록 클러스터 평가 지표 값이 단조 감소하는 경향을 보인다. 최근에 이러한 단점을 보완하는 새로운 클러스터 평가 지표가 본 논문 저자중의 하나에 의해 제안되었으나, over-clustering의 단점 을 지니고 있다. 본 논문에서는, 클러스터 평가 지표 값이 단조 감소 및 over-clustering을 방지할 수 있는 새로운 클러스터 평가 지표를 제안하고, 여러 가지 예제를 통하여 새롭게 제안된 평가 지표의 타당성을 보인다.

  • PDF

Fuzzy Training Based on Segmentation Using Spatial Region Growing

  • Lee Sang-Hoon
    • 대한원격탐사학회지
    • /
    • 제20권5호
    • /
    • pp.353-359
    • /
    • 2004
  • This study proposes an approach to unsupervisedly estimate the number of classes and the parameters of defining the classes in order to train the classifier. In the proposed method, the image is segmented using a spatial region growing based on hierarchical clustering, and fuzzy training is then employed to find the sample classes that well represent the ground truth. For cluster validation, this approach iteratively estimates the class-parameters in the fuzzy training for the sample classes and continuously computes the log-likelihood ratio of two consecutive class-numbers. The maximum ratio rule is applied to determine the optimal number of classes. The experimental results show that the new scheme proposed in this study could be used to select the regions with different characteristics existed on the scene of observed image as an alternative of field survey that is so expensive.

퍼지 클러스터링의 베이지안 검증 방법을 이용한 발아효모 세포주기 발현 데이타의 분석 (Analysis of Saccharomyces Cell Cycle Expression Data using Bayesian Validation of Fuzzy Clustering)

  • 유시호;원홍희;조성배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권12호
    • /
    • pp.1591-1601
    • /
    • 2004
  • 유전자를 분석하는 방법 중 하나인 클러스터링은 비슷한 기능을 가진 유전자들을 집단화시켜서 유전자 집단의 기능을 분석하는데 이용되고 있다. 유전자들은 다양한 functional family에 속할 수 있기 때문에 각 유전자의 클러스터를 하나로 결정짓는 기존의 클러스터링 방법보다 퍼지 클러스터링 방법이 유전자 클러스터링에 더 적합하다. 본 논문에서는 피지 클러스터 결과를 효과적으로 검증할 수 있는 베이지안 검증 방법을 제안한다. 베이지안 검증 방법은 확률기반의 방법으로 주어진 데이타에 대해 가장 큰 사후확률을 가진 클러스터 분할을 선택한다. 먼저 본 논문에서 제안하는 베이지안 검증 방법과 기존의 대표적인 4가지 퍼지 클러스터 검증 방법들을 4가지 데이타에 대해 퍼지 c-means알고리즘을 대상으로 비교 평가한다. 그리고 발아효모 세포주기 발현 데이타를 클러스터링한 후, 제안하는 방법으로 그 결과를 검증하여 분석한다.

An Evaluation of the Coupling Coordination Degree of the Yangtze River Delta Port Cluster Based on Coupling Theory

  • Lu Ke;Yong-Sik Oh
    • 한국항해항만학회지
    • /
    • 제48권2호
    • /
    • pp.78-87
    • /
    • 2024
  • To quantitatively assess the correlation between subsystems within a port cluster and the overall coordinated development of the port group, the current paper evaluates the coordinated development of port clusters. First, we construct an evaluation index system for the coupling and coordination of port clusters. Next, we introduce the contribution index of port subsystems, coupling degree, and coupling coordination degree functions to formulate a coupling coordination evaluation model for the port cluster. Finally, we use the Yangtze River Delta port cluster as a case study for validation, specifically using empirical data from 2012 to 2021. The findings reveal distinct phased characteristics in the coupling and coordination of port clusters in the Yangtze River Delta, marked by a notable transition from "maladjustment" to "coordination." Further, sustained high coupling values over a decade indicate a significant level of competition and cooperation among ports within the Yangtze River Delta port cluster. Over time, this competitive and collaborative dynamic has progressively evolved toward a more positive and structured direction. Lastly, it is expected that the evaluation model proposed in this paper can be extrapolated to other port clusters to gauge the extent of coordinated development, thereby facilitating horizontal comparisons and vertical analyses.