• 제목/요약/키워드: Cluster Validity Problem

검색결과 22건 처리시간 0.019초

Nearest neighbor and validity-based clustering

  • Son, Seo H.;Seo, Suk T.;Kwon, Soon H.
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제4권3호
    • /
    • pp.337-340
    • /
    • 2004
  • The clustering problem can be formulated as the problem to find the number of clusters and a partition matrix from a given data set using the iterative or non-iterative algorithms. The author proposes a nearest neighbor and validity-based clustering algorithm where each data point in the data set is linked with the nearest neighbor data point to form initial clusters and then a cluster in the initial clusters is linked with the nearest neighbor cluster to form a new cluster. The linking between clusters is continued until no more linking is possible. An optimal set of clusters is identified by using the conventional cluster validity index. Experimental results on well-known data sets are provided to show the effectiveness of the proposed clustering algorithm.

퍼지 성능 측정자를 결합한 최적 클러스터 분석방법 (An Optimal Cluster Analysis Method with Fuzzy Performance Measures)

  • 이현숙;오경환
    • 한국지능시스템학회논문지
    • /
    • 제6권3호
    • /
    • pp.81-88
    • /
    • 1996
  • 클러스터링은 주어진 데이타 집합의 패턴을 비슷한 성질을 가지는 그룹으로 나누어 패턴 상호간의 관계를 정립하기 위한 방법론이다. 이러한 클러스터링 기법을 위하여 많은 알고리즘이 개발되었고, 패턴인식과 영상처리 등의 여러 공학영역에 적용되어 왔다. 대부분의 실세계 데이타는 그 경계가 명확하지 않으므로 그 특성을 보다 정확히 반영하기 위하여 퍼지이론이 도입되었다.이와 같은 클러스터 분석 방법은 보다 적절히 으용하기 위하여 클러스터링의 적절성을 평가하기 위한 방법론과 함께 연구되어야 한다. 이를 위하여 각 데이타 패턴이 얼마나 잘 분류되었는지를 수학적으로 계산하기 위한 함수들이 제안되었다. 그러나 클로스터 타당성 문제는 주어지 클러스터링 방법론의 특성, 그 알고리즘에서 사용한 파라메터의 성질, 주어진 입력 데이타 집합의 특성 등 여러 복잡한 상황을 포함하고 있으므로 기존의 연구에서와 같이 하나의 함수를 이용하여 해결하기는 어렵다. 그러므로 본 논문에서는 기존에 연구되어온 타당성 측정 함수를 조사하고 그의 단점을 고찰하여 이를 해결하기 위한 방법으로 4가지성능 측정자를 제안하고 이의 결합에 의하여 형성된 클러스터 타당성의 정도를 구하는 방법론을 제시하고자 한다. 또한 이러한 방법은 퍼지 클러스터링을 위한 학습 알고리즘과 결함하여 클러스터의 수나 데이타의 분포에 대한 정보없이 최적 클러스터를 찾아주는 방법에 응용될 수 있음을 보인다.

  • PDF

VS-FCM: Validity-guided Spatial Fuzzy c-Means Clustering for Image Segmentation

  • Kang, Bo-Yeong;Kim, Dae-Won
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제10권1호
    • /
    • pp.89-93
    • /
    • 2010
  • In this paper a new fuzzy clustering approach to the color clustering problem has been proposed. To deal with the limitations of the traditional FCM algorithm, we propose a spatial homogeneity-based FCM algorithm. Moreover, the cluster validity index is employed to automatically determine the number of clusters for a given image. We refer to this method as VS-FCM algorithm. The effectiveness of the proposed method is demonstrated through various clustering examples.

퍼지 성능 측정자를 이용한 적응 데이터 마이닝 모델 (Adaptive Data Mining Model using Fuzzy Performance Measures)

  • 이현숙
    • 정보처리학회논문지B
    • /
    • 제13B권5호
    • /
    • pp.541-546
    • /
    • 2006
  • 데이터 마이닝은 방대한 양의 데이터를 다루는 응용영역에서 학습과 함께 연구되어 실세계의 문제를 해결할 수 있는 구체적인 방법을 제시해 주고 있다. 데이터 마이닝을 위한 보편적인 방법으로 사용되어 온 클러스터 분석 방법은 데이터의 양이 많아질수록, 실세계에서 직접 얻은 데이터일수록 경계가 불분명하고 처리과정에서 많은 오차가 발생하게 되어 직접 적용하고자할 때 고려해야할 점이 많다. 이를 위하여 퍼지 개념이 도입된 퍼지 클러스터링 방법론은 클러스터 타당성문제와 함께 널리 연구되어왔다. 본 논문에서는 클러스터링의 결과가 만들어 내는 오류 값을 최소화하는 방향으로 학습하는 비교사 학습신경망에 의하여 클러스터링이 이루어지고 이를 퍼지 성능 측정자에 의하여 평가하면서 최적의 클러스터 수를 찾아가는 적응형 데이터 마이닝 모델을 제안하고자 한다 또한 뉴스그룹의 텍스트 데이터를 처리하여 문서분류에 활용할 수 있음을 보임으로 제안된 모델의 타당성을 확인하고자 한다.

퍼지 클러스터링을 이용한 심전도 신호의 구분 알고리즘에 관한 연구 (A Study on Labeling Algorithm of ECG Signal using Fuzzy Clustering)

  • 공인욱;권혁제;이정환;이명호
    • 제어로봇시스템학회논문지
    • /
    • 제5권4호
    • /
    • pp.427-436
    • /
    • 1999
  • This paper describes an ECG signal labeling algorithm based on fuzzy clustering, which is very useful to the automated ECG diagnosis. The existing labeling methods compares the crosscorrelations of each wave form using IF-THEN binary logic, which tends to recognize the same wave forms such as different things when the wave forms have a little morphological variation. To prevent this error, we have proposed as ECG signal labeling algorithm using fuzzy clustering. The center and the membership function of a cluster is calculated by a cluster validity function. The dominant cluster type is determined by RR interval, and the representative beat of each cluster is determined by MF (Membership Function). The problem of IF-THEN binary logic is solved by FCM (Fuzzy C-Means). The MF and the result of FCM can be effectively used in the automated fuzzy inference -ECG diagnosis.

  • PDF

퍼지 클러스터링 알고리즘을 이용한 타이어 접지면 패턴의 분류 (Tire Tread Pattern Classification Using Fuzzy Clustering Algorithm)

  • 강윤관;정순원;배상욱;김진헌;박귀태
    • 한국지능시스템학회논문지
    • /
    • 제5권2호
    • /
    • pp.44-57
    • /
    • 1995
  • 본논문에서는 GFI(Generalized Fuzzy Isodata)와 FI(Fuzzy Isodata) 알고리즘에 관한 이론을 고찰하고 이를 타이어 접지면 패턴 분류에 적용해 보았다. GFI 알고리즘은 FI 알고리즘의 일반화된 형태로서 분할된 군집에 대해서도 퍼지 분할 행렬(fuzzy partition matrix)을 고려해 다시 군집화(clustering)를 가능하게 하는 알고리즘이다. GFI 알고리즘을 사용하여 이진 트리를 구성함에 있어서 각 노드에서의 분할 여부, 즉 군잡화의 타당성(clustering validity) 점검 및 최종적인 이진 트리의 완성은 FDH(Fuzzy Divisve Hierarchical) 군집화알고리즘을 통해 이루어진다. 타이어 접지면에 대한 표준 특징량을 선정하거나 패턴 분류를 수행함에 있어서 이들 알고리즘은모두 우수한 성능을 가짐을 알 수 있었다. 패턴의 특징량으로는 전처리된 타이어 접지면 영상에 나타나는 윤곽선(edge)의 각도 성분을 선정하였으며 이렇게 선정된 특징량은 패턴의 특징을 잘 표현해 주는 유용한 정보를 가진 것으로 생각된다.

  • PDF

자기조정 퍼지제어기에 의한 전력계통 안정화에 관한 연구 (Stabilization of Power System using Self Tuning Fuzzy controller)

  • 정형환;정동일;주석민
    • 한국지능시스템학회논문지
    • /
    • 제5권2호
    • /
    • pp.58-69
    • /
    • 1995
  • 본 논문에서는 자기조정 퍼지제어기의 한 설계기법을 제안하고, 이를 전력계통 안정화에 적용하였다. 제안된 퍼지제어기의 파라미터는 최급강하법에 의하여 멤버쉽 함수의 중심치와 폭이 최적인 값으로 자지고정 되어진다. 이를 전력계통에 적용한 결과 제안된 제어기법이 종래의 제어기법보다 응답특성이 우수함을 보였다.

  • PDF

유사성 계수를 이용한 군집화 문제에서 유전자와 국부 최적화 알고리듬의 적용 (Application of Genetic and Local Optimization Algorithms for Object Clustering Problem with Similarity Coefficients)

  • 임동순;오현승
    • 대한산업공학회지
    • /
    • 제29권1호
    • /
    • pp.90-99
    • /
    • 2003
  • Object clustering, which makes classification for a set of objects into a number of groups such that objects included in a group have similar characteristic and objects in different groups have dissimilar characteristic each other, has been exploited in diverse area such as information retrieval, data mining, group technology, etc. In this study, an object-clustering problem with similarity coefficients between objects is considered. At first, an evaluation function for the optimization problem is defined. Then, a genetic algorithm and local optimization technique based on heuristic method are proposed and used in order to obtain near optimal solutions. Solutions from the genetic algorithm are improved by local optimization techniques based on object relocation and cluster merging. Throughout extensive experiments, the validity and effectiveness of the proposed algorithms are tested.

클러스터 시스템에서 프리스트레스트 콘크리트 프레임의 병렬 비선형해석 (Parallel Nonlinear Analysis of Prestressed Concrete Frame on Cluster System)

  • 이재석;최규천
    • 한국전산구조공학회논문집
    • /
    • 제14권3호
    • /
    • pp.287-298
    • /
    • 2001
  • 본 논문에서는 클러스터 시스템을 이용하여 프리스트레스트 콘크리트 프레임의 병렬 비선형해석이 가능한 해석수단을 제시하였다. Win 98 및 Linux 운영체제 하의 PC 및 Ethernet을 활용하여 저가의 클러스터 시스템을 구축하였고 메시지 전송을 위하여 MPI를 사용하였다. 비선형해석에 있어 해석시간의 대부분을 차지하는 반복계산과정 중 병렬계산에 의한 효율이 높은 접선강도매트릭스의 형성 및 요소응력계산, 재료상태 결정, 부재파괴 검토, 불평형하중 계산과정에 대한 병렬계산 알고리즘을 메시지 전송방식을 이용하여 제시하고 클러스터 시스템 상에서 구현했다. 캔틸레버 보와 PSC 거더교를 대상으로 클러스터 컴퓨팅을 이용한 비 선형해석을 수행한 결과 노트가 4개일 경우의 성능향상은 고려한 비선형형성 및 문제의 크기에 따라 다르나 Win98 환경에서 최소 2.46배에서 최대 3.18배로 나타났고 Linux 환경에서 최소 3.16배에서 최대 3.74배로 나타났으며 통신환경의 개선에 따라 증대될 것으로 기대된다.

  • PDF

PC 클러스터 기반 병렬 유전 알고리즘-타부 탐색을 이용한 배전계통 고장 복구 (PC Cluster Based Parallel Genetic Algorithm-Tabu Search for Service Restoration of Distribution Systems)

  • 문경준;이화석;박준호;김형수
    • 대한전기학회논문지:전력기술부문A
    • /
    • 제54권8호
    • /
    • pp.375-387
    • /
    • 2005
  • This paper presents an application of parallel Genetic Algorithm-Tabu Search (GA-TS) algorithm to search an optimal solution of a service restoration in distribution systems. The main objective of service restoration of distribution systems is, when a fault or overload occurs, to restore as much load as possible by transferring the do-energized load in the out of service area via network reconfiguration to the appropriate adjacent feeders at minimum operational cost without violating operating constraints, which is a combinatorial optimization problem. This problem has many constraints with many local minima to solve the optimal switch position. This paper develops parallel GA-TS algorithm for service restoration of distribution systems. In parallel GA-TS, GA operators are executed for each processor. To prevent solutions of low fitness from appearing in the next generation, strings below the average fitness are saved in the tabu list. If best fitness of the GA is not changed for several generations, TS operators are executed for the upper $10\%$ of the population to enhance the local searching capabilities. With migration operation, best string of each node is transferred to the neighboring node after predetermined iterations are executed. For parallel computing, we developed a PC cluster system consists of 8 PCs. Each PC employs the 2 GHz Pentium IV CPU and is connected with others through ethernet switch based fast ethernet. To show the validity of the proposed method, proposed algorithm has been tested with a practical distribution system in Korea. From the simulation results, we can find that the proposed algorithm is efficient for the distribution system service restoration in terms of the solution quality, speedup, efficiency and computation time.