• 제목/요약/키워드: Cluster Partition

검색결과 67건 처리시간 0.023초

군집분석의 분할 유용도 점수의 영향 분석 (Impact Analysis of Partition Utility Score in Cluster Analysis)

  • 이계성
    • 문화기술의 융합
    • /
    • 제7권3호
    • /
    • pp.481-486
    • /
    • 2021
  • 기계학습 알고리즘은 기준 함수를 채택하여 데이터를 처리하고 학습 모델을 유도한다. 군집분석에서 사용하는 기준 함수는 어떤 형태로든지 선호성을 내포하게 되고 이를 통해 유사한 데이터끼리 묶어 준 후 이를 구성하는 변수와 값들을 특정하여 군집을 정의하게 된다. 군집분석에서 사용하는 카테고리 유용도와 분할 유용도 점수가 군집분석 결과물에 어떤 영향을 주는지를 파악하고 이들이 결과에 어떤 편향성으로 이어지는지를 분석한다. 본 연구는 군집분석에 사용되는 기준 함수의 특성에 따라 결과에 미치는 영향을 파악하기 위해 여러 데이터 세트를 이용해 실험하고 결과를 평가한다.

Bayesian analysis of random partition models with Laplace distribution

  • Kyung, Minjung
    • Communications for Statistical Applications and Methods
    • /
    • 제24권5호
    • /
    • pp.457-480
    • /
    • 2017
  • We develop a random partition procedure based on a Dirichlet process prior with Laplace distribution. Gibbs sampling of a Laplace mixture of linear mixed regressions with a Dirichlet process is implemented as a random partition model when the number of clusters is unknown. Our approach provides simultaneous partitioning and parameter estimation with the computation of classification probabilities, unlike its counterparts. A full Gibbs-sampling algorithm is developed for an efficient Markov chain Monte Carlo posterior computation. The proposed method is illustrated with simulated data and one real data of the energy efficiency of Tsanas and Xifara (Energy and Buildings, 49, 560-567, 2012).

클러스터간 중첩성과 분리성을 이용한 퍼지 분할의 평가 기법 (A Cluster Validity Index Using Overlap and Separation Measures Between Fuzzy Clusters)

  • 김대원;이광형
    • 한국지능시스템학회논문지
    • /
    • 제13권4호
    • /
    • pp.455-460
    • /
    • 2003
  • 본 논문에서는 퍼지 클러스터링 알고리즘에 의해 구해진 퍼지 분할에 대한 최적 클러스터 수를 결정하는 방법을 제안한다. 제안된 척도는 퍼지 클러스터들간의 중첩성과 분리성을 이용한다. 중첩성은 클러스터간 인접도를 이용하여 계산하며, 분리성은 데이터에 대한 상관성 정도로 나타낸다. 따라서 중첩성이 낮고 분리성이 높을수록 좋은 클러스터 결과라고 할 수 있다. 표준 데이터 집합을 대상으로 기존의 척도들과 비교 실험함으로써 제안된 척도의 신뢰성을 검증하였다.

퍼지 클러스터링 알고리즘을 이용한 타이어 접지면 패턴의 분류 (Tire Tread Pattern Classification Using Fuzzy Clustering Algorithm)

  • 강윤관;정순원;배상욱;김진헌;박귀태
    • 한국지능시스템학회논문지
    • /
    • 제5권2호
    • /
    • pp.44-57
    • /
    • 1995
  • 본논문에서는 GFI(Generalized Fuzzy Isodata)와 FI(Fuzzy Isodata) 알고리즘에 관한 이론을 고찰하고 이를 타이어 접지면 패턴 분류에 적용해 보았다. GFI 알고리즘은 FI 알고리즘의 일반화된 형태로서 분할된 군집에 대해서도 퍼지 분할 행렬(fuzzy partition matrix)을 고려해 다시 군집화(clustering)를 가능하게 하는 알고리즘이다. GFI 알고리즘을 사용하여 이진 트리를 구성함에 있어서 각 노드에서의 분할 여부, 즉 군잡화의 타당성(clustering validity) 점검 및 최종적인 이진 트리의 완성은 FDH(Fuzzy Divisve Hierarchical) 군집화알고리즘을 통해 이루어진다. 타이어 접지면에 대한 표준 특징량을 선정하거나 패턴 분류를 수행함에 있어서 이들 알고리즘은모두 우수한 성능을 가짐을 알 수 있었다. 패턴의 특징량으로는 전처리된 타이어 접지면 영상에 나타나는 윤곽선(edge)의 각도 성분을 선정하였으며 이렇게 선정된 특징량은 패턴의 특징을 잘 표현해 주는 유용한 정보를 가진 것으로 생각된다.

  • PDF

논 잡초(雜草) 가막사리(Bidens tripartita L.) 생태종(生態種)의 분화(分化)에 관(關)한 연구(硏究) (Studies on Differentiation of a Paddy Weed, Bur Beggarticks(Bidens tripartita L.))

  • 김명현;노영덕
    • 한국잡초학회지
    • /
    • 제17권3호
    • /
    • pp.303-309
    • /
    • 1997
  • 가막사리 50개 수집종을 대상으로 여러 가지 형태적(形態的), 생리적(生理的)특성의 변이를 조사하고, 초형(草形), 열엽편수(裂葉片數), 수과(瘦果)길이, 개화소요일수(開花所要日數)를 기준(基準)으로 Ward의 최소분산법(最小分散法)으로 군집분석(群集分析)을 한 결과는 다음과 같다. 가막사리 수집종은 초형, 경장, 개화소요일수, 엽장폭비, 열엽편수, 엽록소함량, 엽색, 경색, 수과색, 수과길이, 수과장폭비 에서 다양한 변이를 보였으며, 수집종에 따라 약간의 변이가 있으나 대부분 상당한 휴면성과 광발아성이 있었다. 초형은 직립형(I)에서 삼각형(V)까지 다양했는데, 마름모형(III)이 가장 많았고, 경장과는 5% 수준에서 부(負)의 상관관계가 있는 것으로 나타났다. 열엽편수는 3개인 것이 가장 많았고 그 다음은 5개의 순으로 나타났는데 열엽(裂葉)되지 않는 수집종도 있었다. 수과길이 및 엽록소함량과는 5% 수준에서 엽장폭비와는 1% 수준에서 부(負)의 상관관계가 있었다. 개화소요일수는 94-141 일 범위였다. 수과길이와는 1% 수준에서, 엽장폭비와는 5% 수준에서 정(正)의 상관관계, 그리고 수과색과는 1% 수준에서 부(負)의 상관관계를 보였다. 수과길이는 6.5-14.0mm의 범위로, 평균 10.0mm, 표준편차 1.7로 9.0-12.0mm 사이가 60%를 차지했다. 수과장폭비, 경장, 개화소요일수와는 1% 수준에서, 엽장폭비와는 5% 수준에서 정(正)의 상관관계를, 그리고 엽색, 경색, 수과색, 열엽편수와는 5% 수준에서 부(負)의 상관관계를 보였다. Ward의 최소분산법을 이용한 군집분석 결과 거리 0.06에서 식물학적으로 특성이 각기 다른 6개 군으로 분류할 수 있었다.

  • PDF

Nearest neighbor and validity-based clustering

  • Son, Seo H.;Seo, Suk T.;Kwon, Soon H.
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제4권3호
    • /
    • pp.337-340
    • /
    • 2004
  • The clustering problem can be formulated as the problem to find the number of clusters and a partition matrix from a given data set using the iterative or non-iterative algorithms. The author proposes a nearest neighbor and validity-based clustering algorithm where each data point in the data set is linked with the nearest neighbor data point to form initial clusters and then a cluster in the initial clusters is linked with the nearest neighbor cluster to form a new cluster. The linking between clusters is continued until no more linking is possible. An optimal set of clusters is identified by using the conventional cluster validity index. Experimental results on well-known data sets are provided to show the effectiveness of the proposed clustering algorithm.

하이브리드 버켓을 이용한 대규모 집적회로에서의 효율적인 분할 개선 방법 (An efficient iterative improvement technique for VLSI circuit partitioning using hybrid bucket structures)

  • 임창경;정정화
    • 전자공학회논문지C
    • /
    • 제35C권3호
    • /
    • pp.16-23
    • /
    • 1998
  • In this paper, we present a fast and efficient Iterative Improvement Partitioning(IIP) technique for VLSI circuits and hybrid bucket structures on its implementation. The IIP algorithms are very widely used in VLSI circuit partition due to their time efficiency. As the performance of these algorithms depends on choices of moving cell, various methods have been proposed. Specially, Cluster-Removal algorithm by S. Dutt significantly improved partition quality. We indicate the weakness of previous algorithms wjere they used a uniform method for choice of cells during for choice of cells during the improvement. To solve the problem, we propose a new IIP technique that selects the method for choice of cells according to the improvement status and present hybrid bucket structures for easy implementation. The time complexity of proposed algorithm is the same with FM method and the experimental results on ACM/SIGDA benchmark circuits show improvment up to 33-44%, 45%-50% and 10-12% in cutsize over FM, LA-3 and CLIP respectively. Also with less CUP tiem, it outperforms Paraboli and MELO represented constructive-partition methods by about 12% and 24%, respectively.

  • PDF

Large-scale TSP의 근사해법에 관한 연구 (A domain-partition algorithm for the large-scale TSP)

  • 김현승;유형선
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 1991년도 한국자동제어학술회의논문집(국내학술편); KOEX, Seoul; 22-24 Oct. 1991
    • /
    • pp.601-605
    • /
    • 1991
  • In this paper an approximate solution method for the large-scale Traveling Salesman Problem(TSP) is presented. The method start with the subdivision of the problem domain into a number of clusters by considering their geometries. The clusters have limited number of nodes so as to get local solutions. They are linked to give the least path which covers the whole domain and become TSPs with start- and end-node. The approximate local solutions in each cluster are obtained by using geometrical property of the cluster, and combined to give an overall-approximate solution for the large-scale TSP.

  • PDF

한정된 그룹 이동에 의한 위상 기반 회로 분할 방법 (A Topology Based Partition Method by Restricted Group Migration)

  • 남민우;최연경;임종석
    • 전자공학회논문지C
    • /
    • 제36C권1호
    • /
    • pp.22-33
    • /
    • 1999
  • 본 논문에서는 다중의 FPGA 칩과 연결 전용 칩으로 구성되어 있는 프로그래밍이 가능한 PCB(Programmable Circuit Board)를 대상으로 주어진 회로를 분할하는 새로운 회로 분할 방법을 제안한다. 여기서 칩들간에는 상호 연결 가능한 배선 위상이 정해져 있으며 사용할 수 잇는 연결선의 수가 고정되어 있다. 그러므로 회로를 PCB상의 다중의 FPGA 칩으로 분할하기 위해서는 기존의 분할 방법과는 달리 칩들간의 연결선에 대한 제한 조건을 고려하여야 하며 이를 위하여 본 논문에서는 주어진 PCB의 모든 제한조건을 고려한 분할 방법을 제안한다. 또한 분할 속도를 개선하면서 보다 좋은 분할 결과를 얻기 위하여 다단계의 클러스터 트리를 생성하여 계층적 분할을 수행한다. 다수의 벤치마크 회로에 대하여 실험한 결과 입력회로들은 주어진 제한 조건들을 모두 만족하면서 분할되었으며 기존의 다중 분할 방법과 비교한 결과에서는 칩간의 연결선의 수가 최대 10 % 적게 사용되었다.

  • PDF

Large-Scale TSP 근사해법에 관한 연구 (A Domain-Partition Algorithm for the Large-Scale TSP)

  • 유형선;김현승
    • 한국정밀공학회지
    • /
    • 제9권3호
    • /
    • pp.122-131
    • /
    • 1992
  • In this paper an approximate solution method for the large-scale Traveling Salesman Problem (TSP) is presented. The method starts with the subdivision of the problem domain into a number of cluster by considering their geometric characteristic. Each cluster has a limited number of nodes so as to get a local solution. They are linked go give the least pathe which covers the whole domain and become TSPs solution with start-and end-node. The approximate local solution in each cluster are obtained based on geometrical properties of the cluster, and combined to give an overall approximate solution for the larte-scale TSP.

  • PDF