• 제목/요약/키워드: and clustering

검색결과 5,621건 처리시간 0.034초

혼합형 데이터에 대한 나무형 군집화 (Tree-structured Clustering for Mixed Data)

  • 양경숙;허명회
    • 응용통계연구
    • /
    • 제19권2호
    • /
    • pp.271-282
    • /
    • 2006
  • 본 논문에서는 범주형과 연속형 변수들이 혼합된 데이터에 적용할 수 있는 나무형 군집화 알고리즘을 제안하였다. 특히 혼합된 변수들이 공통의 의미를 갖도록 하기 위해 범주형 변수들을 전처리하는 방법을 고안하였다. 수치 예로서 SPSS의 신용(credit) 데이터와 독일신용자료(German credit data)에 알고리즘을 적용하고 그 결과를 검토하였다.

공통 Phrase의 관계 그래프와 Suffix Tree 문서 모델을 이용한 문서 군집화 기법 (Document Clustering with Relational Graph Of Common Phrase and Suffix Tree Document Model)

  • 조윤호;이상근
    • 한국콘텐츠학회논문지
    • /
    • 제9권2호
    • /
    • pp.142-151
    • /
    • 2009
  • 기존의 문서 군집화 기법 NSTC은 문서 군집화 과정 내에서 TF-IDF를 이용하여 문서간 유사도를 측정한다. 본 논문에서는 TF-IDF가 아닌, 공통 Phrase의 관계 그래프를 이용한 새로운 문서간 유사도 측정을 제안한다. 이 방법은 문서 집합 내의 공통 Phrase들의 관계를 나타낸 관계 그래프를 통해 공통 Phrase의 가중치를 부여하는 방법을 제시한다. 또한 실험을 통해 NSTC와 비교하여 본 논문에서 제안한 문서간 유사도 측정 기법이 문서 군집화에 더욱 효과적임을 보였다.

클러스터링 기법을 적용한 전력시스템 모델링에 관한 사례 조사 (An Survey on the Power System Modeling using a Clustering Algorithm)

  • 박영수;김진호
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2006년도 제37회 하계학술대회 논문집 A
    • /
    • pp.410-411
    • /
    • 2006
  • This paper is focused on the survey on the power system modeling using a clustering algorithm. In electricity markets, clustering method is a efficient tool to model the power system. It can be seen that electricity markets can also be classified into several groups which show similar patterns and that the fundamental characteristics of power systems can be widely applicable to other technical problems in power system such as generation scheduling, power flow analysis, short-term load forecasting, and so on. There are several researches on the power system modeling using a clustering algorithm. We specially surveyed their own clustering methods to model the power system.

  • PDF

ART1 클러스터링 성능 향상을 위한 초기 학습순서 조정 (Adjustment of initial learning order to improve clustering performance of ART1)

  • 최태훈;임성길;이현수
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2008년도 하계종합학술대회
    • /
    • pp.675-676
    • /
    • 2008
  • This paper presents adjustment of input order to improve clustering performance of ART1. We propose new method for On-line clustering which adjusts initial input data using buffer. We demonstrate the clustering performance of the proposed algorithm by testing it on Zoo data set from UCI and created artificial data set for simulation. Experimental results show that preposed method increases 7.8% of clustering performance than ART1 model on the average.

  • PDF

Wavelet을 이용한 K-means clustering algorithm의 초기화

  • 김국환;장우진;이준석
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 2006년도 춘계공동학술대회 논문집
    • /
    • pp.305-312
    • /
    • 2006
  • K-means clustering algorithm 에서 주로 이루어지는 랜덤 초기화 (random initialization) 방법은 전역 최적화된 해(global minimum)를 찾아내기에 문제점을 지니고 있다. 즉, 여러 횟수의 알고리듬 반복(iteration)을 실행하더라도 전역 최적화된 해를 찾아내기가 매우 힘들며 주어진 자료의 크기(data size)가 큰 경우에 있어서 이는 거의 불가능하다. 본 논문은 이러한 문제점들을 극복하기 위한 방안으로, wavelet을 이용하여 최적의 초기 군집 중심점(initial clustering center)들을 선택하는 방법을 제시한다. 즉, 웨이블릿을 이용한 효과적인 초기화 (initialization)를 통해서 작은 알고리듬 반복 횟수만으로도 전역 최적화에 도달하는 초기화 방법을 기술한다. 이런 초기화 방법이 군집 알고리즘에 사용될 경우, 온라인상에서 실시간 이루어지는 군집 분석에 큰 도움이 된 수 있다.

  • PDF

새로운 클러스터링 알고리듬을 적용한 향상된 뉴로-퍼지 모델링 (Advance Neuro-Fuzzy Modeling Using a New Clustering Algorithm)

  • 김승석;김성수;유정웅
    • 대한전기학회논문지:시스템및제어부문D
    • /
    • 제53권7호
    • /
    • pp.536-543
    • /
    • 2004
  • In this paper, we proposed a new method of modeling a neuro-fuzzy system using a hybrid clustering algorithm. The initial parameters and the number of clusters of the proposed system are optimally chosen simultaneously with respect to the process of regression, which is a unique characteristics of the proposed system. The proposed algorithm presented in this work improves the overall performance of the proposed a neuro-fuzzy system by choosing a proper number of clusters adaptively according the characteristics of given data. The process of clustering is performed by deciding on the number of classes, which yields the property of convergence of the system. In experiments, the superiority of the proposed neuro-fuzzy system is demonstrated, especially the process of optimizing parameters and clustering of learning speed.

특별한 형태의 자료에 대한 확장된 Fuzzy 집락분석방법에 관한 연구 (A Study of an Extended Fuzzy Cluster Analysis on Special Shape Data)

  • 임대혁
    • 산업경영시스템학회지
    • /
    • 제25권6호
    • /
    • pp.36-41
    • /
    • 2002
  • We consider the Fuzzy clustering which is devised for partitioning a set of objects into a certain number of groups by assigning the membership probabilities to each object. The researches carried out in this field before show that the Fuzzy clustering concept is involved so much that for a certain set of data, the main purpose of the clustering cannot be attained as desired. Thus we propose a new objective function, named as Fuzzy-Entroppy Function in order to satisfy the main motivation of the clustering which is classifying the data clearly. Also we suggest Mean Field Annealing Algorithm as an optimization algorithm rather than the ISODATA used traditionally in this field since the objective function is changed. we show the Mean Field Annealing Algorithm works pretty well not only for the new objective function but also for the classical Fuzzy objective function by indicating that the local minimum problem resulted from the ISODATA can be improved.

Semidefinite Programming을 통한 그래프의 동시 분할법 (K-Way Graph Partitioning: A Semidefinite Programming Approach)

  • Jaehwan, Kim;Seungjin, Choi;Sung-Yang, Bang
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.697-699
    • /
    • 2004
  • Despite many successful spectral clustering algorithm (based on the spectral decomposition of Laplacian(1) or stochastic matrix(2) ) there are several unsolved problems. Most spectral clustering Problems are based on the normalized of algorithm(3) . are close to the classical graph paritioning problem which is NP-hard problem. To get good solution in polynomial time. it needs to establish its convex form by using relaxation. In this paper, we apply a novel optimization technique. semidefinite programming(SDP). to the unsupervised clustering Problem. and present a new multiple Partitioning method. Experimental results confirm that the Proposed method improves the clustering performance. especially in the Problem of being mixed with non-compact clusters compared to the previous multiple spectral clustering methods.

  • PDF

무선 센서 네트워크에서 싱크 노드와 인접한 노드의 균등한 에너지 소모를 위한 클러스터링 알고리즘 (Clustering Algorithm to Equalize the Energy Consumption of Neighboring Node with Sink in Wireless Sensor Networks)

  • 정진욱;진교홍
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 춘계종합학술대회 A
    • /
    • pp.465-468
    • /
    • 2008
  • 무선 센서 네트워크의 클러스터링(Clustering) 기법은 센서 노드의 에너지 소모를 최소화하기 위한 목적으로 개발되어 Network Lifetime을 증대시키는 효과를 보인다. 기존의 클러스터링 기법들은 센서 노드들이 CH(Cluster Head) 역할을 교대로 수행함으로써 각 노드의 에너지 소모를 균등하도록 하여 Network Lifetime을 향상시키는 방법을 제안하였지만, 싱크(Sink) 노드와 인접한 노드들의 에너지 소모를 최소화하는 방안은 제시하지 못했다. 본 논문에서는 싱크 노드의 POS(Personal Operating Space)내에 존재하는 인접 노드의 일부를 클러스터의 멤버(Member) 노드로 가입시키지 않고, 직접싱크 노드와 통신하게 함으로써 싱크 노드와 인접한 CH의 에너지 소모를 줄여 Network Lifetime을 연장하는 클러스터링 알고리즘을 제안하였다.

  • PDF

무선 센서 네트워크에서 에너지 소모 모델의 임계값을 고려한 클러스터링 기법 (A Clustering Method Considering the Threshold of Energy Consumption Model in Wireless Sensor Networks)

  • 김진수
    • 한국산학기술학회논문지
    • /
    • 제11권10호
    • /
    • pp.3950-3957
    • /
    • 2010
  • 무선 센서 네트워크는 한정된 자원의 센서 노드들로 구성되어 있고, 한번 구성된 후에는 유지 보수가 어렵다는 단점을 갖고 있다. 따라서 무선 센서 네트워크에서는 에너지 소비를 최소화하고, 한정된 자원을 효율적으로 사용하여 네트워크 수명을 최대화하는 것이 중요한 문제이다. 본 논문에서는 클러스터링 방식에서 클러스터 수를 효율적으로 지정하여 에너지 소모량을 최적화하는 기법을 제안한다. 이 기법은 무선 전송에 소비되는 에너지양은 거리(임계값)에 따라 많은 차이가 있으므로 이러한 임계값을 고려하여 클러스터 수를 지정함으로써 에너지 소비를 줄이는 방식이다. 실험을 통하여 제안된 클러스터링 기법은 LEACH(Low-Energy Adaptive Clustering Hierarchy)에 비해 전체 에너지 소모량 측면에서 높은 성능을 나타냄을 확인하였다.