• Title/Summary/Keyword: 최적의 클러스터 수

Search Result 155, Processing Time 0.031 seconds

Dynamic Load Balancing using Execution Time Prediction on Cluster Systems (클러스터 시스템에서 실행시간 예측을 통한 동적 부하 균등화)

  • 윤완오;정진하;최상방
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10c
    • /
    • pp.853-855
    • /
    • 2001
  • 네트워크 기술의 발전으로 저비용으로 고성능을 얻고자 하는 클러스터 시스템에 대한 연구가 많아지고 있다. SPMD(Single Program Multiple Data) 형태의 병렬 프로그램을 사용한 클러스터 시스템의 주된 성능 장애는 부하 불균등 현상이다 본 논문에서는 이러한 문제를 해결하기 위해 마스터 노드가 정보를 모으는 횟수와 주기를 시뮬레이션을 통해 최적의 값으로 결정하고 그 주기 동안에 각 노드의 태스크 당 평균 수행시간을 계산한다. 통신비용의 오버헤드를 고려한 시스템의 실행시간을 평균 수행시간으로 예측하여 각 노드가 이동할 태스크의 수를 결정하는 동적 부하 균등 알고리즘을 제안한다 제안한 알고리즘의 클러스터 시스템을 모델링하고 성능 분석을 위한 시뮬레이션을 한다.

  • PDF

An Energy Saving Method Using Cluster Group Model in Wireless Sensor Networks (무선 센서 네트워크에서 클러스터 그룹 모델을 이용한 에너지 절약 방안)

  • Kim, Jin-Su
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.11 no.12
    • /
    • pp.4991-4996
    • /
    • 2010
  • Clustering method in wireless sensor network is the technique that forms the cluster to aggregate the data and transmit them at the same time that they can use the energy efficiently. Even though cluster group model is based on clustering, it differs from previous method that reducing the total energy consumption by separating energy overload to cluster group head and cluster head. In this thesis, I calculate the optimal cluster group number and cluster number in this kind of cluster group model according to threshold of energy consumption model. By using that I can minimize the total energy consumption in sensor network and maximize the network lifetime. I also show that proposed cluster group model is better than previous clustering method at the point of network energy efficiency.

A fuzzy cluster validity index for the evaluation of Fuzzy C-Means algorithm (최적 클러스터 분할을 위한 FCM 평가 인덱스)

  • 김대원;이광현
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.374-376
    • /
    • 2003
  • 본 논문에서는 Fussy C-Means (FCM) 알고리즘에 의해 계산된 퍼지 클러스터들에 대한 평가 인덱스를 제안한다. 제안된 인덱스는 퍼지 클러스터들간의 인접성(inter-cluster proximity)을 이용한다. 클러스터 인접성을 도입함으로써 클러스터간의 중첩 정도를 계산할 수 있다. 따라서, 인접성 값이 낮을수록 클러스터들은 공간에 잘 분포하게 됨을 알 수 있다. 다양한 데이터 집합에 대한 실험을 통해서 제안된 인덱스의 효율성과 신뢰성을 검증하였다.

  • PDF

Effective Data Partitioning in Hierarchical Clustering: A Parameter-Insensitive Approach (계층적 클러스터링을 위한 매개변수를 요구하지 않은 초기 데이터 분할 방안)

  • Song, Suk-Soon;Yoon, Seok-Ho;Kim, Sang-Wook
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.04a
    • /
    • pp.856-857
    • /
    • 2010
  • 본 논문에서는 계층적 클러스터링을 위한 매개변수에 민감하지 않은 효과적인 데이터 분할 방안을 제안한다. 먼저, 선행 실험을 통하여 기존 방안이 매개 변수에 민감하다는 것을 보인다. 본 논문에 제안하는 방안은 주어진 데이터를 최적의 초기 부분 클러스터의 크기를 결정할 수 있는 측정 함수를 제안하고 제안된 측정 함수를 이용해서 주어진 데이터를 최적의 초기 부분 클러스터들로 분할한다. 또한, 분할된 초기 부분 클러스터들을 병합해서 질이 좋은 최종 클러스터들을 생성한다. 실험을 통하여 제안하는 방안이 기존 방안보다 매개 변수에 민감하지 않는다는 것을 보인다.

Clustering gene expression data using Non -Negative matrix factorization (Non-negative matrix factorization 을 이용한 마이크로어레이 데이터의 클러스터링)

  • Lee, Min-Young;Cho, Ji-Hoon;Lee, In-Beum
    • Proceedings of the Korean Society for Bioinformatics Conference
    • /
    • 2004.11a
    • /
    • pp.117-123
    • /
    • 2004
  • 마이크로어레이 (microarray) 기술이 개발된 후로 연관된 유전자 클러스터 (cluster)를 찾는 문제는 깊이 연구되어왔다. 이 문제는 핵심적인 과제 중 하나는 생물학적으로 타당한 클러스터의 수를 결정하는 데 있다. 본 논문은 최적의 클러스터 수를 결정하는 기준을 제시하고, non-negative factorization (NMF)를 이용해 클러스터 centroid의 패턴을 찾는 방법을 제안한다. NMF에 의해 발견된 각각의 패턴은 생물학적 프로세스의 특정 부분으로 해석될 수 있다. NMF는 factor matrix의 entity를 non-negative로 제약 (constraint)하고, 이 제약은 오직 additive combination만 허용하기 때문에 이러한 부분적인 패턴을 찾아낼 수 있다. NMF의 유용성은 이미지 분석과 텍스트 분석에서 이미 입증되어 있다. 본 논문에서 제안한 방법에 의해 위의패턴과 유사한 발현 패턴을 갖는 유전자를 모을 수 있었다. 제안된 방법은 human fibroblast데이터와 yeast cell cycle 데이터에 적용해 성능을 입증하였다.

  • PDF

Fault tolerant clustering based on local reconfiguration in sensor network (센서 네트워크의 지역적 재구성에 기반한 오류허용 클러스터링)

  • Kim, Huey-In;Kim, Sung-Cheon
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07a
    • /
    • pp.28-30
    • /
    • 2005
  • 센서들은 제한된 자원으로 구동되므로 오류가 나기 쉽다. 특히 구조적 라우팅의 경우 클러스터 헤드의 오류시 많은 수의 센서가 네트워크에서 분리되어 네트워크 성능에 악영향을 미친다. 따라서 오류 처리에 관한 연구들이 이루어져 왔으나 기존의 연구들은 망을 최적으로 유지하기 위해 재구성시 전체 네트워크를 재구성 하며 고정된 주기를 사용하여 전체적인 망이 최적의 상태임에도 불구하고 재구성 되거나, 클러스터에 오류가 생겨도 재구성되기까지 기다려야 한다는 단점이 있었다. 따라서 본 논문에서는 지역적인 재클러스터링을 통하여 네트워크를 최적으로 유지하며 클러스터들의 부하를 고려하여 망을 동적으로 재구성 하는 방법을 제안하였다. NS-2를 이용한 시뮬레이션을 통하여 기존의 방법에 비하여 본 논문에서 제안한 알고리즘이 네트워크 유지시간을 연장시켜 더 많은 양의 데이터가 수집됨을 확인 할 수 있었다.

  • PDF

A Clustering Algorithm using the Genetic Algorithm (진화알고리즘을 이용한 클러스터링 알고리즘)

  • 류정우;김명원
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.313-315
    • /
    • 2000
  • 클러스터링에 있어서 K-means와 FCM(Fuzzy C-means)와 같은 기존의 알고리즘들은 지역적 최소 해에 수렴될 문제와 사전에 클러스터 개수를 결정해야 하는 문제점을 가지고 있다. 본 논문에서는 병렬 탐색을 통해 최적 해를 찾는 진화 알고리즘을 사용하여 지역적 최소 해에 수렴되는 문제점을 개선하였으며, 클러스터의 특성을 표준편차 벡터를 계산하여 중심으로부터 포함된 데이터가 얼마나 분포되어 있는지 알 수 있는 분산도와 임의의 데이터와 모든 중심들간의 거리의 비율로서 얻어지는 소속정도를 고려하여 클러스터간의 간격을 알 수 있는 분리도를 정의함으로써 자동으로 클러스터 개수를 결정할 수 있게 하였다. 실험데이터와 가우시안 분포에 의해 생성된 다차원 실험데이터를 사용하여 제안한 알고리즘이 이러한 문제점들을 해결하고 있음을 보인다.

  • PDF

Performance Analysis of Network Devices for High Performance Computing Cluster (HPC 클러스터 구축을 위한 다양한 네트워크 성능 분석)

  • Hong, Jeong-Woo;Lee, Bo-Sung;Park, Hyung-Woo;Lee, Sang-San
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.04a
    • /
    • pp.319-322
    • /
    • 2002
  • 최근 주목받고 있는 그리드 컴퓨팅 연구등에 주요한 요소로서 기대되어지는 고성능 클러스터 시스템들은 주로 과학 기술 응용연구를 위해 사용되어진다. 이러한 종류의 병렬 시스템은 특정 부품들을 사용하는데 그중 네트워크를 구성하는 부품들이 통상의 분산/병렬컴퓨팅에 주요한 역할요소로서 주목을 받아오고 있다. 이 논문에서는 myrinet, Gbit ethernet, Fast ethernet 장비에 대하여 각각 Netpipe, Linpack, NPB 등의 벤치마크를, 성능 실험을 동해 선정한 Pentium IV 1.7Mhz/1Gb Mem 16노드로 구성한 클러스터에 대하여 2종의 컴파일러를 사용하여 테스트하고 그 결과를 분서하였다. 상이한 성능 차를 보이는 장비간의 성능 비교를 통해 2002년 2월 현재 가능한 응용문제가 사용하고 있는 알고리즘에 따른 최적의 클러스터 시스템의 최적 구성을 도출 할 수 있다.

  • PDF

A Study for Determining the Best Number of Clusters on Temporal Data (Temporal 데이터의 최적의 클러스터 수 결정에 관한 연구)

  • Cho Young-Hee;Lee Gye-Sung;Jeon Jin-Ho
    • The Journal of the Korea Contents Association
    • /
    • v.6 no.1
    • /
    • pp.23-30
    • /
    • 2006
  • A clustering method for temporal data takes a model-based approach. This uses automata based model for each cluster. It is necessary to construct global models for a set of data in order to elicit individual models for the cluster. The preparation for building individual models is completed by determining the number of clusters inherent in the data set. In this paper, BIC(Bayesian Information Criterion) approximation is used to determine the number clusters and confirmed its applicability. A search technique to improve efficiency is also suggested by analyzing the relationship between data size and BIC values. A number of experiments have been performed to check its validity using artificially generated data sets. BIC approximation measure has been confirmed that it suggests best number of clusters through experiments provided that the number of data is relatively large.

  • PDF

A Study on the Efficient TICC(Time Interval Clustering Control) Algorithm That Considering Attribute (노드의 속성을 고려한 효율적인 TICC(Time Interval Clustering Control) 알고리즘에 관한 연구)

  • Kim, Young-Sam;Doo, Kyoung-Min;Chi, Sam-Hyun;Lee, Kang-Whan
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2008.05a
    • /
    • pp.499-502
    • /
    • 2008
  • 한정된 용량의 배터리에 의존하는 무선 Ad-hoc 네트워크(MANET)에서는 에너지 효율을 높이기 위한 다양한 클러스터링 기법과 라우팅 알고리즘이 연구되고 있다. 이러한 무선 Ad-hoc 네트워크에서는 에너지 효율이 높은 클러스터 기반의 라우팅 알고리즘이 많이 사용된다. 그러나 일반적인 클러스터 방식에 따른 라우팅 알고리즘에서는 클러스터 헤드 노드에 부하가 집중되어 에너지 소모가 많은 문제점을 가진다. 이 문제를 보완하기 위해서 클러스터 헤드 노드의 재 선출을 통해 에너지 소모를 분산하는 동적 클러스터링 방식이 사용되고 있다. 그러나 동적 클러스터링 방식 또한 높은 빈도의 클러스터 재형성 과정에서 많은 에너지를 소모하는 문제점이 있다. 즉, 지금까지 연구되어온 알고리즘은 클러스터 구성에 대한 효율적인 알고리즘을 제시하고 있지만 불필요한 에너지 소모를 최소화하는 최적의 헤드 노드 선정 방법과 클러스터 관리를 통하여 에너지 효율을 높일 수 있는 해결책을 제시하지 않았다. 따라서 본 논문에서는 위의 클러스터 문제를 해결하기 위해 TICC(Time Interval Clustering Control) 알고리즘 기법을 제안한다. 제안된 TICC은 각 노드의 에너지 속성 값에 따라 에너지 Level을 분류하고 분류된 에너지 Level에 따라 타이밍을 고려한 클러스터링 및 노드 관리방법이다. 이러한 TICC기법을 적용하여 실험을 하였고 결과적으로 클러스터 전체의 에너지 효율을 향상되고 Lifetime이 증가함을 보였다.

  • PDF