• 제목/요약/키워드: Clustering Problem

검색결과 708건 처리시간 0.023초

중심체 목적함수를 이용한 다차원 개체 CLUSTERING 기법에 관한 연구 (A Study on Multi-Dimensional Entity Clustering Using the Objective Function of Centroids)

  • 이철;강석호
    • 한국경영과학회지
    • /
    • 제15권2호
    • /
    • pp.1-15
    • /
    • 1990
  • A mathematical definition of the cluster is suggested. A nonlinear 0-1 integer programming formulation for the multi-dimensional entity clustering problem is developed. A heuristic method named MDEC (Multi-Dimensional Entity Clustering) using centroids and the binary partition is developed and the numerical examples are shown. This method has an advantage of providing bottle-neck entity informations.

  • PDF

Fast Super-Resolution Algorithm Based on Dictionary Size Reduction Using k-Means Clustering

  • Jeong, Shin-Cheol;Song, Byung-Cheol
    • ETRI Journal
    • /
    • 제32권4호
    • /
    • pp.596-602
    • /
    • 2010
  • This paper proposes a computationally efficient learning-based super-resolution algorithm using k-means clustering. Conventional learning-based super-resolution requires a huge dictionary for reliable performance, which brings about a tremendous memory cost as well as a burdensome matching computation. In order to overcome this problem, the proposed algorithm significantly reduces the size of the trained dictionary by properly clustering similar patches at the learning phase. Experimental results show that the proposed algorithm provides superior visual quality to the conventional algorithms, while needing much less computational complexity.

양방향 군집 알고리즘을 적용한 교차혼합 U자형 조립라인 균형문제 (Balancing Problem of Cross-over U-shaped Assembly Line Using Bi-directional Clustering Algorithm)

  • 이상운
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권2호
    • /
    • pp.89-96
    • /
    • 2022
  • 본 논문은 NP-난제로 알려진 단일모델 교차혼합 조립라인 균형문제에 대해 휴리스틱 알고리즘을 제안하였다. 조립라인 균형문제는 주로 메타휴리스틱 방법들을 적용하고 있는 추세로 다항시간의 정확한 해를 찾는 알고리즘이 제안되지 않고 있어 실무에 적용하기가 매우 어렵다. 제안된 알고리즘은 주어진 총 조립시간 W와 순환시간 c에 대해 m* = ⌈W/c⌉의 최소 작업자수와 c* = ⌈W/m*⌉의 목표 순환시간을 구하고, i=1,2,…,m* 개의 작업대에 Ti=c* ±α≤ c가 되도록 양방향의 공정들을 배정하는 양방향 군집방법을 적용하였다. 7개의 다양한 실험 데이터에 적용한 결과 제안된 양방향 군집 알고리즘은 타 방법들과 동일한 성능을 보였다.

양측 조립라인 균형문제의 병렬군집 알고리즘 (Parallel Clustering Algorithm for Balancing Problem of a Two-sided Assembly Line)

  • 이상운
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권1호
    • /
    • pp.95-101
    • /
    • 2022
  • NP-난제로 알려진 양측 조립라인 균형문제는 주로 메타휴리스틱 방법들을 적용하여 해를 구하고 있다. 본 논문은 총 작업완료시간 W와 순환시간 c가 주어진 양측 조립라인의 선행순서도에서 좌측, 우측과 좌·우측 무관으로 공정들을 분류하고, 좌측과 우측 각각에 대해 M* = ${\lceil}$W/c${\rceil}$개의 작업대에 Ti = c* ± α < c, c* = ${\lceil}$W/m*${\rceil}$이 되도록 공정들을 할당하는 병렬군집 알고리즘을 제안하였다. 제안된 알고리즘을 4개의 실험데이터, 17개의 c에 적용한 결과, 기존의 메타휴리스틱 방법들에 비해 최소 작업대 수 m*를 구하였으며, Tmax < c로 순환시간을 단축하였다. 또한, 제안된 알고리즘은 휴리스틱 방법임에도 불구하고, 조립라인 효율성의 극대화와 작업자간 작업시간 편차를 최소화시킬 수 있었다.

무선 센서 네트워크에서의 에너지 효율적인 불균형 클러스터링 알고리즘 (An Energy Efficient Unequal Clustering Algorithm for Wireless Sensor Networks)

  • 이성주;김성천
    • 정보처리학회논문지C
    • /
    • 제16C권6호
    • /
    • pp.783-790
    • /
    • 2009
  • 무선 센서 네트워크의 필요성이 증가함에 따라 관련된 연구 또한 활발히 진행되고 있다. 특히, 에너지 제약적인 무선 센서 네트워크의 생존 시간을 증가시키고자 하는 클러스터링 기법들이 많이 연구되고 있다. 대표적인 LEACH와는 달리, 최근의 클러스터링 기법들은 다중 홉으로 데이터를 전송하기 때문에 데이터 병목 현상 문제가 발생한다. 불균형 클러스터링(unequal clustering) 기법들은 라우팅 경로를 증가시켜 데이터 병목 현상 문제를 해결하였다. 불균형 클러스터링 기법들의 대부분은 BS(Base Station)와의 거리만을 고려하여 클러스터의 크기를 결정하였기 때문에, 클러스터 헤드의 에너지 소모가 커지는 문제점이 있다. 본 논문에서는 클러스터 헤드의 에너지 소모를 최소화하고, 데이터 병목 현상 문제도 해결할 수 있는 불균형 클러스터링 알고리즘을 제안하였다. 기본 아이디어는 적절한 클러스터 헤드를 선출한 이후, BS와의 거리와 노드의 에너지 상태, 이웃 노드의 수를 고려하여 클러스터의 크기를 결정하고, 동시에 클러스터 헤드의 전송기능을 분담하는 노드를 선정하는 것이다. 이처럼 클러스터 헤드의 에너지 소모를 최소화함으로써 클러스터링의 반복횟수를 감소시킬 수 있었으며, 더불어 전체 네트워크의 에너지 소모도 감소시킬 수 있었다.

궤적 클러스터링 기법을 이용한 클러스터 그룹 헤드 선정 (A Cluster Group Head Selection using Trajectory Clustering Technique)

  • 김진수;신승수
    • 한국산학기술학회논문지
    • /
    • 제12권12호
    • /
    • pp.5865-5872
    • /
    • 2011
  • 무선 센서 네트워크의 클러스터링 시스템에서 클러스터 헤드가 기지국으로부터 멀리 떨어져있어 다중홉으로 통신하는 경우, 센싱된 데이터는 중간 클러스터 헤드를 통해 기지국으로 전송한다. 기지국에 가까이 있는 헤드 노드가 먼 노드보다 더 많은 패킷을 중계할 필요가 있기 때문에 핫 스팟 문제가 생긴다. 이런 문제로 기지국 가까이에 있는 클러스터 헤드는 에너지가 쉽게 고갈되고 이로 인해 네트워크의 수명을 단축시킨다. 본 논문에서는 궤적 클러스터링 기법을 이용한 클러스터 그룹 헤드 선정 기법을 제안한다. 제안하는 방법에서 클러스터 헤드 및 그룹 헤드의 선정은 궤적 클러스터링 기법 및 적합도 함수를 이용함으로써 에너지 효율을 높인다. 또한 핫 스팟 문제는 여러 계층을 클러스터 그룹으로 지정하고 그에 대한 적합도 함수를 이용하여 에너지 소모의 균형을 맞춤으로써 해결한다. 실험을 통해 이전의 클러스터링 기법보다 네트워크 에너지 효율성이 향상됨을 입증한다.

정량적 자료에 대한 효과적인 군집화 과정 및 사용 후 핵연료의 분류에의 적용 (An Effective Clustering Procedure for Quantitative Data and Its Application for the Grouping of the Reusable Nuclear Fuel)

  • 강금석;윤복식;이용주
    • 산업공학
    • /
    • 제15권2호
    • /
    • pp.182-188
    • /
    • 2002
  • Clustering is widely used in various fields in order to investigate structural characteristics of the given data. One of the main tasks of clustering is to partition a set of objects into homogeneous groups for the purpose of data reduction. In this paper a simple but computationally efficient clustering procedure is devised and some statistical techniques to validate its clustered results are discussed. In the given procedure, the proper number of clusters and the clustered groups can be determined simultaneously. The whole procedure is applied to a practical clustering problem for the classification of reusable fuels in nuclear power plants.

Variable Selection and Outlier Detection for Automated K-means Clustering

  • Kim, Sung-Soo
    • Communications for Statistical Applications and Methods
    • /
    • 제22권1호
    • /
    • pp.55-67
    • /
    • 2015
  • An important problem in cluster analysis is the selection of variables that define cluster structure that also eliminate noisy variables that mask cluster structure; in addition, outlier detection is a fundamental task for cluster analysis. Here we provide an automated K-means clustering process combined with variable selection and outlier identification. The Automated K-means clustering procedure consists of three processes: (i) automatically calculating the cluster number and initial cluster center whenever a new variable is added, (ii) identifying outliers for each cluster depending on used variables, (iii) selecting variables defining cluster structure in a forward manner. To select variables, we applied VS-KM (variable-selection heuristic for K-means clustering) procedure (Brusco and Cradit, 2001). To identify outliers, we used a hybrid approach combining a clustering based approach and distance based approach. Simulation results indicate that the proposed automated K-means clustering procedure is effective to select variables and identify outliers. The implemented R program can be obtained at http://www.knou.ac.kr/~sskim/SVOKmeans.r.

Nonparametric analysis of income distributions among different regions based on energy distance with applications to China Health and Nutrition Survey data

  • Ma, Zhihua;Xue, Yishu;Hu, Guanyu
    • Communications for Statistical Applications and Methods
    • /
    • 제26권1호
    • /
    • pp.57-67
    • /
    • 2019
  • Income distribution is a major concern in economic theory. In regional economics, it is often of interest to compare income distributions in different regions. Traditional methods often compare the income inequality of different regions by assuming parametric forms of the income distributions, or using summary statistics like the Gini coefficient. In this paper, we propose a nonparametric procedure to test for heterogeneity in income distributions among different regions, and a K-means clustering procedure for clustering income distributions based on energy distance. In simulation studies, it is shown that the energy distance based method has competitive results with other common methods in hypothesis testing, and the energy distance based clustering method performs well in the clustering problem. The proposed approaches are applied in analyzing data from China Health and Nutrition Survey 2011. The results indicate that there are significant differences among income distributions of the 12 provinces in the dataset. After applying a 4-means clustering algorithm, we obtained the clustering results of the income distributions in the 12 provinces.

Comprehensive review on Clustering Techniques and its application on High Dimensional Data

  • Alam, Afroj;Muqeem, Mohd;Ahmad, Sultan
    • International Journal of Computer Science & Network Security
    • /
    • 제21권6호
    • /
    • pp.237-244
    • /
    • 2021
  • Clustering is a most powerful un-supervised machine learning techniques for division of instances into homogenous group, which is called cluster. This Clustering is mainly used for generating a good quality of cluster through which we can discover hidden patterns and knowledge from the large datasets. It has huge application in different field like in medicine field, healthcare, gene-expression, image processing, agriculture, fraud detection, profitability analysis etc. The goal of this paper is to explore both hierarchical as well as partitioning clustering and understanding their problem with various approaches for their solution. Among different clustering K-means is better than other clustering due to its linear time complexity. Further this paper also focused on data mining that dealing with high-dimensional datasets with their problems and their existing approaches for their relevancy