• 제목/요약/키워드: clustering problem

검색결과 708건 처리시간 0.024초

분류나무를 활용한 군집분석의 입력특성 선택: 신용카드 고객세분화 사례 (Classification Tree-Based Feature-Selective Clustering Analysis: Case of Credit Card Customer Segmentation)

  • 윤한성
    • 디지털산업정보학회논문지
    • /
    • 제19권4호
    • /
    • pp.1-11
    • /
    • 2023
  • Clustering analysis is used in various fields including customer segmentation and clustering methods such as k-means are actively applied in the credit card customer segmentation. In this paper, we summarized the input features selection method of k-means clustering for the case of the credit card customer segmentation problem, and evaluated its feasibility through the analysis results. By using the label values of k-means clustering results as target features of a decision tree classification, we composed a method for prioritizing input features using the information gain of the branch. It is not easy to determine effectiveness with the clustering effectiveness index, but in the case of the CH index, cluster effectiveness is improved evidently in the method presented in this paper compared to the case of randomly determining priorities. The suggested method can be used for effectiveness of actively used clustering analysis including k-means method.

무선 센서 네트워크에서의 Max k-Cut기반의 클러스터링 알고리즘 (Max k-Cut based Clustering Algorithm for Wireless Sensor Networks)

  • 김재환;장형수
    • 한국정보과학회논문지:정보통신
    • /
    • 제36권2호
    • /
    • pp.98-107
    • /
    • 2009
  • 본 논문에서는 Wireless Sensor Networks에서 Max k-Cut Problem을 기반으로 위치 정보를 사용하지 않고 클러스터 헤드를 적절히 분산하여 선출함으로써 에너지 효율적인 클러스터링을 하는 중앙처리 방식의 새로운 알고리즘 "MCCA : Max k-Cut based Clustering Algorithm for Wireless Sensor Networks"을 제안한다. MCCA는 이웃 노드와의 상대적이고 근사적인 거리 정보만을 사용하여 효율적으로 클러스터링을 하고 에너지가 적은 노드는 클러스터 헤드 선출에서 일정 기간 제외되는 방법을 사용함으로써 LEACH, EECS보다 에너지 효율이 증대됨과 GPS를 사용한 BCDCP와 에너지 효율이 비슷함을 실험을 통하여 보인다.

퍼지 클러스터링 기반 퍼지뉴럴네트워크 설계 및 적용 (Design of Fuzzy Neural Networks Based on Fuzzy Clustering and Its Application)

  • 박건준;이동윤
    • 한국산학기술학회논문지
    • /
    • 제14권1호
    • /
    • pp.378-384
    • /
    • 2013
  • 본 논문에서는 FCM 클러스터링 알고리즘을 기반으로 하는 퍼지뉴럴네트워크를 제안한다. 일반적으로, 퍼지규칙을 생성할 때 차원이 증가하면 퍼지 규칙의 수가 기하급수적으로 증가하는 문제를 가지고 있다. 이를 해결하기 위해, 제안된 네트워크의 퍼지 규칙은 FCM 클러스터링 알고리즘을 이용하여 입력 공간을 분산 형태로 분할함으로써 생성한다. 퍼지 규칙의 전반부 파라미터는 FCM 클러스터링 알고리즘에 의한 소속행렬로 결정된다. 퍼지 규칙의 후반부는 다항식 함수의 형태로 표현되며, 퍼지뉴럴네트워크의 학습은 뉴런의 연결을 조절함으로써 실현되고, 오류 역전파 알고리즘에 의해 행해진다. 마지막으로, 제안된 네트워크는 비선형 공정으로의 적용을 통해 성능을 평가한다.

CACHE:상황인식 기반의 계층적 클러스터링 알고리즘에 관한 연구 (CACHE:Context-aware Clustering Hierarchy and Energy efficient for MANET)

  • 문창민;이강환
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2009년도 추계학술대회
    • /
    • pp.571-573
    • /
    • 2009
  • 이동 애드혹 네트워크(MANET)는 무선네트워크에서 노드들이 제한적인 에너지를 가지고 있기 때문에 보다 효율적인 노드의 관리가 요구 된다. 이러한 MANET에서는 정적인 네트워크에 비해 토폴로지가 자주 변하므로 이동성을 고려한 에너지 효율적인 라우팅 프로토콜이 요구된다. 기존에 제안 된 CACH(Context-aware Adaptive Clustering Hierarchy)[1]는 하이브리드 라우팅 방식을 분산 클러스터링 기반으로 구성하여 네트워크 수명을 연장하고 지연시간을 감소하였다. 하지만 노드의 밀도증가를 효율적으로 알고리즘에 적용하지 못한 문제점이 있다. 이를 보완하기 위해 본 논문에서는, CACHE(Context-aware Adaptive Clustering Hierarchy and Energy efficient)를 제안한다. CACHE는 노드 밀도 변경에 대해 적응적으로 알고리즘을 적용할 수 있도록 클러스터 구성을 수정하여, CACH가 갖는 노드 밀도 문제를 개선하였다.

  • PDF

A Determination of an Optimal Clustering Method Based on Data Characteristics

  • Kim, Jeong-Hun;Yoo, Kwan-Hee;Nasridinov, Aziz
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제7권8호
    • /
    • pp.305-314
    • /
    • 2017
  • Clustering is a method that collects data objects into groups based on their similary. Performance of the state-of-the-art clustering methods is different according to the data characteristics. There have been numerous studies that performed experiments to compare the accuracy of the state-of-the-art clustering methods by applying various kinds of datasets. A common problem of these studies is that they only consider clustering algorithms that yield the most accurate results for a particular dataset. They do not consider what factors affect the execution time of each clustering method and how they are affected. Nevertheless, execution time is an important factor in clustering performance if there is no significant difference in accuracy. In order to solve the problems of the existing research, through a series of experiments using various types of datasets, we compare the accuracy of four representative clustering methods. In addition, we perform practical clustering performance comparisons by deriving time complexity and identifying factors that influences to its performance.

다중계층 통행배분 알고리즘 개발 (다차종을 중심으로) (Development of multiclass traffic assignment algorithm (Focused on multi-vehicle))

  • 강진구;류시균;이영인
    • 대한교통학회지
    • /
    • 제20권6호
    • /
    • pp.99-113
    • /
    • 2002
  • 교통량배분문제 가운데 다중계층 교통량배분문제는 유일해가 보장되지 않는 대표적 사례로 최근 들어 모형의 정식화 및 해법에 관해서 활발하게 전개되고 있다. 정식화에 있어서는 변동부등식이나 고정점 문제를 활용한 정식화가 보편적으로 활용되고 있으나 해법(알고리즘)에 관한 연구는 미흡한 실정이다. 본 연구에서는 변동부등식으로 정의된 다중계층 이용자균형 교통량배분문제의 해법으로서 GA알고리즘과 대각화알고리즘, 군집화알고리즘을 조합한 Hybrid Algorithm을 개발, 제안한다. GA알고리즘과 군집화알고리즘은 해의 탐색을 전역적이면서도 효과적으로 수행하기 위해서 도입된 대각화 알고리즘의 보완적 알고리즘이라 할 수 있다. 본 연구에서는 또한, 다중계층 이용자균형 교통량배분문제의 해법으로서의 제안된 AMSA(The Algorithm of Multiclass Static User Equilibrium Assignment)의 특징을 예제풀이를 통해서 설명하고 있다.

단일모델 단측 조립라인 균형문제의 주경로 군집화 알고리즘 (A Single-model Single-sided Assembly Line Balancing Problem Using Main-path Clustering Algorithm)

  • 이상운
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권5호
    • /
    • pp.89-98
    • /
    • 2014
  • 본 논문은 NP-난제 문제로 알려진 단일모델 단방향 조립라인 균형문제에 대해 휴리스틱 알고리즘을 제안하였다. 조립라인 균형문제는 주로 메타휴리스틱 방법들을 적용하고 있는 추세이다. 제안된 알고리즘은 최종제품이 생산될 때까지 가장 많은 공정으로 조립되는 경로를 주경로로 설정하고, 주경로를 따라가면서 각 작업자에게 순환시간 조건을 만족하는 작업량을 배정하는 군집화 알고리즘을 제안하였다. 제안된 알고리즘은 최소의 작업자수를 결정하고, 순환시간도 단축시키는 결과를 얻었다. 9개의 다양한 실험 데이터에 제안된 주경로 군집화 휴리스틱 알고리즘을 적용한 결과 메타휴리스틱 방법들에 비해 보다 좋은 성능을 갖고 있음을 보였다.

Improved Two Points Algorithm For D-optimal Design

  • Ahn, Yunkee;Lee, Man-Jong
    • Communications for Statistical Applications and Methods
    • /
    • 제6권1호
    • /
    • pp.53-68
    • /
    • 1999
  • To improve the slow convergence property of the steepest ascent type algorithm for continuous D-optimal design problems. we develop a new algorithm. We apply the nonlinear system of equations as the necessary condition of optimality and develop the two-point algorithm that solves the problem of clustering. Because of the nature of the steepest coordinate ascent algorithm avoiding the problem of clustering itself helps the improvement of convergence speed. The numerical examples show the performances of the new method is better than those of various steepest ascent algorithms.

  • PDF

Detection of Differentially Expressed Genes by Clustering Genes Using Class-Wise Averaged Data in Microarray Data

  • Kim, Seung-Gu
    • Communications for Statistical Applications and Methods
    • /
    • 제14권3호
    • /
    • pp.687-698
    • /
    • 2007
  • A normal mixture model with which dependence between classes is incorporated is proposed in order to detect differentially expressed genes. Gene clustering approaches suffer from the high dimensional column of microarray expression data matrix which leads to the over-fit problem. Various methods are proposed to solve the problem. In this paper, use of simple averaging data within each class is proposed to overcome the various problems due to high dimensionality when the normal mixture model is fitted. Some experiments through simulated data set and real data set show its availability in actuality.

Data Clustering Method Using a Modified Gaussian Kernel Metric and Kernel PCA

  • Lee, Hansung;Yoo, Jang-Hee;Park, Daihee
    • ETRI Journal
    • /
    • 제36권3호
    • /
    • pp.333-342
    • /
    • 2014
  • Most hyper-ellipsoidal clustering (HEC) approaches use the Mahalanobis distance as a distance metric. It has been proven that HEC, under this condition, cannot be realized since the cost function of partitional clustering is a constant. We demonstrate that HEC with a modified Gaussian kernel metric can be interpreted as a problem of finding condensed ellipsoidal clusters (with respect to the volumes and densities of the clusters) and propose a practical HEC algorithm that is able to efficiently handle clusters that are ellipsoidal in shape and that are of different size and density. We then try to refine the HEC algorithm by utilizing ellipsoids defined on the kernel feature space to deal with more complex-shaped clusters. The proposed methods lead to a significant improvement in the clustering results over K-means algorithm, fuzzy C-means algorithm, GMM-EM algorithm, and HEC algorithm based on minimum-volume ellipsoids using Mahalanobis distance.