• 제목/요약/키워드: Clustering Problem

검색결과 708건 처리시간 0.022초

K-Means Clustering의 차량경로문제 적용연구 (An Application of k-Means Clustering to Vehicle Routing Problems)

  • 하제민;문기주
    • 산업경영시스템학회지
    • /
    • 제38권3호
    • /
    • pp.1-7
    • /
    • 2015
  • This research is to develop a possible process to apply k-means clustering to an efficient vehicle routing process under time varying vehicle moving speeds. Time varying vehicle moving speeds are easy to find in metropolitan area. There is a big difference between the moving time requirements of two specific delivery points. Less delivery times are necessary if a delivery vehicle moves after or before rush hours. Various vehicle moving speeds make the efficient vehicle route search process extremely difficult to find even for near optimum routes due to the changes of required time between delivery points. Delivery area division is designed to simplify this complicated VRPs due to time various vehicle speeds. Certain divided area can be grouped into few adjacent divisions to assume that no vehicle speed change in each division. The vehicle speeds moving between two delivery points within this adjacent division can be assumed to be same. This indicates that it is possible to search optimum routes based upon the distance between two points as regular traveling salesman problems. This makes the complicated search process simple to attack since few local optimum routes can be found and then connects them to make a complete route. A possible method to divide area using k-means clustering is suggested and detailed examples are given with explanations in this paper. It is clear that the results obtained using the suggested process are more reasonable than other methods. The suggested area division process can be used to generate better area division promising improved vehicle route generations.

다중 클라이언트 환경에서 동형 암호를 이용한 프라이버시 보장형 K-평균 클러스터링 (Privacy-Preserving K-means Clustering using Homomorphic Encryption in a Multiple Clients Environment)

  • 권희용;임종혁;이문규
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제15권4호
    • /
    • pp.7-17
    • /
    • 2019
  • 기계 학습은 다양한 현상의 예측 및 분석 등을 가장 정확하게 수행하는 기술 중 하나이다. K-평균 클러스터링은 주어진 데이터들을 비슷한 데이터들의 군집으로 분류하는 기계 학습 기법의 한 종류로 다양한 분야에서 사용된다. K-평균 클러스터링의 성능을 높이기 위해서는 가능하면 많은 데이터에 기반한 분석을 수행하는 것이 바람직하므로, K-평균 클러스터링은 데이터를 제공하는 다수의 클라이언트들과 제공받은 데이터들을 사용하여 클러스터의 중심값을 계산하는 서버가 있는 모델에서 수행될 수 있다. 그러나 이 모델은 클라이언트들의 데이터가 민감한 정보를 포함하고 있는 경우, 서버가 클라이언트들의 프라이버시를 침해할 수 있다는 문제점이 있다. 본 논문에서는 다수의 클라이언트가 있는 모델에서 이러한 문제를 해결하기 위해 동형 암호를 사용하여 클라이언트의 프라이버시를 보호하며 기계 학습을 수행할 수 있는 프라이버시 보장형 K-평균 클러스터링 방법을 제안한다.

Multi-Feature Clustering을 이용한 강인한 내용 기반 음악 장르 분류 시스템에 관한 연구 (A Study on the Robust Content-Based Musical Genre Classification System Using Multi-Feature Clustering)

  • 윤원중;이강규;박규식
    • 대한전자공학회논문지SP
    • /
    • 제42권3호
    • /
    • pp.115-120
    • /
    • 2005
  • 본 논문에서는 multi-feature clustering(MFC) 방법을 이용한 강인한 내용 기반 음악 장르 분류 알고리즘을 제안한다. 기존 연구와 비교하여 본 논문에서는 입력 질의 패턴(또는 구간)과 입력 질의 길이의 변화에 따라 나타나는 불안정한 시스템 성능을 개선하는데 노력하였고, k-means clustering 기법에 기반한 multi-feature clustering(MFC)이라는 새로운 알고리즘을 제안하였다. 제안된 시스템의 성능을 검증하기 위해 질의 음악 파일의 서로 다른 여러 구간에서 질의 길이를 다변화하여 음악 특징 계수를 추출하였고, MFC 방법을 사용한 시스템과 MFC 방법을 사용하지 않은 시스템에 대한 장르 분류 성공률을 비교하여 제안 알고리즘의 성능을 비교${\cdot}$분석하였다. 모의실험 결과 MFC 방법을 사용한 시스템의 장르 분류 성공률이 높게 나타났고, 시스템의 안정성 역시 높게 나타났다.

데이터 클러스터링을 위한 혼합 시뮬레이티드 어닐링 (Hybrid Simulated Annealing for Data Clustering)

  • 김성수;백준영;강범수
    • 산업경영시스템학회지
    • /
    • 제40권2호
    • /
    • pp.92-98
    • /
    • 2017
  • Data clustering determines a group of patterns using similarity measure in a dataset and is one of the most important and difficult technique in data mining. Clustering can be formally considered as a particular kind of NP-hard grouping problem. K-means algorithm which is popular and efficient, is sensitive for initialization and has the possibility to be stuck in local optimum because of hill climbing clustering method. This method is also not computationally feasible in practice, especially for large datasets and large number of clusters. Therefore, we need a robust and efficient clustering algorithm to find the global optimum (not local optimum) especially when much data is collected from many IoT (Internet of Things) devices in these days. The objective of this paper is to propose new Hybrid Simulated Annealing (HSA) which is combined simulated annealing with K-means for non-hierarchical clustering of big data. Simulated annealing (SA) is useful for diversified search in large search space and K-means is useful for converged search in predetermined search space. Our proposed method can balance the intensification and diversification to find the global optimal solution in big data clustering. The performance of HSA is validated using Iris, Wine, Glass, and Vowel UCI machine learning repository datasets comparing to previous studies by experiment and analysis. Our proposed KSAK (K-means+SA+K-means) and SAK (SA+K-means) are better than KSA(K-means+SA), SA, and K-means in our simulations. Our method has significantly improved accuracy and efficiency to find the global optimal data clustering solution for complex, real time, and costly data mining process.

레귤러라이제이션 기반 개선된 밀도 무관 퍼지 클러스터링 (Improved Density-Independent Fuzzy Clustering Using Regularization)

  • 한수환;허경용
    • 한국정보통신학회논문지
    • /
    • 제24권1호
    • /
    • pp.1-7
    • /
    • 2020
  • FCM(Fuzzy C-Means)으로 대표되는 퍼지 클러스터링은 간단하면서도 효율적인 클러스터링 방법이지만, FCM에서 사용하는 목적 함수에서는 밀도가 높은 클러스터가 클러스터링 결과에 많은 영향을 미치도록 함으로써 클러스터 사이의 밀도 차에 의해 클러스터링 결과에 왜곡이 발생할 수 있다. 이러한 밀도 문제를 완화하는 방법의 하나로 FCM의 목적 함수에 밀도 차이를 보정할 수 있는 항을 추가한 EDI-FCM(Extended Density-Independent FCM)이 있다. 이 논문에서는 레귤러라이제이션을 이용하여 EDI-FCM을 보완한 Regularized EDI-FCM을 제안한다. 레귤러라이제이션은 해공간을 평탄화하고 잡음 민감성을 줄이기 위해 흔히 사용되는 방법으로, 클러스터링에서는 특정 클러스터가 클러스터링 결과에 미치는 영향을 줄이는 역할을 한다. 제안하는 방법은 FCM이나 EDI-FCM과 비교했을 때 실제 클러스터 중심에 빠르고 정확하게 수렴한다는 것을 실험 결과를 통해 확인할 수 있다.

센서 네트워크에서 클러스터 헤드의 load-balancing을 통한 에너지 효율적인 클러스터링 (An Energy-Efficient Clustering Using Load-Balancing of Cluster Head in Wireless Sensor Network)

  • 남도현;민홍기
    • 정보처리학회논문지C
    • /
    • 제14C권3호
    • /
    • pp.277-284
    • /
    • 2007
  • 무선 센서 네트워크(Wireless Sensor Network)에서 라우팅 방식은 에너지 효율 측면에서 데이터의 전송량을 줄일 수 있는 클러스터링 방식이 사용된다. 하지만 클러스터링 방식은 클러스터 헤드 노드의 에너지 소모가 많은 문제점이 있다. 클러스터 헤드 노드의 에너지 소모가 많은 문제를 보완하기 위한 방식으로 클러스터 헤드 노드의 재 선출을 통해 에너지 소모를 분산하는 동적 클러스터링(dynamic clustering) 방식이 사용되고 있다. 그러나 동적 클러스터링 방식의 경우 클러스터 헤드 노드를 재선출할 때마다 클러스터 구조가 바뀌게 되며, 이로 인한 에너지 소모가 발생한다. 즉 지금까지 연구된 동적 클러스터링 방식은 많은 에너지를 소모하는 클러스터 헤드 노드 선출 및 클러스터 형성의 셋업(set-up) 과정이 반복적으로 일어나는 문제점이 있다. 따라서 본 논문은 반복적인 셋업의 에너지 소모 문제를 해결하기 위해 클러스터는 고정하고, 클러스터 내의 클러스터 헤드 노드를 Round-Robin으로 선출하는 RRCH(Round-Robin Cluster Header)방식을 제안하였다. RRCH방식은 한번 구성된 클러스터 내에서 각 센서 노드(sensor node)의 지속적이고 균형적인 에너지 소모를 이루어, LEACH방식처럼 셋업 과정이 반복적으로 일어나지 않게 하는 에너지 효율적인 방식이다. 이 제안의 타당성을 모의실험을 통해 확인하였다.

휴리스틱 진화에 기반한 효율적 클러스터링 알고리즘 (An Efficient Clustering Algorithm based on Heuristic Evolution)

  • 류정우;강명구;김명원
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권1_2호
    • /
    • pp.80-90
    • /
    • 2002
  • 클러스터링이란 한 군집에 포함된 데이터들 간의 유사한 성질을 갖도록 데이터들을 묶는 것으로 패턴인식, 영상처리 등의 공학 분야에 널리 적용되고 있을 뿐만 아니라, 최근 많은 관심의 대상이 되고 있는 데이터 마이닝의 주요 기술로서 활발히 응용되고 있다. 클러스터링에 있어서 K-means나 FCM(Fuzzy C-means)와 같은 기존의 알고리즘들은 지역적 최적해에 수렴하는 것과 사전에 클러스터 개수를 미리 결정해야 하는 문제점을 개선하였으며, 클러스터링의 특성을 분산도와 분리도로 정의하였다. 분산도는 임의의 클러스터의 중심으로부터 포함된 데이터들이 어느 정도 흩어져 있는지를 나타내는 척도인 반면, 분리도는 임의의 데이터와 모든 클러스터 중심간의 거리의 비율로서 얻어지는 소속정도를 고려하여 클러스터 중심간의 거리를 나타내는 척도이다. 이 두 척도를 이용하여 자동으로 적절한 클러스터 개수를 결정하게 하였다. 또한 진화알고리즘의 문제점인 탐색공간의 확대에 따른 수행시간의 증가는 휴리스틱 연산을 적용함으로써 크게 개선하였다. 제안한 알고리즘의 성능 및 타당성을 보이기 위해 이차원과 다차원 실험데이타를 사용하여 실험한 결과 제안한 알고리즘의 성능이 우수함을 나타내었다.

강화학습의 Q-learning을 위한 함수근사 방법 (A Function Approximation Method for Q-learning of Reinforcement Learning)

  • 이영아;정태충
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권11호
    • /
    • pp.1431-1438
    • /
    • 2004
  • 강화학습(reinforcement learning)은 온라인으로 환경(environment)과 상호작용 하는 과정을 통하여 목표를 이루기 위한 전략을 학습한다. 강화학습의 기본적인 알고리즘인 Q-learning의 학습 속도를 가속하기 위해서, 거대한 상태공간 문제(curse of dimensionality)를 해결할 수 있고 강화학습의 특성에 적합한 함수 근사 방법이 필요하다. 본 논문에서는 이러한 문제점들을 개선하기 위해서, 온라인 퍼지 클러스터링(online fuzzy clustering)을 기반으로 한 Fuzzy Q-Map을 제안한다. Fuzzy Q-Map은 온라인 학습이 가능하고 환경의 불확실성을 표현할 수 있는 강화학습에 적합한 함수근사방법이다. Fuzzy Q-Map을 마운틴 카 문제에 적용하여 보았고, 학습 초기에 학습 속도가 가속됨을 보였다.

분산 분할 방식의 퍼지 규칙 생성 및 추론 시스템 (Fuzzy Rules Generation and Inference System of Scatter Partition Method)

  • 박건준;장태수;김성훈;김용갑
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2012년도 추계학술대회
    • /
    • pp.35-36
    • /
    • 2012
  • 퍼지 모델링을 하기 위해서는 퍼지 규칙의 생성이 필연적이며, 일반적으로 차원이 증가할수록 규칙의 수가 지수적으로 증가하는 문제를 가지고 있다. 이를 해결하기 위해, 시스템 데이터를 이용하여 입력 공간을 분산 형태로 분할하는 FCM 클러스터링 알고리즘을 기반으로 하여 퍼지 규칙을 생성하고 추론하는 시스템을 소개한다. 퍼지 규칙의 전반부 파라미터는 FCM 클러스터링 알고리즘에 의한 소속행렬로 결정되며 퍼지 규칙의 후반부는 다항식 함수의 형태로 표현된다. 제안된 모델은 수치 데이터를 이용하여 평가한다.

  • PDF

개선된 FCM 클러스터링 영상 분할 (Improved FCM Clustering Image Segmentation)

  • 이광규
    • 전기전자학회논문지
    • /
    • 제24권1호
    • /
    • pp.127-131
    • /
    • 2020
  • 클러스터링을 이용한 대표적인 영상 분할 방법으로 Fuzzy C-Means(FCM) 알고리즘을 많이 사용하는데, FCM은 영상의 공간을 픽셀 값이 비슷한 클러스터 영역으로 분할하므로 분할 시간이 많이 소요된다. 특히 웹이 보편화된 현재 사용자들의 다양한 패턴을 분석하기 위한 처리 속도 문제는 더욱 중요하다. 이러한 속도 문제를 해결하기 위해 본 논문에서는 Otsu의 영상 히스토그램의 임계값과 FCM으로 영상을 분할하는 개선된 FCM(Improved FCM : IFCM) 알고리즘을 제안한다. 제안방법은 Otsu의 클래스 간의 분산을 최대화 시키는 임계값을 결정하여 FCM에 적용하고 영상을 분할하였다. IFCM은 기존의 FCM에 비해 영상 분할 시간을 단축시켜 성능이 향상되었음을 실험을 통해 보인다.