• 제목/요약/키워드: Two Phase Clustering

검색결과 48건 처리시간 0.019초

데이터 마이닝에서 그룹 세분화를 위한 2단계 계층적 글러스터링 알고리듬 (Two Phase Hierarchical Clustering Algorithm for Group Formation in Data Mining)

  • 황인수
    • 경영과학
    • /
    • 제19권1호
    • /
    • pp.189-196
    • /
    • 2002
  • Data clustering is often one of the first steps in data mining analysis. It Identifies groups of related objects that can be used as a starling point for exploring further relationships. This technique supports the development of population segmentation models, such as demographic-based customer segmentation. This paper Purpose to present the development of two phase hierarchical clustering algorithm for group formation. Applications of the algorithm for product-customer group formation in customer relationahip management are also discussed. As a result of computer simulations, suggested algorithm outperforms single link method and k-means clustering.

2상 다결정 미세구조의 상 분포 위상에 따른 역학적 거동 분석 (Analysis of Mechanical Response of Two-phase Polycrystalline Microstructures with Distinctive Topology of Phase Clustering)

  • 정상엽;한동석
    • 한국전산구조공학회논문집
    • /
    • 제24권1호
    • /
    • pp.9-16
    • /
    • 2011
  • 다상 재료는 상(phase) 분포 상태에 의해 그 특성이 다르기 때문에 상 분포에 따른 재료의 특성을 이해하는 것이 중요하다. 본 연구에서는 미세구조의 상 분포 특성을 묘사할 수 있는 확률 분포 함수를 사용하여 등방성/이방성 미세구조의 상분포 상태를 표현하는 방법을 살펴보았다. 다양한 상 분포를 가진 미세구조들에 유한요소해석 기법을 적용하여 미세구조의 역학적인 거동을 분석함으로서, 상 군집의 분포 상태에 따른 재료의 강도 및 특성의 변화를 살펴보았다. 이를 통해 상 군집의 위상에 의한 재료 강도의 영향 및 군집 크기가 커질수록 강도가 낮아지는 현상을 확인하였다.

웹 개인화를 위한 웹사용자 클러스터링 알고리즘에 관한 연구 (A Study on Web-User Clustering Algorithm for Web Personalization)

  • 이해각
    • 한국산학기술학회논문지
    • /
    • 제12권5호
    • /
    • pp.2375-2382
    • /
    • 2011
  • 웹사이트 운영이 비즈니스 모델로서의 성공을 거두기 위한 가장 중요한 요소 중 하나는 웹사용자의 성향을 분석하여 이를 효율적으로 이용하는 것이다. 사용자 분석을 통하여 사용자들에게 웹사이트의 가치를 효율적으로 전달하고 이를 통하여 운영자는 충분한 수익을 거둘 수 있다. 이러한 점에서 웹 사이트를 이용하는 사용자들의 취향과 행동방식을 얻어내려는 웹 방문 패턴 발견으로써의 사용자 클러스터링은 매우 중요하다. 또한 얻어진 사용자의 클러스터링 정보는 웹 개인화나 웹 사이트를 재구성하는데 필수적이다. 본 논문에서는 사용자 웹 방문 데이터를 정제하고 분류하여 그 특성에 따라 사용자들을 몇 개의 그룹으로 클러스터링 하기 위한 알고리즘이 제안된다. 알고리즘은 2단계로 구성되는데 첫 번째 단계는 초기해를 구하는 단계로서, 패스의 사이각을 이용하여 유사도를 측정하고 이 유사도에 따라 K개의 사용자 그룹으로 분류하여 초기해를 구한다. 두번째 단계는 첫 번째 단계에서 구한 초기해를 개선하여 최적해를 찾는 과정으로서 하이퍼플레인을 이용하여 클러스터링하는 개량된 K-평균알고리즘을 제안한다. 또한 실험을 통하여 기존의 방법과 비교하여 제안된 알고리즘의 효율성과 패스 특성이 보다 정확하게 계산된 클러스터링이 구현됨을 확인할 수 있다.

다계층 이원 네트워크를 활용한 사용자 관점의 이슈 클러스터링 (User-Perspective Issue Clustering Using Multi-Layered Two-Mode Network Analysis)

  • 김지은;김남규;조윤호
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.93-107
    • /
    • 2014
  • 대부분의 인터넷 쇼핑몰은 자사 고객의 관심 분야를 파악하고 이를 상품 추천에 효과적으로 활용하기 위해 많은 노력을 기울이고 있다. 하지만 고객이 회원 가입 시 직접 입력한 개인 정보는 신뢰하기가 어렵고, 고객의 구매 패턴을 통해 파악한 관심 분야 정보는 자사 사이트 내에 진입한 이후에만 보인 한정된 패턴이라는 측면에서 해당 고객의 다양한 관심분야를 제대로 나타낸다고 보기 어렵다. 이러한 한계를 극복하기 위해 본 연구에서는 고객의 평소 인터넷 사용 기록을 통해 최근 방문 사이트들의 주제를 분석함으로써, 고객의 실제 관심 분야를 파악할 수 있는 방안을 제시하였다. 또한 토픽 분석을 통해 각 사이트의 주제를 도출하고 도출된 주제를 다시 동시 방문자 관점에서 군집화 함으로써, 고객 관점에서 의미가 있는 상위 수준의 새로운 테마를 발굴하기 위한 방법론을 제안하였다. 연구의 특징은 유사주제 중심의 군집화라는 기존 연구와는 달리 사용자 관점의 관심주제 중심 군집화라 할 수 있다. 향후 사용자 중심의 카테고리 설계를 비롯한 새로운 관점의 고객군 정의 등 보다 높은 차원의 마케팅 전략 수립에 활용이 가능할 것으로 기대된다. 사용자 관점의 이슈 군집화 과정은 크롤링, 토픽 분석, 액세스 패턴 분석, 네트워크 병합, 네트워크 변환 및 군집화와 같은 여섯 가지 주요단계로 구성되어있다. 이를 위해 텍스트 마이닝과 소셜 네트워크 분석 기법을 활용한 비정형 텍스트를 기반으로한 빅데이터의 활용 방법을 모색하였다. 제안 방법론의 실무 적용 가능성을 평가하기 위해, 국내 최대 포털 뉴스 사이트의 방문자 2,177명의 1년간 방문 기록과 뉴스기사 대한 분석을 수행하고 그 결과를 요약하여 제시하였다.

특징벡터의 끌러스터링 기법을 통한 2단계 내용기반 이미지검색 시스템 (Two-phase Content-based Image Retrieval Using the Clustering of Feature Vector)

  • 조정원;최병욱
    • 전자공학회논문지CI
    • /
    • 제40권3호
    • /
    • pp.171-180
    • /
    • 2003
  • 내용기반 이미지검색이란 색상, 형태 및 질감 등의 저-수준 특징정보를 이용하여 이미지 데이터베이스를 구축하고, 이미지에 대한 검색요구가 발생했을 때 사용자가 찾고자 하는 이미지와 유사한 이미지를 제공하는 시스템으로 정의된다. 데이터베이스의 구축시간과 사용자가 질의를 입력한 후 결과를 얻을 때까지의 반응시간을 나누어 고려할 때, 사용자는 반응시간에 보다 관심을 갖는 것이 일반적이다. 내용기반 이미지검색 시스템에서 질의이미지와 데이터베이스 내의 이미지와의 유사도 비교시간이 전체 반응시간 중에서 가장 큰 비중을 차지한다. 본 논문에서는 이러한 유사도 비교시간을 최소화하기 위해 특징벡터의 클러스터링 기법을 적용한 2단계 탐색방법을 제안한다. 실험 결과를 통해 제안하는 2단계 탐색방법으로 대용량의 이미지 데이터베이스 내의 전체 이미지에 대한 원 특징정보와 비교하는 전체검색에 비해, 동일한 적합성을 보장하면서 평균적으로 2배 이상의 검색속도 향상을 확인하였으며, 이미지의 수가 더욱 커질수록 효과적임을 입증하였다.

Heterogeneity-aware Energy-efficient Clustering (HEC) Technique for WSNs

  • Sharma, Sukhwinder;Bansal, Rakesh Kumar;Bansal, Savina
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권4호
    • /
    • pp.1866-1888
    • /
    • 2017
  • Efficient energy consumption in WSN is one of the key design issues for improving network stability period. In this paper, we propose a new Heterogeneity-aware Energy-efficient Clustering (HEC) technique which considers two types of heterogeneity - network lifetime and of sensor nodes. Selection of cluster head nodes is done based on the three network lifetime phases: only advanced nodes are allowed to become cluster heads in the initial phase; in the second active phase all nodes are allowed to participate in cluster head selection process with equal probability, and in the last dying out phase, clustering is relaxed by allowing direct transmission. Simulation-based performance analysis of the proposed technique as compared to other relevant techniques shows that HEC achieves longer stable region, improved throughput, and better energy dissipation owing to judicious consumption of additional energy of advanced nodes. On an average, the improvement observed for stability period over LEACH, SEP, FAIR and HEC- with SEP protocols is around 65%, 30%, 15% and 17% respectively. Further, the scalability of proposed technique is tested by varying the field size and number of sensing nodes. The results obtained are found to be quite optimistic. The impact of energy heterogeneity has also been assessed and it is found to improve the stability period though only upto a certain extent.

밀도함수를 이용한 근사적 퍼지 클러스처링 (Approximate Fuzzy Clustering Based on Density Functions)

  • 권석호;손세호
    • 한국지능시스템학회논문지
    • /
    • 제10권4호
    • /
    • pp.285-292
    • /
    • 2000
  • 자료 분석 과정을 살펴 보면 1) 자료가 갖는 경향 평가, 2) 클러스터 분석, 3) 클러스터의 타당성 조사라는 과정을 거쳐 이루어진다. 이 분석법은 2) 및 3) 단계의 반복 수행으로 인하여 많은 계산 시간이 소요되므로 비효율적인 방법이라 할 수 있다. 본 논문에서는, 이와 같은 단점을 보완하기 위하여 자료가 갖는 개략적 특성을 파악하여 자료 속에 존재하는 클러스터의 근사적 개수 및 중심을 정한 후, 이 정보를 기존의 일반적인 퍼지 클러스터링 알고리즘에 입력하여 클러스터링을 수행하는 밀도함수를 이용한 계층적 구조의 근사적 클러스터링 알고리즘을 제안하고, 예제를 통하여 제안된 알고리즘의 타당성을 보인다.

  • PDF

배달과 수집을 수행하는 차량경로문제 휴리스틱에 관한 연구: 수도권 레미콘 운송사례 (Heuristic for the Pick-up and Delivery Vehicle Routing Problem: Case Study for the Remicon Truck Routing in the Metropolitan Area)

  • 지창훈;김미이;이영훈
    • 경영과학
    • /
    • 제24권2호
    • /
    • pp.43-56
    • /
    • 2007
  • VRP(Vehicle Routing Problem) is studied in this paper, where two different kinds of missions are to be completed. The objective is to minimize the total vehicle operating distance. A mixed integer programming formulation and a heuristic algorithm for a practical use are suggested. A heuristic algorithm consists of three phases such as clustering, constructing routes, and adjustment. In the first phase, customers are clustered so that the supply nodes are grouped with demand nodes to be served by the same vehicle. Vehicle routes are generated within the cluster in the second phase. Clusters and routes are adjusted in the third phase using the UF (unfitness) rule designed to determine the customers and the routes to be moved properly. It is shown that the suggested heuristic algorithm yields good performances within a relatively short computational time through computational experiment.

보정된 K-medoids 군집화 기법과 이분 탐색기법을 이용한 RBF 네트워크의 중심 개수와 위치와 통합 결정 (Determining the Number and the Locations of RBF Centers Using Enhanced K-Medoids Clustering and Bi-Section Search Method)

  • 이대원;이재욱
    • 대한산업공학회지
    • /
    • 제29권2호
    • /
    • pp.172-178
    • /
    • 2003
  • In the recent researches, a variety of ways for determining the locations of RBF centers have been proposed assuming that the number of RBF centers is known. But they have also many numerical drawbacks. We propose a new method to overcome such drawbacks. The strength of our method is to determine the locations and the number of RBF centers at the same time without any assumption about the number of RBF centers. The proposed method consists of two phases. The first phase is to determine the number and the locations of RBF centers using bi-section search method and enhanced k-medoids clustering which overcomes drawbacks of clustering algorithm. In the second phase, network weights are computed and the design of RBF network is completed. This new method is applied to several benchmark data sets. Benchmark results show that the proposed method is competitive with the previously reported approaches for center selection.

A Honey-Hive based Efficient Data Aggregation in Wireless Sensor Networks

  • Ramachandran, Nandhakumar;Perumal, Varalakshmi
    • Journal of Electrical Engineering and Technology
    • /
    • 제13권2호
    • /
    • pp.998-1007
    • /
    • 2018
  • The advent of Wireless Sensor Networks (WSN) has led to their use in numerous applications. Sensors are autonomous in nature and are constrained by limited resources. Designing an autonomous topology with criteria for economic and energy conservation is considered a major goal in WSN. The proposed honey-hive clustering consumes minimum energy and resources with minimal transmission delay compared to the existing approaches. The honey-hive approach consists of two phases. The first phase is an Intra-Cluster Min-Max Discrepancy (ICMMD) analysis, which is based on the local honey-hive data gathering technique and the second phase is Inter-Cluster Frequency Matching (ICFM), which is based on the global optimal data aggregation. The proposed data aggregation mechanism increases the optimal connectivity range of the sensor node to a considerable degree for inter-cluster and intra-cluster coverage with an improved optimal energy conservation.