• Title/Summary/Keyword: 클러스터 분할

Search Result 255, Processing Time 0.029 seconds

Feature Weighting in Projected Clustering for High Dimensional Data (고차원 데이타에 대한 투영 클러스터링에서 특성 가중치 부여)

  • Park, Jong-Soo
    • Journal of KIISE:Databases
    • /
    • v.32 no.3
    • /
    • pp.228-242
    • /
    • 2005
  • The projected clustering seeks to find clusters in different subspaces within a high dimensional dataset. We propose an algorithm to discover near optimal projected clusters without user specified parameters such as the number of output clusters and the average cardinality of subspaces of projected clusters. The objective function of the algorithm computes projected energy, quality, and the number of outliers in each process of clustering. In order to minimize the projected energy and to maximize the quality in clustering, we start to find best subspace of each cluster on the density of input points by comparing standard deviations of the full dimension. The weighting factor for each dimension of the subspace is used to get id of probable error in measuring projected distances. Our extensive experiments show that our algorithm discovers projected clusters accurately and it is scalable to large volume of data sets.

Investigating Cyclic Pattern of Mobility through Analysis of Geopositioning Data (이동데이터 시간분석을 통한 이동양태 파악)

  • Hong, Suchan;Song, Ha Yoon
    • Annual Conference of KIPS
    • /
    • 2019.05a
    • /
    • pp.723-726
    • /
    • 2019
  • 사람은 한 장소를 방문할 때 순환 패턴이 있으며, 이 패턴에 여러 싸이클의 경향이 있다. 요즘은 스마트폰 및 기타 휴대용 장치로 개인 이동성 데이터를 수집하는 것이 가능하다. 이러한 장치는 다양한 위치 데이터를 수집하고 여러가지 방법으로 분석할 수 있게 해준다. 위치 수집기를 기반으로 지구 위치 데이터에서 추출된 사람의 이동성 모델을 수립하고, 위치 클러스터를 방문자의 순환 패턴을 조사할 수 있다. 수년 동안 수집된 개인의 이동성 모델을 토대로 클러스터 재방문 시간을 계산 후 분석하여 그래프로 시각화하였다. 시간 순서의 위치 클러스터와 방문 클러스터에 대한 위치 데이터는 1 분 단위로 측정된다. 전체 데이터 방문 횟수는 15 분마다 정규화하고, 자원 봉사자의 다양한 지리적 위치 데이터 셋에 대해 방문의 순환 패턴은 자기 상관, 자기 공분산 및 재방문 시간으로 살펴볼 수 있다.

Parallel Distributed Implementation of GHT on Ethernet Multicluster (이더넷 다중 클러스터에서 GHT의 병렬 분산 구현)

  • Kim, Yeong-Soo;Kim, Myung-Ho;Choi, Heung-Moon
    • Journal of the Institute of Electronics Engineers of Korea CI
    • /
    • v.46 no.3
    • /
    • pp.96-106
    • /
    • 2009
  • Extending the scale of the distributed processing in a single Ethernet cluster is physically restricted by maximum ports per switch. This paper presents an implementation of MPI-based multicluster consisting of multiple Ethernet switches for extending the scale of distributed processing, and a asymptotical analysis for communication overhead through execution-time analysis model. To determine an optimum task partitioning, we analyzed the processing time for various partitioning schemes, and AAP(accumulator array partitioning) scheme was finally chosen to minimize the overall communication overhead. The scope of data partitioned in AAP was modified to fit for incremented nodes, and suitable load balancing algorithm was implemented. We tried to alleviate the communication overhead through exploiting the pipelined broadcast and flat-tree based result gathering, and overlapping of the communication and the computation time. We used the linear pipeline broadcast to reduce the communication overhead in intercluster which is interconnected by a single link. Experimental results shows nearly linear speedup by the proposed parallel distributed GHT implemented on MPI-based Ethernet multicluster with four 100Mbps Ethernet switches and up to 128 nodes of Pentium PC.

Image Segmentation Based on the Fuzzy Clustering Algorithm using Average Intracluster Distance (평균내부거리를 적용한 퍼지 클러스터링 알고리즘에 의한 영상분할)

  • You, Hyu-Jai;Ahn, Kang-Sik;Cho, Seok-Je
    • The Transactions of the Korea Information Processing Society
    • /
    • v.7 no.9
    • /
    • pp.3029-3036
    • /
    • 2000
  • Image segmentation is one of the important processes in the image information extraction for computer vision systems. The fuzzy clustering methods have been extensively used in the image segmentation because it extracts feature information of the region. Most of fuzzy clustering methods have used the Fuzzy C-means(FCM) algorithm. This algorithm can be misclassified about the different size of cluster because the degree of membership depends on highly the distance between data and the centroids of the clusters. This paper proposes a fuzzy clustering algorithm using the Average Intracluster Distance that classifies data uniformly without regard to the size of data sets. The Average Intracluster Distance takes an average of the vector set belong to each cluster and increases in exact proportion to its size and density. The experimental results demonstrate that the proposed approach has the g

  • PDF

A Load Balancing Technique Based on the Dynamic Buffer Partitioning in a Clustered VOD Server (동적 버퍼 분할을 사용한 클러스터 VOD 서버 부하 분산 기법)

  • Kwon, Chun-Ja;Choi, Hwang-Kyu
    • Annual Conference of KIPS
    • /
    • 2002.04a
    • /
    • pp.217-220
    • /
    • 2002
  • 본 논문은 클러스터 기반의 VOD 서버에서 동적 버퍼 분할을 이용한 새로운 부하 분산 기법을 제안한다. 제안된 기법은 사용자 요청을 처리하는 서비스 노드간의 버퍼 성능과 디스크 접근 빈도를 고려하여 전체 부하를 고르게 분산하도록 한다. 또한 동적 버퍼 분할 기법은 통일한 연속매체에 접근하려는 여러 사용자에게 평균 대기시간을 감소시킬 수 있도록 버퍼를 동적으로 분할한다. 시뮬레이션을 통한 성능분석 결과에서 제안된 기법은 기존의 기법보다 부하량을 적절히 조절하면서 평균 대기시간을 감소시키고 각 노드의 처리량과 병행 사용자 수를 증가시킴을 보인다.

  • PDF

A Study on Cluster Configuration Method to Prevent Network Bottleneck in Spark Enviroment (Spark 환경에서 네트워크 병목 현상을 예방하기 위한 클러스터 구성 방법 연구)

  • Seok-Min Hong;Yeon-Jun You;Yong-Tae Shin
    • Annual Conference of KIPS
    • /
    • 2023.11a
    • /
    • pp.382-385
    • /
    • 2023
  • Spark는 대용량의 데이터를 처리를 위해 분산된 데이터를 네트워크로 모은 다음, 데이터를 분할하는 작업인 Shuffle을 진행한다. 이때 Spark 클러스터의 어느 한 노드의 네트워크 전송 속도가 느릴 경우 병목 현상으로 인한 전체 처리 성능이 저하된다. 이에 본 논문에서는 네트워크 병목 현상을 예방하기 위한 클러스터 구성 방법을 제안한다. 본 논문에서 제안하는 노드 선택 시스템은 iperf 도구를 이용해 노드들의 대역폭을 측정하고 이에 따라 노드 선택 알고리즘을 통해 클러스터를 구성한다. 기존 Spark 클러스터와 본 논문이 제안하는 시스템으로 구성한 클러스터를 비교했을 때, 250MB 로그 파일을 제외하고 750MB 로그 파일부터는 네트워크 전송 속도가 낮은 노드를 가지고 있는 클러스터의 성능이 병목 현상으로 인해 느려졌다. 본 논문의 제안에 따라 노드들의 네트워크 전송 속도를 고려하여 클러스터를 구성하면 네트워크 전송 속도로 발생하는 병목 현상을 예방할 수 있다.

A Study of Efficient CPLD Low Power Algorithm (효율적인 CPLD 저전력 알고리즘에 관한 연구)

  • Youn, Choong-Mo;Kim, Jae-Jin
    • Journal of Digital Contents Society
    • /
    • v.14 no.1
    • /
    • pp.1-5
    • /
    • 2013
  • In this paper a study of efficient CPLD low power algorithm is proposed. Proposed algorithm applicate graph partition method using DAG. Circuit representation DAG. Each nodes set up cost. The feasible cluster create according to components of CPLD. Created feasible cluster generate power consumption consider the number of OR-term, the number of input and the number of output. Implement a circuit as select FC having the minimum power consumption. Compared with experiment [9], and power consumption was decreased. The proposed algorithm is efficient. this paper, we proposed FPGA algorithm for consider the power consumption.

Cluster Head Re-Selection Algorithm for Equal Cluster Formation in Wireless Sensor Networks (센서 네트워크에서 균등한 클러스터 형성을 위한 클러스터헤드 재선출 기법)

  • Nam, Choon-Sung;Ku, Yong-Ki;Yoon, Jong-Wan;Shin, Dong-Ryeol
    • Proceedings of the KAIS Fall Conference
    • /
    • 2009.05a
    • /
    • pp.182-185
    • /
    • 2009
  • 무선 센서 네트워크의 목적은 특정 지역에 뿌려져 있는 센서 노드를 통해서 센서 정보를 수집하는 것이다. 지역 내 센서 노드는 환경 값을 측정, 수집, 처리하여 싱크 노드로 전송된다. 이러한 과정은 센서네트워크를 구성하는 센서 노드의 제한된 능력 때문에 센서 노드의 저전력 동작 기법을 고려해야 한다. 인접한 센서 노드는 유사한 데이터를 가지기 때문에, 로컬 클러스터를 형성하고 클러스터 헤드로 데이터 가공 처리하는 클러스터링 기법이 저전력 동작 기법에 효과적이다. 또한 제한된 전송 범위에 따라 다중 홉 방식의 클러스터 형성 기법요구 된다. 클러스터 형성 시 클러스터 내 멤버 노드의 개수는 균형적인 클러스터 형성에 영향을 주기 때문에 클러스터를 균등하게 분할하는 방법이 필요하다. 이에 본 논문은 클러스터 헤드의 재선정을 통해 불균형하게 형성된 클러스터를 균등한 클러스터로 형성할 수 있는 방법을 제안한다.

  • PDF

Mobile Agent based Dynamic Clustering scheme in MANET (MANET 환경에서의 이동 에이전트를 이용한 동적 클러스터링 기법)

  • Lim Won-tack;Kim Gu Su;Sun Seung Sang;Eom Young Ik
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11a
    • /
    • pp.313-315
    • /
    • 2005
  • 본 논문은 이동 애드혹 네트워크에서 이동 에이전트를 이용하여 동적으로 클러스터링을 구성하는 기법에 관한 것이다. 기존에 제안된 이동 애드혹 네트워크에서의 클러스터링 기법은 클러스터의 크기가 고정되어 있기 때문에 네트워크의 상태나 노드들의 이동성에 따라 클러스터 재구성의 오버헤드가 발생하였다. 본 제안 기법에서는 네트워크의 상태에 따라 클러스터 크기의 최대 임계치와 최소 임계치를 설정하고 이에 따라 이동 에이전트를 이용하여 클러스터를 병합 흑은 분할하면서 클러스터의 크기를 임계치 내에서 일정하게 유지시킴으로써, 클러스터 재구성의 오버헤드라 클러스터 내부의 경로 탐색의 오버헤드를 줄일 수 있다.

  • PDF

Moving-Object Query Processing in Disk Clustered Storage Manager (디스크 클러스터 기반 저장관리자에서 이동체 질의 처리)

  • 정명호;장용일;박순영;배해영
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • 2004.03a
    • /
    • pp.3-6
    • /
    • 2004
  • 위치 기반 서비스에서 이동체 정보의 저장 및 관리는 이동체 데이터베이스에 의해 수행되며, 이동체 정보의 표현을 위한 데이터 모델과 별도의 자료 구조를 포함하고 있다. 그러나, 기존 이동체 데이터베이스에 대한 대부분의 연구는 이동체 정보의 관리에 초점을 맞추고 있어 실제 응용에 있어서 대용량 정보의 처리가 불가능하며, 기존의 이동체 색인 구조는 특정분야에 특화되어 위치기반 서비스의 다양한 응용에 적용하기 힘든 문제점이 있다. 본 논문에서는 효율적인 이동체 질의 처리를 위해 네트워크 상의 여러 저장소존 연결하고 각각의 프로세스들을 다양한 질의 특성에 맞게 구성하는 디스크 클러스터 기반 저장 관리자에서의 질의 처리 구조를 제안한다. 이는 네트워크 기반의 디스크를 구축하고 공간 영역별 그룹 분할, 현재 위치 정보의 분할 저장 및 과거 위치 정보의 중복 저장을 통해 고성능 대용량 처리를 가능하게 하며, 다양한 색인을 지원하여 작업 분산 및 다양한 응용에 적용이 가능한 특징을 갖는다.

  • PDF