• Title/Summary/Keyword: 공간클러스터

Search Result 375, Processing Time 0.029 seconds

Design of a Large-Scale Qualitative Spatial Reasoner Based on Hadoop Clusters (하둡 클러스터 기반의 대용량 정성 공간 추론기의 설계)

  • Kim, Jonghwan;Kim, Jonghoon;Kim, Incheol
    • Annual Conference of KIPS
    • /
    • 2015.10a
    • /
    • pp.1316-1319
    • /
    • 2015
  • 본 논문에서는 대규모 분산 병렬 컴퓨팅 환경인 하둡 클러스터 시스템을 이용하여, 공간 객체들 간의 위상 관계를 효율적으로 추론하는 대용량 정성 공간 추론기를 제안한다. 본 논문에서 제안하는 공간 추론기는 추론 작업의 순차성과 반복성을 고려하여, 작업들 간의 디스크 입출력을 최소화할 수 있는 인-메모리 기반의 아파치 스파크 프레임워크를 이용하여 개발하였다. 따라서 본 추론기에서는 추론의 대상이 되는 대용량 공간 지식들을 아파치 스파크의 분산 데이터 집합 형태인 PairRDD와 RDD로 변환하고, 이들에 대한 데이터 오퍼레이션들로 추론 작업들을 구현하였다. 또한, 본 추론기에서는 추론 시간의 많은 부분을 차지하는 이행 관계 추론에 필요한 조합표를 효과적으로 축소함으로써, 공간 추론 작업의 성능을 크게 향상시켰다. 대용량의 공간 지식 베이스를 이용한 성능 분석 실험을 통해, 본 논문에서 제안한 정성 공간 추론기의 높은 성능을 확인할 수 있었다.

A Method for Determining the Number of Clusters in Data Clustering (데이터 클러스터링에서 클러스터 수 결정방안)

  • Lee, Byung-Soo;Hong, Jiwon;Kim, Sang-Wook
    • Annual Conference of KIPS
    • /
    • 2011.11a
    • /
    • pp.1268-1269
    • /
    • 2011
  • 데이터마이닝 분야에서는 주어진 공간상에 분포되어있는 데이터들을 분석위해 다양한 클러스터링 알고리즘이 존재한다. 그러나 대부분의 클러스터링 알고리즘에서는 클러스터 전체 개수를 미리 요구한다. 이 때문에 클러스터링 알고리즘에서 클러스터 전체개수를 미리 알아내는 것은 매우 중요하다. 본 논문에서는 데이터에 분포하는 클러스터들의 개수를 데이터의 그래프 모델을 이용한 분석으로 찾아내는 방법을 제안한다.

A GIS-Based Method for Delineating Spatial Clusters: A Modified AMOEBA Technique (공간 클러스터의 범역 설정을 위한 GIS-기반 방법론 연구 -수정 AMOEBA 기법-)

  • Lee, Sang-Il;Cho, Dae-Heon;Sohn, Hak-Gi;Chae, Mi-Ok
    • Journal of the Korean Geographical Society
    • /
    • v.45 no.4
    • /
    • pp.502-520
    • /
    • 2010
  • The main objective of the paper is to develop a GIS-based method for delineating spatial clusters. Major tasks are: (i) to devise a sustainable algorithm with reference to various methods developed in the fields of geographic boundary analysis and cluster detection; (ii) to develop a GIS-based program to implement the algorithm. The main results are as follows. First, it is recognized that the AMOEBA technique utilizing LISA is the best candidate. Second, a modified version of the AMOEBA technique is proposed and implemented in a GIS environment. Third, the validity and usefulness of the modified AMOEBA algorithm is assured by its applications to test and real data sets.

Dynamic Subspace Clustering for Online Data Streams (온라인 데이터 스트림에서의 동적 부분 공간 클러스터링 기법)

  • Park, Nam Hun
    • Journal of Digital Convergence
    • /
    • v.20 no.2
    • /
    • pp.217-223
    • /
    • 2022
  • Subspace clustering for online data streams requires a large amount of memory resources as all subsets of data dimensions must be examined. In order to track the continuous change of clusters for a data stream in a finite memory space, in this paper, we propose a grid-based subspace clustering algorithm that effectively uses memory resources. Given an n-dimensional data stream, the distribution information of data items in data space is monitored by a grid-cell list. When the frequency of data items in the grid-cell list of the first level is high and it becomes a unit grid-cell, the grid-cell list of the next level is created as a child node in order to find clusters of all possible subspaces from the grid-cell. In this way, a maximum n-level grid-cell subspace tree is constructed, and a k-dimensional subspace cluster can be found at the kth level of the subspace grid-cell tree. Through experiments, it was confirmed that the proposed method uses computing resources more efficiently by expanding only the dense space while maintaining the same accuracy as the existing method.

Performance Evaluation of the Roll-back Recovery on the Cluster System with SIOS (SIOS 기반의 저장 장치를 사용하는 클러스터 시스템의 결함 회복 성능 평가)

  • Yu, Taek-Geun;Chang, Yun-Seok
    • Annual Conference of KIPS
    • /
    • 2007.05a
    • /
    • pp.773-776
    • /
    • 2007
  • 클러스터 시스템에서 결함이 발생하였을 때, 결함 회복 성능은 매우 중요한 설계 요소가 된다. 단일 입출력 공간(SIOS)을 저장 장치로 사용하는 클러스터 시스템에서, 각 노드들의 결함허용정보를 주기적으로 저장하는 roll-back 결함회복 기법을 사용하는 경우, 결함 회복 성능은 SIOS가 제공하는 입출력 병렬성과 깊은 관계가 있다. 본 연구에서는 클러스터 시스템의 SIOS 구성에 참여하는 노드 수에 따른 결함 회복 성능을 HPL 벤치마크를 통하여 여러 환경에서 평가하고, 그 결과를 분석하였다. 성능 평가 수행 결과, 클러스터 시스템은 SIOS 구성에 참여하는 노드의 수가 증가할수록 우수한 결함 회복 성능을 보인다. 따라서 SIOS를 결함허용정보 저장 장치로 사용하는 클러스터 시스템을 설계할 경우, SIOS 구성에 참여하는 노드 수가 클러스터 시스템의 결함 회복 성능을 결정하는 데에 중요한 요소가됨을 알 수 있다.

Struktur und Entwicklung des Innovationsclusters in Deutschland: Das Beispiel Biotech Cluster Muenchen (독일 혁신클러스터의 구조와 발전: 뮌헨 바이오테크 클러스터를 중심으로)

  • Ahn, Young-Jin
    • Journal of the Economic Geographical Society of Korea
    • /
    • v.17 no.3
    • /
    • pp.585-599
    • /
    • 2014
  • Zusammenfassung : Seit den 1990er Jahren hat Muenchen sich zu einem der fuehrenden europaeischen Biotechnologie Clustern entwickelt. Cluster, d.h. raeumliche Konzentrationen von miteinander vernetzten Unternehmen und Institutionen entlang einer Wertschoepfungskette, stellt fuer Unternehmen und Regionen einen erheblichen Wettbewerbsvorteil dar. Ziel dieser Beitrag ist es, die Herausbildung und Entwicklung des Innovationsclusters in Deutschland, am Beispiel von Biotech Cluster Muenchen zu analysieren. Im Folgenden wird zunaechst der Versuch unternommen, eine uebergreifende Kozeption regionaler Unternehmensclustern theoretisch zu eroerten. Darauf aufbauend wird anhand des Biotech Clusters Muenchen die Struktur und Entwicklung des Innovationsclusters empirisch aufgezeigt.

  • PDF

The Mechanism of Spatial Data Processing for Restrictive Resource-Adaptive Form in Shared-nothing Spatial Database Cluster (비공유 공간 데이터베이스 클러스터에서 한정된 자원에 적합한 형태로의 공간데이터 처리 기법)

  • 유병섭;장용일;이충호;배해영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.142-144
    • /
    • 2003
  • 최근 모바일 장치의 발전과 보급으로 차량 네비게이션 시스템(naigation system)과 같이 모바일 장치를 이용한 지도정보 서비스가 발전하였다. 모바일 장치는 자원이 한정되어 있고. 네트워크의 대역폭이 적기 때문에 크기가 크고 복잡한 벡터 데이터를 효율적으로 전송할 수 있는 방법이 매우 중요하다. 본 논문에서는 비공유 데이터베이스 클러스터에서 한정된 자원에 적합한 형태로 공간데이터를 처리하는 기법을 제안한다. 이는 스케일과 사용자의 요청에 따라 보여질 필요가 없는 피쳐들을 제거하고 스케일에 따라 보여지는 형태가 바뀌는 피쳐들에 대해 공간타입을 바꾸는 필터링을 통해 최적화된 지도 정보로 구성한다. 이렇게 구성된 정보는 불필요한 정보가 감소되어 데이터의 크기가 작아지는 장점을 갖는다. 또한 구성된 정보는 주요 부분부터 단계적으로 클라이언트에 보냄으로써 클라이언트에 대한 응답시간이 빠르게 되며, 사용자의 요구에 적합한 형태의 공간 정보를 우선순위가 높은 데이터부터 단계적으로 클라이언트에서 보여짐으로써 사용자에게 필요한 공간정보를 보다 빠르게 얻을 수 있다.

  • PDF

Image Scale Prediction Using Key-point Clusters on Multi-scale Image Space (다중 스케일 영상 공간에서 특징점 클러스터를 이용한 영상스케일 예측)

  • Ryu, kwon-Yeal
    • Journal of the Institute of Convergence Signal Processing
    • /
    • v.19 no.1
    • /
    • pp.1-6
    • /
    • 2018
  • In this paper, we propose the method to eliminate repetitive processes for key-point detection on multi-scale image space. The proposed method detects key-points from the original image, and select a good key-points using the cluster filters, and create the key-point clusters. And it select reference objects by using direction angles of the key-point clusters, predict the scale of the original image by using the distributed distance ratio. It transform the scale of the reference image, and apply the detection of key-points to the transformed reference image. In the results of the experiment, the proposed method can be found to improve the key-points detection time by 75 % and 71 % compared to SIFT method and scaled ORB method using the multi-scale images.

Cancer cluster detection using scan statistic (스캔 통계량을 이용한 암 클러스터 탐색)

  • Han, Junhee;Lee, Minjung
    • Journal of the Korean Data and Information Science Society
    • /
    • v.27 no.5
    • /
    • pp.1193-1201
    • /
    • 2016
  • In epidemiology or etiology, we are often interested in identifying areas of elevated risk, so called, hot spot or cluster. Many existing clustering methods only tend to a result if there exists any clustering pattern in study area. Recently, however, lots of newly introduced clustering methods can identify the location, size, and shape of clusters and test if the clusters are statistically significant as well. In this paper, one of most commonly used clustering methods, scan statistic, and its implementation SaTScan software, which is freely available, will be introduced. To exemplify the usage of SaTScan software, we used cancer data from the SEER program of National Cancer Institute of U.S.A.We aimed to help researchers and practitioners, who are interested in spatial cluster detection, using female lung cancer mortality data of the SEER program.

A Dynamic Hashing Based Load Balancing for a Scalable Wireless Internet Proxy Server Cluster (확장성 있는 무선 인터넷 프록시 서버 클러스터를 위한 동적 해싱 기반의 부하분산)

  • Kwak, Hu-Keun;Kim, Dong-Seung;Chung, Kyu-Sik
    • The KIPS Transactions:PartA
    • /
    • v.14A no.7
    • /
    • pp.443-450
    • /
    • 2007
  • Performance scalability and storage scalability become important in a large scale cluster of wireless internet proxy cache servers. Performance scalability means that the whole performance of the cluster increases linearly according as servers are added. Storage scalability means that the total size of cache storage in the cluster is constant, regardless of the number of cache servers used, if the whole cache data are partitioned and each partition is stored in each server, respectively. The Round-Robin based load balancing method generally used in a large scale server cluster shows the performance scalability but no storage scalability because all the requested URL data need to be stored in each server. The hashing based load balancing method shows storage scalability because all the requested URL data are partitioned and each partition is stored in each server, respectively. but, it shows no performance scalability in case of uneven pattern of client requests or Hot-Spot. In this paper, we propose a novel dynamic hashing method with performance and storage scalability. In a time interval, the proposed scheme keeps to find some of requested URLs allocated to overloaded servers and dynamically reallocate them to other less-loaded servers. We performed experiments using 16 PCs and experimental results show that the proposed method has the performance and storage scalability as different from the existing hashing method.