공간국부성을 최적화하는 클러스터링 방법

A Clustering Method for Optimizing Spatial Locality

  • 김홍기 (동신대학교 컴퓨터학과)
  • 발행 : 2004.04.01

초록

본 논문에서는 순환적인 검색공간과 장애물이 존재하는 검색공간에서 객체들을 클러스터링할 때 고려해야하는 CCD(Clustering with Circular Distance) 문제와 COD(Clustering with Obstructed Distance) 문제를 연구하였다. 그리고 다차원 검색공간에서 삽입이나 삭제가 빈번히 발생하는 객체들을 효율적으로 클러스터링하기 위한 새로운 클러스터링 알고리즘을 제안하였다. 제안한 클러스터링 알고리즘에는 CCD 및 COD 문제를 해결하기 위한 거리 함수가 정의된다. 그리고 최소의 연산 시간으로 높은 공간 국부성을 갖는 클러스터들을 생성하기 위한 클러스터링 방법이 포함된다.

In this paper, we study the CCD(Clustering with Circular Distance) and the COD(Clustering with Obstructed Distance) problems to be considered when objects are being clustered in a circularly search space and a search space with the presence of obstacles. We also propose a now clustering algorithm for clustering efficiently objects that the insertion or the deletion is occurring frequently in multi-dimensional search space. The distance function for solving the CCD and COD Problems is defined in the Proposed clustering algorithm. This algorithm is included a clustering method to create clusters that have a high spatial locality by minimum computation time.

키워드

참고문헌

  1. L. Kaufman, P.J. Rousseeuw, Finding Groups in Data: An Introduction to Cluster Analysis, John Wiley & Sons, 1990
  2. J. MacQueen, 'Some Methods for Classification and Analysis of Multivariate Observations,' Proc. of the 5th Berkeley Symp. Math. Statist, Prob., 1, pp. 281-297, 1967
  3. R. Ng, J. Han, 'Efficient and Effective Clustering Method for Spatial Data Mining,' Proc. Int. Conf. on VLDB, pp. 144-155, 1994
  4. S. Guha, R. Rastogi, K. Shim, 'CURE: An Efficient Clustering Algorithm for Large Databases,' Proc. Int. Conf. on SIGMOD, pp. 73-84, 1998
  5. G. Karypis, E.-H. Han, V. Kumar, 'CHA-MELEON: A Hierarchical Clustering Algorithm Using Dynamic Modeling,' COMPUTER, pp. 68-75, 1999 https://doi.org/10.1109/2.781637
  6. M. Ankerst, M. Breuning, H.P. Kriegel, J. Sander, 'OPTICS: Ordering Points ToIdentify the Clustering Structure,' Proc. Int. Conf. on SIGMOD, pp. 49-60, 1999
  7. M. Ester, H.-P. Kriegel, J. Sander, X. Xu, 'A Density-Based Algorithm for Discovering Clusters in Large Spatial Databases,' Proc. Int. Conf. on KDD, pp. 226-231, 1996
  8. W. Wang, J. Yang, R. Muntz, 'STING: A Statistical Information Grid Approach to Spatial Data Mining,' Proc. Int. Conf. on VLDB, pp. 186-195, 1997
  9. 김홍기, 황부현, '순환도메인을 기반으로 하는 PR-화일의 구현 및 성능평가,' 한국정보처리학회 논문지, 3권 1호, pp.63-76, 1996
  10. A.K.H. Tung, J. Hou, J. Han, 'Spatial Clustering in the Presence of Obstacles,' Proc. Int. Conf. on Data Engineering, pp. 359-367, 2001 https://doi.org/10.1109/ICDE.2001.914848
  11. 김홍기, 선휘준, '공간 데이타베이스 시스템에서 순환 속성을 지원하는 공간색인구조의 성능평가,' 한국멀티미디어학회 논문지, 4권 3호, pp. 197-204, 2001