• 제목/요약/키워드: distance-based clustering algorithm

검색결과 130건 처리시간 0.026초

대용량 공간데이터베이스를 위한 확장된 밀도-격자 기반의 공간 클러스터링 알고리즘 (An Enhanced Density and Grid based Spatial Clustering Algorithm for Large Spatial Database)

  • ;김호석;;김경배;배해영
    • 정보처리학회논문지D
    • /
    • 제13D권5호
    • /
    • pp.633-640
    • /
    • 2006
  • 공간 데이터마이닝 분야에서 객체간의 거리, 연결성, 상대적인 밀도를 기반으로 비슷한 객체들을 하나의 그룹으로 묶는 공간 클러스터링은 중요한 컴포넌트이다. 공간 클러스터링 알고리즘은 밀도 기반 클러스터링과 격자 기반 클러스터링 알고리즘 등으로 나눌 수 있다. 밀도 기반 클러스터링 알고리즘은 다양한 모양과 크기의 클러스터를 구분할 수 있으며, 잡음을 제거할 수 있는 장점을 가지고 있는 반면에, 격자 기반 클러스터링 처리속도가 빠르다는 장점을 가지고 있다. 하지만, 대량의 공간 데이터 집합을 클러스터링 하는 것은 데이터 처리 비용이 급격하게 증가하기 때문에 클러스터링 처리 결과에 큰 영향을 준다. 본 논문은 대용량의 공간 데이터베이스에서 공간 객체간의 고밀도 영역을 식별하여 잡음을 제거하기 위한 수치데이터 값과 기본 격자간격 개수를 정의하는 확장된 밀도-격자 기반 클러스터링 알고리즘을 제안한다. 제안 알고리즘은 고밀도 영역 식별을 위하여 threashold(DT)를 정의하였으며, 격자 및 밀도 기반 기법의 장점을 이용하여 임의의 객체 클러스터링을 식별할 수 있는 성능을 향상시켰다. 성능평가에서 기존의 클러스터링 알고리즘과의 다양한 비교 평가 실험을 통하여, 제안 알고리즘이 빠르고 정확한 데이터 클러스터링 결과를 나타냄을 보인다.

클러스터링 기반의 최적 차량 운행 계획 수립을 위한 비교연구 (Comparative Analysis for Clustering Based Optimal Vehicle Routes Planning)

  • 김재원;신광섭
    • 한국빅데이터학회지
    • /
    • 제5권1호
    • /
    • pp.155-180
    • /
    • 2020
  • 화물의 수배송을 위한 차량의 배차 및 최적 경로 설계는 물류 서비스의 효율성 향상을 위한 가장 핵심적인 역할을 담당한다. 이 문제는 차량의 대수, 차량별 적재 용량, 차량의 총 이동거리와 같이 다양한 비용 요소를 동시에 고려해야 하기 때문이다. 최근 비용 최소화 및 운영 효율성 향상을 위해 TMS를 도입하는 사례가 증가하고 있으나, 현장에서 필요한 모든 요소를 고려하지 못한다는 한계가 존재한다. 이를 해결하기 위해 현장 전문가가 TMS의 결과를 경험과 직관에 기반하여 수정하는 과정이 필요하다. 본 연구에서는 지금까지 총 비용의 최소화에 집중하고 있는 기존 연구들과 달리 서비스에 투입되는 자원 활용의 효율성과 형평성을 동시에 높일 수 있는 방법을 제안한다. 이를 위해 Cluster-First Route-Second (CFRS)기법을 활용한다. 고객의 위치를 기준으로 네 가지 클러스터링 알고리즘(K-Means, K-Medoids, DBSCAN, Model-based)과 Fisher & Jaikumar 알고리즘을 적용하여 고객들을 군집화하였다. 이 후, 군집별 최적의 차량 경로 계획을 수립하였다. 수치 실험을 통해 본 연구에서 제안하는 CFRS 기법을 적용한 방안이 상대적으로 차량의 전체 이동거리와 평균 이동거리 및 이동시간이 더 절감될 수 있다는 사실을 확인하였다. 또한, 차량별 방문하는 고객의 수에 대한 편차가 더 낮다는 사실로부터 기본적인 차량 경로 배정 유형에 비해 본 연구에서 제안하는 방안이 상대적으로 형평성 있게 업무가 할당되었음을 확인할 수 있었다.

MCRO-ECP: Mutation Chemical Reaction Optimization based Energy Efficient Clustering Protocol for Wireless Sensor Networks

  • Daniel, Ravuri;Rao, Kuda Nageswara
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권7호
    • /
    • pp.3494-3510
    • /
    • 2019
  • Wireless sensor networks encounter energy saving as a major issue as the sensor nodes having no rechargeable batteries and also the resources are limited. Clustering of sensors play a pivotal role in energy saving of the deployed sensor nodes. However, in the cluster based wireless sensor network, the cluster heads tend to consume more energy for additional functions such as reception of data, aggregation and transmission of the received data to the base station. So, careful selection of cluster head and formation of cluster plays vital role in energy conservation and enhancement of lifetime of the wireless sensor networks. This study proposes a new mutation chemical reaction optimization (MCRO) which is an algorithm based energy efficient clustering protocol termed as MCRO-ECP, for wireless sensor networks. The proposed protocol is extensively developed with effective methods such as potential energy function and molecular structure encoding for cluster head selection and cluster formation. While developing potential functions for energy conservation, the following parameters are taken into account: neighbor node distance, base station distance, ratio of energy, intra-cluster distance, and CH node degree to make the MCRO-ECP protocol to be potential energy conserver. The proposed protocol is studied extensively and tested elaborately on NS2.35 Simulator under various senarios like varying the number of sensor nodes and CHs. A comparative study between the simulation results derived from the proposed MCRO-ECP protocol and the results of the already existing protocol, shows that MCRO-ECP protocol produces significantly better results in energy conservation, increase network life time, packets received by the BS and the convergence rate.

제조 시계열 데이터를 위한 진화 연산 기반의 하이브리드 클러스터링 기법 (Evolutionary Computation-based Hybird Clustring Technique for Manufacuring Time Series Data)

  • 오상헌;안창욱
    • 스마트미디어저널
    • /
    • 제10권3호
    • /
    • pp.23-30
    • /
    • 2021
  • 제조 시계열 데이터 클러스터링 기법은 제조 대용량 데이터 기반 군집화를 통한 설비 및 공정 이상 탐지 분류를 위한 중요한 솔루션이지만 기존 정적 데이터 대상 클러스터링 기법을 시계열 데이터에 적용함에 있어 낮은 정확도를 가지는 단점이 있다. 본 논문에서는 진화 연산 기반 시계열 군집 분석 접근 방식을 제시하여 기존 클러스터링 기술에 대한 정합성 향상하고자 한다. 이를 위하여 먼저 제조 공정 결과 이미지 형상을 선형 스캐닝을 활용하여 1차원 시계열 데이터로 변환하고 해당 변환 데이터 대상으로 Pearson 거리 매트릭을 기반으로 계층적 군집 분석 및 분할 군집 분석에 대한 최적 하위클러스터를 도출한다. 해당 최적 하위클러스터 대상 유전 알고리즘을 활용하여 유사도가 최소화되는 최적의 군집 조합을 도출한다. 그리고 실제 제조 과정 이미지 대상으로 기존 클러스터링 기법과 성능 비교를 통하여 제안된 클러스터링 기법의 성능 우수성을 검증한다.

패턴 분류를 위한 개선된 FCM 기반 하이브리드 네트워크 (Enhanced FCM-based Hybrid Network for Pattern Classification)

  • 김광백
    • 한국정보통신학회논문지
    • /
    • 제13권9호
    • /
    • pp.1905-1912
    • /
    • 2009
  • FCM 알고리즘은 입력 벡터와 각 클러스터의 유클리드 거리를 이용하여 구해진 소속도만를 비교하여 데이터를 분류하기 때문에 클러스터링 된 공간에서의 데이터들의 분포에 따라 바람직하지 못한 클러스터링 결과를 보일 수 있다. 이러한 문제점을 개선하기 위해 대칭적 성질을 이용하는 대칭성 측도에 퍼지 이론을 적용하여 군집간의 거리에 따른 변화와 군집 중심의 위치, 그리고 군집 형태에 따라 영향을 덜 받는 개선된 FCM이 제안되었다. 본 논문에서는 효과적으로 패턴을 분류하기 위해 개선된 FCM 알고리즘을 적용한 개선된 하이브리드 네트워크를 제안한다. 제안된 하이브리드 네트워크는 개선된 FCM 알고리즘을 입력층과 중간층의 학습구조 적용하고 중간층과 출력층의 학습 구조는 일반화된 델타 학습법을 적용한다. 제안된 방법의 인식 성능을 평가하기 위해 2차원 좌표 평면 상의 데이터를 기존의 Max_Min 신경망을 이용한 FCM 기반 RBF 네트워크와 FCM 기반 RBF 네트워크, HCM 기반 네트워크와 제안된 방법 간의 학습 및 인식 성능을 비교 및 분석하였다.

효율적인 영상 검색을 위한 클러스터링 기반 고속 다 해상도 전역 탐색 기법 (Fast Multi-Resolution Exhaustive Search Algorithm Based on Clustering for Efficient Image Retrieval)

  • 송병철;김명준;라종범
    • 대한전자공학회논문지SP
    • /
    • 제38권2호
    • /
    • pp.117-128
    • /
    • 2001
  • 유사도 측정자 (similarity measure)에 따라 문의자 (query)의 최적 정합자 (the best match)를 찾는 최적 검색 (optimal retrieval)을 위해서는 데이터베이스의 모든 영상들에 대해 전역 탐색 (exhaustive search)을 수행해야 한다. 그러나, 일반적인 전역 탐색은 방대한 계산량을 요구한다. 그 계산량을 줄이기 위해, 본 논문은 영상 데이터베이스의 클러스터링 (clustering)에 기반한 고속 다 해상도 전역 탐색 기법을 제안한다. 먼저 데이터베이스 내의 모든 영상들을 일정 수의 클러스터 (cluster)들로 나눈다. 각 클러스터는 유사한 특징 (feature)을 갖는 영상들로 구성된다. 그리고, 각 클러스터와 문의자 간 거리 (distance)의 하계(lower bound)를 구하고, 가능성이 전혀 없다고 판단될 경우 그 클러스터를 제거한다. 가능성이 있다고 판단된 클러스터들에 속한 후보 영상들 중에서 최적 정합자를 찾는다. 또한, 불필요한 특징 정합 연산을 줄이기 위해 다 해상도 데이터 구조에 기반한 거리 부등식 성질 (distance inequality property)을 유도하여, 탐색 과정에 적용한다. 제안한 기법은 고속 다 해상도 전역 탐색 기법으로서 단일 최적 정합자뿐만 아니라 다수의 상위 최적 정합자들도 정확하게 찾을 수 있다. 가장 보편적인 밝기 히스토그램 (luminance histogram)특징을 사용하여, 제안한 기법이 고속의 탐색 속도와 함께 최적 검색을 보장함을 증명해 보인다.

  • PDF

A study on Improvement for distorted images of the Digital X-ray Scanner System based on Fuzzy Correction Algorithm

  • Baek, Jae-Ho;Kim, Kyung-Jung;Park, Mi-Gnon
    • 한국정보기술응용학회:학술대회논문집
    • /
    • 한국정보기술응용학회 2005년도 6th 2005 International Conference on Computers, Communications and System
    • /
    • pp.173-176
    • /
    • 2005
  • This paper proposes a fuzzy correction algorithm that can correct the distorted medical image caused by the scanning nonlinear velocity of the Digital X-ray Scanner System (DX-Scanner) using the Multichannel Ionization Chamber (MIC). In the DX-Scanner, the scanned medical image is distorted for reasons of unsuitable integration time at the nonlinear acceleration period of the AC servo motor during the inspection of patients. The proposed algorithm finds the nonlinear motor velocity modeling through fuzzy system by clustering and reconstructs the normal medical image lines by calculating the suitable moving distance with the velocity of the motor using the modeling, acceleration time and integration time. In addition, several image processing is included in the algorithm. This algorithm analyzes exact pixel lines by comparing the distance of the acceleration period with the distance of the uniform velocity period in every integration time and is able to compensate for the velocity of the acceleration period. By applying the proposed algorithm to the test pattern for checking the image resolution, the effectiveness of this algorithm is verified. The corrected image obtained from distorted image is similar to the normal and better image for a doctor's diagnosis.

  • PDF

패턴 클러스터링 기법에 기반한 배전 변전소 주변압기 사고복구 전략 설계 (Design of Main Transformer Fault Restoration Strategy Based on Pattern Clustering Method in Automated Substation)

  • 고윤석
    • 대한전기학회논문지:전력기술부문A
    • /
    • 제55권10호
    • /
    • pp.410-417
    • /
    • 2006
  • Generally, the training set of maximum $m{\times}L(m+f)$ patterns in the pattern recognition method is required for the real-time bus reconfiguration strategy when a main transformer fault occurs in the distribution substation. Accordingly, to make the application of pattern recognition method possible, the size of the training set must be reduced as efficient level. This Paper proposes a methodology which obtains the minimized training set by applying the pattern clustering method to load patterns of the main transformers and feeders during selected period and to obtain bus reconfiguration strategy based on it. The MaxMin distance clustering algorithm is adopted as the pattern clustering method. The proposed method reduces greatly the number of load patterns to be trained and obtain the satisfactory pattern matching success rate because that it generates the typical pattern clusters by appling the pattern clustering method to load patterns of the main transformers and feeders during selected period. The proposed strategy is designed and implemented in Visual C++ MFC. Finally, availability and accuracy of the proposed methodology and the design is verified from diversity simulation reviews for typical distribution substation.

Correlation Distance Based Greedy Perimeter Stateless Routing Algorithm for Wireless Sensor Networks

  • Mayasala, Parthasaradhi;Krishna, S Murali
    • International Journal of Computer Science & Network Security
    • /
    • 제22권1호
    • /
    • pp.139-148
    • /
    • 2022
  • Research into wireless sensor networks (WSNs) is a trendy issue with a wide range of applications. With hundreds to thousands of nodes, most wireless sensor networks interact with each other through radio waves. Limited computational power, storage, battery, and transmission bandwidth are some of the obstacles in designing WSNs. Clustering and routing procedures have been proposed to address these concerns. The wireless sensor network's most complex and vital duty is routing. With the Greedy Perimeter Stateless Routing method (GPSR), an efficient and responsive routing protocol is built. In packet forwarding, the nodes' locations are taken into account while making choices. In order to send a message, the GPSR always takes the shortest route between the source and destination nodes. Weighted directed graphs may be constructed utilising four distinct distance metrics, such as Euclidean, city block, cosine, and correlation distances, in this study. NS-2 has been used for a thorough simulation. Additionally, the GPSR's performance with various distance metrics is evaluated and verified. When compared to alternative distance measures, the proposed GPSR with correlation distance performs better in terms of packet delivery ratio, throughput, routing overhead and average stability time of the cluster head.

국내 연안 해역 선박 항적 군집화를 위한 항적 간 거리 척도 개발 연구 (Research on the Development of Distance Metrics for the Clustering of Vessel Trajectories in Korean Coastal Waters)

  • 이승주;이원희;민지홍;조득재;박현우
    • 한국항해항만학회지
    • /
    • 제47권6호
    • /
    • pp.367-375
    • /
    • 2023
  • 본 연구에서는 국내 연안 해역 환경에서의 해상교통관제 서비스에 기여할 수 있는 항적 간 거리 척도를 개발하였다. 새로운 항적간 거리 척도는 전통적으로 위치 시계열 간의 유사도를 측정하는 데 활용되는 하우스도르프 거리(hausdorff distance)와 두 항적 간의 대지속력(Speed Over Ground, SOG)의 평균 간의 차이, 그리고 대지침로(Course Over Ground)의 분산 간의 차이를 가중합하여 설계되었다. 새로운 척도의 유효성을 검증하기 위하여 실제 AIS 항적 데이터와 병합 군집화 알고리즘을 활용한 기존 항적 간 거리 척도와의 비교 분석이 수행되었으며, 새로운 거리 척도를 활용한 항적 군집화 결과가 하우스도르프 거리(hausdorff distance), 그리고 다이내믹 타임 워핑 거리(Dynamic Time Warping distance) 등 기존 척도에 비해 항적 간 지리적 거리나 대지속도 및 대지침로 등 선박 거동 특성의 분포를 비슷하거나 그 이상의 수준으로 정교하게 반영하고 있음을 데이터 시각화로써 확인하였다. 정량적으로는 Davies-Bouldin 지표를 기준으로, 군집화 결과가 더욱 우수하거나 약간 낮은 수준을 기록한 한편, 거리 계산 효율성에서는 특히 우수함을 실증하였다.