• 제목/요약/키워드: k-means cluster

검색결과 620건 처리시간 0.029초

지역 가중치 적용 퍼지 클러스터링을 이용한 효과적인 이미지 분할 (Effective Image Segmentation using a Locally Weighted Fuzzy C-Means Clustering)

  • 나이마 알람저;김종면
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권12호
    • /
    • pp.83-93
    • /
    • 2012
  • 본 논문에서는 기존의 퍼지 클러스터링 기반 이미지 분할의 성능과 계산 효율을 개선하기 위해 퍼지 클러스터링의 목적 함수를 수정하는 이미지 분할 프레임워크를 제안한다. 제안하는 이미지 분할 프레임워크는 주변 픽셀들에 가중치를 부여함으로써 현재 센터 픽셀 연산을 위해 주변 픽셀들의 중요성을 고려하는 지역 가중치 적용 퍼지 클러스터링 기법을 포함한다. 이러한 가중치들은 각 멤버쉽들의 중요성을 표시하기 위해 현재 픽셀과 대응되는 각 주변 픽셀들 사이의 거리차에 의해 결정되어 지며, 이러한 프로세서는 향상된 클러스터링 성능을 보장한다. 제안하는 방법의 성능을 평가하기 위해 분할 계수, 분할 엔트로피, Xie-Bdni 함수, Fukuyzma-Sugeno 함수와 같은 네 가지 클러스터 유효성 함수를 이용하여 분석하였다. 모의실험 결과, 제안한 방법은 기존의 다른 퍼지 클러스터링 기법들보다 클러스터 유효성 함수들뿐만 아니라 분할과 조밀도 측면에서 우수한 성능을 보였다.

세부 동작 기반 사물인터넷 서비스 분류 기법 개발 (Development of IoT Service Classification Method based on Service Operation Characteristic)

  • 조정훈;이화민;이대원
    • 인터넷정보학회논문지
    • /
    • 제19권2호
    • /
    • pp.17-26
    • /
    • 2018
  • 최근 사물인터넷 서비스의 등장 및 융합으로 통합 사물인터넷 서비스 플랫폼에 관한 다양한 연구가 진행되었다. 현재 사물인터넷 서비스는 서비스 제공자의 목적에 따라 독립적인 시스템으로 구축되어 유사한 서비스를 제공하는 서비스 간의 정보 교환 및 모듈 재사용이 불가능 하였다. 이에 본 연구에서는 통합 사물인터넷 플랫폼 환경을 제공하기 위하여 다양한 서비스들의 세부 동작 기반 서비스 분류 알고리즘을 제안한다. 구현을 통하여 상용화된 100여개의 사물인터넷 서비스를 분류 및 군집화를 진행하였으며 이를 기반으로 K-means알고리즘과 비교하여 제안하는 알고리즘의 성능을 평가하였다. 또한 표본 집단의 부족으로 발생하는 단일 클러스터를 방지하기 위하여 K-means 알고리즘을 활용하여 재 군집화를 진행하였다. 향후 연구로 기존의 서비스 표본 집단을 확대하고 현재 구현한 분류 시스템을 보다 빠르고 대량의 데이터 처리를 위하여 스파크를 활용할 예정이다.

반려동물 사료 추천시스템을 위한 유사성 측정 알고리즘에 대한 연구 (A Study of Similarity Measure Algorithms for Recomendation System about the PET Food)

  • 김삼택
    • 한국융합학회논문지
    • /
    • 제10권11호
    • /
    • pp.159-164
    • /
    • 2019
  • ICT 기술 발전으로 강아지와 고양이등 반려동물 돌보기와 건강에 대한 관심도가 높아지고 있다. 본 논문에서는 반려동물 산업의 다양한 분야에 활용될 수 있도록 반려동물 사료의 성분 데이터를 기반으로 군집분석을 수행하고 적합한 서비스에 대해 고찰한다. 군집분석을 위해 시중에서 유통되고 있는 300여 개의 강아지 및 고양이 펫푸드를 대상으로 성분별 상관관계를 분석하여 유사성을 측정하며, Hierarchical, K-Means, Partitioning around medoids(PAM), Density-based, Mean-Shift 등의 다양한 클러스터링 기법을 활용하여 군집화 하여 분석한다. 또한 반려동물의 개인화 추천시스템도 제안한다. 본 논문의 연구 결과는 반려동물을 대상으로 한 사료 추천시스템 등의 맞춤형 개인화 서비스에 활용할 수 있다.

Anomalous Pattern Analysis of Large-Scale Logs with Spark Cluster Environment

  • Sion Min;Youyang Kim;Byungchul Tak
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권3호
    • /
    • pp.127-136
    • /
    • 2024
  • 본 연구는 Spark 클러스터 환경에서 대용량 로그를 분석하여 시스템 이상과의 연관성을 탐색한다. 로그를 활용한 이상 감지 연구는 증가하고 있으나, 클러스터의 다양한 컴포넌트의 로그를 충분히 활용하지 못하고 이상과 시스템의 연관성을 고려하지 않는다는 한계가 있다. 따라서 본 논문에서는 정상과 비정상 로그의 분포를 분석하고, 로그 템플릿의 출현 여부를 통해 이상 감지 가능성을 탐색한다. Hadoop과 Spark를 활용하여 정상과 비정상 로그 데이터를 생성하고, t-SNE와 K-means 클러스터링을 통해 비정상 상황에서의 로그 템플릿을 찾아 이상 현상을 파악한다. 결과적으로, 비정상 상황에서만 발생하는 고유한 로그 템플릿을 확인하며 이를 통해 이상 현상 감지의 가능성을 제시한다.

Bootstrapping of Hanwoo Chromosome17 Based on BMS1167 Microsatellite Locus

  • Lee, Jea-Young;Lee, Yong-Won;Yeo, Jung-Sou
    • Journal of the Korean Data and Information Science Society
    • /
    • 제18권1호
    • /
    • pp.175-184
    • /
    • 2007
  • LOD scores and a permutation test for detecting and locating quantitative trait loci (QTL) from the Hanwoo economic trait have been described and we selected a considerable major BMS1167 locus for further analysis. K-means clustering analysis, for the major DNA marker mining of BMS1167 microsatellite loci in Hanwoo chromosome17, has been tried and three cluster groups divide four traits. The three cluster groups are classified according to eight DNA marker bps. Finally, we employed the bootstrap test method to calculate confidence intervals using the resampling method to find major DNA markers. We conclude that the major marker of BMS1167 locus in Hanwoo chromosome17 is only DNA marker 100bp.

  • PDF

ITO 이행단계 성공요인에 대한 가치체계모형 연구 (Value Structure Model of the Success Factor of ITO Transition)

  • 차환주;김자희
    • 한국경영과학회지
    • /
    • 제41권1호
    • /
    • pp.21-39
    • /
    • 2016
  • Although the demand for IT outsourcing (ITO) has increased recently because of the recent recession, concerns about business discontinuity in the transition phase cause companies to hesitate to adopt ITO. Therefore, a guideline to improve the prospects is needed. However, studies on the success factors of the transition phase in ITO are lacking. In this study, we develop an expert hierarchical value map (HVM) of the success of the transition phase in ITO by using cognition scientific methodologies. We empirically verify how success factors affect the success of the transition phase. Specifically, we derive an HVM of main stakeholders by using in-depth interviews and approaches, such as repertory grid technique (RGT) and laddering, based on means-end chain theory. We validate the success factors empirically through a bipolar analysis of RGT. Finally, we determine the most important cluster of success factors through cluster analysis.

Optical Emission Spectra 신호와 다변량분석기법을 통한 Fluorocarbon에 의해 오염된 반응기의 RF 플라즈마 세정공정 진단 (RF Plasma Processes Monitoring for Fluorocarbon Polluted Plasma Chamber Cleaning by Optical Emission Spectroscopy and Multivariate Analysis)

  • 장해규;이학승;채희엽
    • 한국표면공학회:학술대회논문집
    • /
    • 한국표면공학회 2015년도 추계학술대회 논문집
    • /
    • pp.242-243
    • /
    • 2015
  • Fault detection using optical emission spectra with modified K-means cluster analysis and principal component anal ysis are demonstrated for inductive coupl ed pl asma cl eaning processes. The optical emission spectra from optical emission spectroscopy (OES) are used for measurement. Furthermore, Principal component analysis and K-means cluster analysis algorithm is modified and applied to real-time detection and sensitivity enhancement for fluorocarbon cleaning processes. The proposed techniques show clear improvement of sensitivity and significant noise reduction when they are compared with single wavelength signals measured by OES. These techniques are expected to be applied to various plasma monitoring applications including fault detections as well as chamber cleaning endpoint detection.

  • PDF

Comprehensive review on Clustering Techniques and its application on High Dimensional Data

  • Alam, Afroj;Muqeem, Mohd;Ahmad, Sultan
    • International Journal of Computer Science & Network Security
    • /
    • 제21권6호
    • /
    • pp.237-244
    • /
    • 2021
  • Clustering is a most powerful un-supervised machine learning techniques for division of instances into homogenous group, which is called cluster. This Clustering is mainly used for generating a good quality of cluster through which we can discover hidden patterns and knowledge from the large datasets. It has huge application in different field like in medicine field, healthcare, gene-expression, image processing, agriculture, fraud detection, profitability analysis etc. The goal of this paper is to explore both hierarchical as well as partitioning clustering and understanding their problem with various approaches for their solution. Among different clustering K-means is better than other clustering due to its linear time complexity. Further this paper also focused on data mining that dealing with high-dimensional datasets with their problems and their existing approaches for their relevancy

빅데이터에서 개선된 TI-FCM 클러스터링 알고리즘 (Improved TI-FCM Clustering Algorithm in Big Data)

  • 이광규
    • 전기전자학회논문지
    • /
    • 제23권2호
    • /
    • pp.419-424
    • /
    • 2019
  • FCM 알고리즘은 반복 최적화 기법을 통해 최적해를 찾는다. 특히, 클러스터링 초기 중심과 잡음의 위치, 몰려있는 밀도의 위치, 개수에 따라 실행시간 차이가 난다. 하지만 이 방법은 중심점을 점차 갱신해 나가는 방법으로 초기 클러스터 중심이 한 쪽으로 치우치게 되고 클러스터링 결과의 편차가 심해 클러스터링 대푯값의 신뢰도가 떨어진다. 따라서 본 논문에서는 삼각부등식을 이용하여 클러스터 간 거리를 최대한 멀어지게 하여 클러스터 중심 밀도를 결정하는 TI-FCM(Triangular Inequality-Fuzzy C-Means:삼각부등식-FCM)클러스터링 알고리즘을 제안한다. 제안된 방법은 대용량의 빅데이터에서도 FCM에 비해 실제 클러스터에 수렴하는 효과적인 방법이고 실험을 통해 기존 FCM보다 실행시간이 감소됨을 보였다.

밀도에 무관한 클러스터링 기법의 개선 (Improvement on Density-Independent Clustering Method)

  • 김성훈;허경용
    • 한국정보통신학회논문지
    • /
    • 제21권5호
    • /
    • pp.967-973
    • /
    • 2017
  • 클러스터링은 균일한 특성을 가지는 데이터를 클러스터로 묶기 위해 사용되는 비교사 학습 방법 중 하나로 다양한 응용에 사용되고 있으며 FCM(Fuzzy C-Means)이 대표적인 방법 중 하나이다. 하지만 FCM에서 주로 사용되는 유클리드 거리 척도는 밀도가 높은 클러스터가 클러스터링 결과에 많은 영향을 미쳐 밀도가 높은 쪽으로 클러스터의 중심을 위치시키는 문제가 있으며, 이를 해결하기 위한 방법 중 하나가 클러스터 중심 사이의 거리가 가능한 멀어지도록 하는 밀도 무관 클러스터링이다. 하지만 밀도 무관 클러스터링 역시 클러스터 중심 사이의 거리를 정확히 제어하기가 어렵다. 이 논문에서는 클러스터 중심 사이의 거리가 멀어지도록 할뿐만이 아니라 클러스터 중심이 밀도가 높은 곳에 위치하도록 하는 항을 추가한 개선된 밀도 무관 클러스터링 방법을 제안한다. 제안하는 방법은 FCM이나 밀도 무관 클러스터링에 비해 실제 클러스터 중심으로 수렴하는 경우가 더 많다는 것을 실험 결과를 통해 확인할 수 있다.