• 제목/요약/키워드: Improved K-means algorithm

검색결과 143건 처리시간 0.022초

예측 데이터를 이용한 빠른 K-Means 알고리즘 (Fast K-Means Clustering Algorithm using Prediction Data)

  • 지태창;이현진;이일병
    • 한국콘텐츠학회논문지
    • /
    • 제9권1호
    • /
    • pp.106-114
    • /
    • 2009
  • 본 논문에서 K-Means 군집화 알고리즘을 빠르게 적용하는 방법을 제안했다. 제안하는 알고리즘의 특징은 속도 향상을 위해 변화될 가능성이 있는 데이터를 예측하는 것이다. 군집화 알고리즘의 각 단계에서 군집이 변경될 가능성이 있는 데이터만 선택하여 군집 중심과의 거리를 계산함으로써 전체 군집 계산 시간을 줄일 수 있었다. 군집이 변화될 예측 데이터를 계산할 때는 K-Means 알고리즘을 적용하면서 생성되는 거리 정보를 사용함으로써 추가되는 계산 시간이 적고, 특히, 거리 정보를 이용하기 때문에 차원의 개수에는 영향을 덜 받는 알고리즘을 제안할 수 있었다. 제안하는 알고리즘의 성능 비교를 위해서 원래의 K-Means인 Lloyd's와 이를 개선한 KMHybrid와 비교했다. 제안하는 알고리즘은 대용량 데이터( 입력 데이터의 크기가 크고, 데이터의 차원이 크며, 군집의 개수가 많은 경우)의 경우에 Lloyd's와 KMHybrid보다 높은 속도 향상을 보였다.

클러스터 중심 결정 방법에 따른 문서 클러스터링 성능 분석 (Analysis of Document Clustering Varing Cluster Centroid Decisions)

  • 오형진;변동률;이신원;박순철;정성종;안동언
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 하계종합학술대회 논문집(3)
    • /
    • pp.99-102
    • /
    • 2002
  • K-means clustering algorithm is a very popular clustering technique, which is used in the field of information retrieval. In this paper, We deal with the problem of K-means Algorithm from the view of creating the centroids and suggest a method reflecting document feature and considering the context of each document to determine the new centroids during the process of forming new centroids. For experiment, We used the automatic document summarizer to summarize the Reuter21578 newslire test dataset and achieved 20% improved results to the recall metrics.

  • PDF

개선된 FCM 클러스터링 영상 분할 (Improved FCM Clustering Image Segmentation)

  • 이광규
    • 전기전자학회논문지
    • /
    • 제24권1호
    • /
    • pp.127-131
    • /
    • 2020
  • 클러스터링을 이용한 대표적인 영상 분할 방법으로 Fuzzy C-Means(FCM) 알고리즘을 많이 사용하는데, FCM은 영상의 공간을 픽셀 값이 비슷한 클러스터 영역으로 분할하므로 분할 시간이 많이 소요된다. 특히 웹이 보편화된 현재 사용자들의 다양한 패턴을 분석하기 위한 처리 속도 문제는 더욱 중요하다. 이러한 속도 문제를 해결하기 위해 본 논문에서는 Otsu의 영상 히스토그램의 임계값과 FCM으로 영상을 분할하는 개선된 FCM(Improved FCM : IFCM) 알고리즘을 제안한다. 제안방법은 Otsu의 클래스 간의 분산을 최대화 시키는 임계값을 결정하여 FCM에 적용하고 영상을 분할하였다. IFCM은 기존의 FCM에 비해 영상 분할 시간을 단축시켜 성능이 향상되었음을 실험을 통해 보인다.

전자해도 수심 밀집도 개선기법 연구 (A Study on improvement method of sounding density of ENCs)

  • 오세웅;이문진;김혜진;서상현
    • 한국항해항만학회지
    • /
    • 제35권10호
    • /
    • pp.793-798
    • /
    • 2011
  • 전자해도는 종이해도 간행을 위한 수치해도를 변환하여 편집되며 그리드 형식의 격자형 체계로 간행된다. 이에 따라 전자해도의 수심정보 밀집도가 일관적이지 못해, 정보 분포에 관한 개선이 요구되어 왔다. 본 연구에서는 위성영상 분류기법 중 K-Means 기법과 ISODATA 기법을 검토 하여, 이를 전자해도 수심정보에 맞게 수정 및 적용 하였다. 전자해도 수심 밀집도 개선기법은 전자해도 로딩 부분, 수심 밀집도 개선 부분, 전자해도 쓰기 부분으로 설계 및 개발하였으며, 개발결과에 조건식에 따른 변수 설정을 달리하여 수심 밀집도 개선 및 변경 결과를 확인하였다.

무선 센서 네트워크에서의 머신러닝을 활용한 에너지 효율적인 클러스터 라우팅 방안 연구 (Energy Efficient Cluster Routing Method Using Machine Learning in WSN)

  • 강미영
    • 한국정보통신학회논문지
    • /
    • 제27권1호
    • /
    • pp.124-130
    • /
    • 2023
  • 본 논문에서는 K-평균 군집화 알고리즘을 사용하는 머신러닝을 활용하여 무선 센서 네트워크에서 센서 노드의 에너지 효율성을 향상시켜 네트워크의 수명을 향상시키고자 한다. 무선 센서 네트워크는 물리적인 센서로 배터리를 포함한 물리적 장치를 무선 네트워크로 구성한 것으로 센서 노드의 특성 상 에너지 소비를 최소화하여 네트워크 수 명을 최대화하기 위해 모든 자원을 효율적으로 사용해야 한다. 클러스터기반 접근 방식은 상대적으로 많은 수의 노 들로 구성된 그룹을 관리하는데 사용된다. 제안된 프로토콜에서는 기존의 LEACH 알고리즘을 개선하여 클러스터 기반 접근방식과 위치기반 접근 방식을 사용하여 클러스터 헤드를 선정하는 클러스터링 알고리즘을 제안한다. 개선 하고자 했던 성능 결과를 Matlab 시뮬레이션을 이용하여 측정하였다. 실험 결과를 통해 에너지 효율성 부분에 대해 K-means 클러스터링을 적용함으로써 에너지 효율이 개선되어 젠체 네트워크의 수명이 연장됨을 확인한다.

추천시스템을 위한 k-means 기법과 베이시안 네트워크를 이용한 가중치 선호도 군집 방법 (Clustering Method of Weighted Preference Using K-means Algorithm and Bayesian Network for Recommender System)

  • 박화범;조영성;고형화
    • Journal of Information Technology Applications and Management
    • /
    • 제20권3_spc호
    • /
    • pp.219-230
    • /
    • 2013
  • Real time accessiblity and agility in Ubiquitous-commerce is required under ubiquitous computing environment. The Research has been actively processed in e-commerce so as to improve the accuracy of recommendation. Existing Collaborative filtering (CF) can not reflect contents of the items and has the problem of the process of selection in the neighborhood user group and the problems of sparsity and scalability as well. Although a system has been practically used to improve these defects, it still does not reflect attributes of the item. In this paper, to solve this problem, We can use a implicit method which is used by customer's data and purchase history data. We propose a new clustering method of weighted preference for customer using k-means clustering and Bayesian network in order to improve the accuracy of recommendation. To verify improved performance of the proposed system, we make experiments with dataset collected in a cosmetic internet shopping mall.

MCL 알고리즘을 사용한 유전자 발현 데이터 클러스터링 (Clustering Gene Expression Data by MCL Algorithm)

  • 손호선;류근호
    • 전자공학회논문지CI
    • /
    • 제45권4호
    • /
    • pp.27-33
    • /
    • 2008
  • 유전자 발현 데이터의 분석 기법 중 무감독 학습 기반의 클러스터링 기법은 생물학적 변화와 진의 발현 정도를 이해하는데 자주 사용되는 방법이다. 생명공학 연구에 있어서 그래프 기반의 MCL 알고리즘은 그래프 내의 노드들을 클러스터링 하는 알고리즘으로 빠르고 효과적이다. 우리는 기존의 MCL 알고리즘을 개선하여 마이크로어레이 데이터에 적용시켰다. MCL 알고리즘 수행 시 inflation과 대각선 항의 두 요인을 조정하는 시뮬레이션을 실행하였으며, 마코브 행렬을 이용하여 변환하였다. 또한 개선된 MCL 알고리즘에서는 더 명확한 클래스를 구분하기 위하여 각 열의 평균을 구한 후 그 값을 임계치로 사용하였다. 따라서 수정된 알고리즘은 기존의 알고리즘들보다 정확도를 높일 수 있었다. 즉, 실제 실험 결과 기존에 알려진 클래스와 비교했을 때 평균 70%의 정확도를 보였다. 또한, 다른 클러스터링 기법, K-means 알고리즘, 계층적 클러스터링 그리고 SOM 알고리즘을 비교 분석하였으며, 그 결과 MCL 알고리즘이 다른 클러스터링 기법보다 더 좋은 결과를 보임을 알 수 있다.

Improved Classification Algorithm using Extended Fuzzy Clustering and Maximum Likelihood Method

  • Jeon Young-Joon;Kim Jin-Il
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2004년도 ICEIC The International Conference on Electronics Informations and Communications
    • /
    • pp.447-450
    • /
    • 2004
  • This paper proposes remotely sensed image classification method by fuzzy c-means clustering algorithm using average intra-cluster distance. The average intra-cluster distance acquires an average of the vector set belong to each cluster and proportionates to its size and density. We perform classification according to pixel's membership grade by cluster center of fuzzy c-means clustering using the mean-values of training data about each class. Fuzzy c-means algorithm considered membership degree for inter-cluster of each class. And then, we validate degree of overlap between clusters. A pixel which has a high degree of overlap applies to the maximum likelihood classification method. Finally, we decide category by comparing with fuzzy membership degree and likelihood rate. The proposed method is applied to IKONOS remote sensing satellite image for the verifying test.

  • PDF

K-means 알고리즘을 이용한 계층적 클러스터링에서의 클러스터 계층 깊이 선택 (Selection of Cluster Hierarchy Depth in Hierarchical Clustering using K-Means Algorithm)

  • 이원휘;이신원;정성종;안동언
    • 대한전자공학회논문지SD
    • /
    • 제45권2호
    • /
    • pp.150-156
    • /
    • 2008
  • 정보통신의 기술이 발달하면서 정보의 양이 많아지고 사용자의 질의에 대한 검색 결과 리스트도 많이 추출되므로 빠르고 고품질의 문서 클러스터링 알고리즘이 중요한 역할을 하고 있다. 많은 논문들이 계층적 클러스터링 방법을 이용하여 좋은 성능을 보이지만 시간이 많이 소요된다. 반면 K-means 알고리즘은 시간 복잡도를 줄일 수 있는 방법이다. 본 논문에서는 계층적 클러스터링 시스템인 콘도르(Condor) 시스템에서 K-Means 알고리즘을 이용하여 효율적으로 정보 검색을 하고 검색결과를 계층적으로 볼 수 있도록 구현하였다. 이 시스템은 K-Means Algorithm을 이용하였으며 클러스터 계층 깊이와 초기값을 조절하여 더 나은 성능을 보임을 알 수 있다.

후방산란 통신시스템에서 군집화를 통한 블라인드 채널 추정 (Blind Channel Estimation through Clustering in Backscatter Communication Systems)

  • 김수현;이동구;선영규;심이삭;황유민;신요안;김동인;김진영
    • 한국인터넷방송통신학회논문지
    • /
    • 제20권2호
    • /
    • pp.81-86
    • /
    • 2020
  • 주변 후방산란 통신 (Ambient Backsactter Communication, AmBC)은 주변의 RF 신호를 활용해 데이터를 전송하기 때문에 송신 전력이 제한되는 단점을 가지고 있다. 이를 위해, 송수신기 간 전송 효율을 높이 위한 방법으로 수신단에서 채널 상태를 추정할 수 있는 채널 추정기가 필요하다. 본 논문에서는 주변 후방산란 통신에서 기댓값-최대화 알고리즘(Expectation-Maximization Algorithm, EM algorithm) 기반의 채널 추정기의 성능 개선을 위해 K-means 알고리즘 도입 방안을 고려하였다. 모의실험은 제안한 채널 추정기의 성능 확인을 위해 성능 지표로 평균 제곱 오차 (Mean Square Error, MSE)를 사용한다. 모의실험을 통해 K-means을 통한 초깃값 설정 시, 기존 EM 알고리즘을 통한 채널 추정 방식 대비 개선된 성능을 보인다.