• Title/Summary/Keyword: Means of Using

Search Result 12,108, Processing Time 0.042 seconds

Approximate k values using Repulsive Force without Domain Knowledge in k-means

  • Kim, Jung-Jae;Ryu, Minwoo;Cha, Si-Ho
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권3호
    • /
    • pp.976-990
    • /
    • 2020
  • The k-means algorithm is widely used in academia and industry due to easy and simple implementation, enabling fast learning for complex datasets. However, k-means struggles to classify datasets without prior knowledge of specific domains. We proposed the repulsive k-means (RK-means) algorithm in a previous study to improve the k-means algorithm, using the repulsive force concept, which allows deleting unnecessary cluster centroids. Accordingly, the RK-means enables to classifying of a dataset without domain knowledge. However, three main problems remain. The RK-means algorithm includes a cluster repulsive force offset, for clusters confined in other clusters, which can cause cluster locking; we were unable to prove RK-means provided optimal convergence in the previous study; and RK-means shown better performance only normalize term and weight. Therefore, this paper proposes the advanced RK-means (ARK-means) algorithm to resolve the RK-means problems. We establish an initialization strategy for deploying cluster centroids and define a metric for the ARK-means algorithm. Finally, we redefine the mass and normalize terms to close to the general dataset. We show ARK-means feasibility experimentally using blob and iris datasets. Experiment results verify the proposed ARK-means algorithm provides better performance than k-means, k'-means, and RK-means.

적응적인 초기치 설정을 이용한 Fast K-means 및 Frizzy-c-means 알고리즘 (A Fast K-means and Fuzzy-c-means Algorithms using Adaptively Initialization)

  • 강지혜;김성수
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권4호
    • /
    • pp.516-524
    • /
    • 2004
  • 본 논문에서는 K-means 또는 Fuzzy-c-means 알고리즘에서 클러스터의 중심점을 찾는 과정 중 임의로 선택되는 초기값 선정의 문제를 해결하고, 기존의 단점을 보완하는 새로운 방안으로서 데이터의 분포의 통계적 특성에 따른 초기값 선정 방법을 제안하였다. 기존의 초기값 선정 방법은 초기값에 따라 클러스터링이 매우 민감한 변화를 가져와, 최종적으로 종종 원치 않는 방향으로 가는 문제점을 갖고 있다. 이러한 초기값 선정의 문제가 인지되어 왔지만, 그 문제의 해결방안이 실제적으로 모색된 경우는 없었다. 본 논문에서는 데이타의 통계적 특성을 이용한 초기값 선정 방법을 적용하여, 클러스터링이 형성되는 시간의 단축 및 원치 않는 결과가 생성되는 경우를 약화시켜 시스템의 향상을 가져왔고, 이러한 제안된 알고리즘의 우수성을 기존의 알고리즘과 비교를 통하여 나타내었다.

변환 영역에서 Non-local Means 방법을 이용한 효율적인 영상 잡음 제거 기법 (Efficient Image Denoising Method Using Non-local Means Method in the Transform Domain)

  • 김동민;이창우
    • 전자공학회논문지
    • /
    • 제53권10호
    • /
    • pp.69-76
    • /
    • 2016
  • 본 논문에서는 변환 영역에서 non-local means (NL-means) 방법을 이용한 효율적인 영상 잡음 제거 기법을 제안한다. 먼저 고전적인 영상 잡음 제거 기법에서부터 최근 연구되고 있는 영상 잡음 제거 기법에 대한 리뷰를 서술하고 우수한 성능을 보이는 잡음 제거 기법인 NL-means 방법을 이용한 영상 잡음 제거 기법에 대한 성능을 분석한다. NL-means 기법의 가중치를 DCT 및 LiftLT 변환 영역에서 일부 계수만을 이용하여 계산함으로써 NL-means 기법을 효율적으로 구현하는 방법을 제안한다. 제안하는 방법은 계산량을 줄여서 영상 잡음을 효율적으로 제거할 수 있을 뿐만 아니라 변환 영역에서 영상의 특성을 효율적으로 이용하여 잡음 제거시 성능을 향상시킨다. 또한 제안하는 기법은 변환 영역에서 영상의 잡음 제거와 해상도 향상을 동시에 수행할 때 효율적으로 적용할 수 있는 장점이 있다. 모의 실험을 통하여 제안하는 방법이 우수한 성능을 보이는 것을 입증한다.

Environmental Survey Data Modeling Using K-means Clustering Techniques

  • Park, Hee-Chang;Cho, Kwang-Hyun
    • Journal of the Korean Data and Information Science Society
    • /
    • 제16권3호
    • /
    • pp.557-566
    • /
    • 2005
  • Clustering is the process of grouping the data into clusters so that objects within a cluster have high similarity in comparison to one another. In this paper we used k-means clustering of several clustering techniques. The k-means Clustering Is classified as a partitional clustering method. We analyze 2002 Gyeongnam social indicator survey data using k-means clustering techniques for environmental information. We can use these outputs given by k-means clustering for environmental preservation and environmental improvement.

  • PDF

Environmental Survey Data Modeling using K-means Clustering Techniques

  • 박희창;조광현
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 한국데이터정보과학회 2004년도 추계학술대회
    • /
    • pp.77-86
    • /
    • 2004
  • Clustering is the process of grouping the data into clusters so that objects within a cluster have high similarity in comparison to one another. In this paper we used k-means clustering of several clustering techniques. The k-means Clustering is classified as a partitional clustering method. We analyze 2002 Gyeongnam social indicator survey data using k-means clustering techniques for environmental information. We can use these outputs given by k-means clustering for environmental preservation and environmental improvement.

  • PDF

K-means Clustering using Grid-based Representatives

  • Park, Hee-Chang;Lee, Sun-Myung
    • Journal of the Korean Data and Information Science Society
    • /
    • 제16권4호
    • /
    • pp.759-768
    • /
    • 2005
  • K-means clustering has been widely used in many applications, such that pattern analysis, data analysis, market research and so on. It can identify dense and sparse regions among data attributes or object attributes. But k-means algorithm requires many hours to get k clusters, because it is more primitive and explorative. In this paper we propose a new method of k-means clustering using the grid-based representative value(arithmetic and trimmed mean) for sample. It is more fast than any traditional clustering method and maintains its accuracy.

  • PDF

맵리듀스를 이용한 다중 중심점 집합 기반의 효율적인 클러스터링 방법 (An Efficient Clustering Method based on Multi Centroid Set using MapReduce)

  • 강성민;이석주;민준기
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권7호
    • /
    • pp.494-499
    • /
    • 2015
  • 데이터 사이즈가 증가함에 따라서 대용량 데이터를 분석하여 데이터의 특성을 파악하는 것이 매우 중요해졌다. 본 논문에서는 분산 병렬 처리 프레임워크인 맵리듀스를 활용한 k-Means 클러스터링 기반의 효과적인 클러스터링 기법인 MCSK-Means (Multi centroid set k-Means)알고리즘을 제안한다. k-Means 알고리즘은 임의로 정해지는 k개의 초기 중심점들의 위치에 따라서 클러스터링 결과의 정확도가 많은 영향을 받는 문제점을 가지고 있다. 이러한 문제를 해결하기 위하여, 본 논문에서 제안하는 MCSK-Means 알고리즘은 k개의 중심점들로 이루어진 m개의 중심점 집합을 사용하여 임의로 생성되는 초기 중심점의 의존도를 줄였다. 또한, 클러스터링 단계를 거친 m개의 중심점 집합들에 속한 중심점들에 대하여 직접 계층 클러스터링 알고리즘을 적용하여 k개의 클러스터 중심점들을 생성하였다. 본 논문에서는 MCSK-Means 알고리즘을 맵리듀스 프레임워크 환경에서 개발하여 대용량 데이터를 효율적으로 처리할 수 있도록 하였다.

적응적 Multiple Kernels을 이용한 Interval Type-2 Possibilistic Fuzzy C-Means 방법 (A Novel Approach towards use of Adaptive Multiple Kernels in Interval Type-2 Possibilistic Fuzzy C-Means)

  • 주원희;이정훈
    • 한국지능시스템학회논문지
    • /
    • 제24권5호
    • /
    • pp.529-535
    • /
    • 2014
  • 본 논문에서는 interval type-2 possibilistic fuzzy C-means(IT2PFCM) 클러스터링 방법에 multiple Gaussian kernels을 기반으로 한 possibilistic fuzzy C-means multiple kernels(PFCM-MK) 알고리즘을 결합하여 적응적인 하이브리드 클러스터링 방법인 multiple kernels interval type-2 possibilistic fuzzy C-means(IT2PFCM-MK) 방법을 제안 하였다. 일반적으로 possibilistic fuzzy C-means(PFCM) 알고리즘은 fuzzy C-means(FCM) 알고리즘의 단점인 노이즈 민감성 및 특이점 문제와 알고리즘 초기 클러스터의 Prototype에 따라 위치가 겹치는 문제를 해결하기 위해 제안 되었다. 하지만 이 방법 역시 퍼지화 파라미터 값에 따라 위와 같은 문제를 여전히 가지고 있기 때문에 이와 같은 문제를 보완하기 위해 interval type-2 퍼지 접근 방법을 이용 하는 interval type-2 possibilistic fuzzy C-means(IT2PFCM) 알고리즘을 제안 하였다. 또한 multiple kernels 함수를 interval type-2 possibilistic fuzzy C-means(IT2PFCM) 알고리즘에 적용하여 분류하기 복잡한 형태의 데이터와 노이즈가 있는 데이터에 대하여 보다 정확하고, 향상된 클러스터링을 수행할 수 있다.

컬러 정보와 퍼지 C-means 알고리즘을 이용한 주차관리시스템 개발 (Developments of Parking Control System Using Color Information and Fuzzy C-menas Algorithm)

  • 김광백;윤홍원;노영욱
    • 지능정보연구
    • /
    • 제8권1호
    • /
    • pp.87-101
    • /
    • 2002
  • 본 논문에서는 컬러 정보와 퍼지 c-means 알고리즘을 이용한 차량 번호판 인식 방법을 제안하고 차량 번호판 인식을 이용한 주차관리시스템 개발에 대해서 기술한다 컬러 정보와 퍼지 c-means알고리즘을 이용한 차량 번호판 인식 기술은 차량의 영상에서 번호판을 추출하는 부분과 추출한 번호판 영역에서 문자를 인식하는 부분으로 구성된다 본 논문에서는 최빈수 평활화를 이용하여 차량 영상에서 녹색 잡음을 제거하고 RGB컬러에서 녹색 정보와 횐색 정보를 이용하여 번호판 영역을 추출하였다. 추출된 번호판 영역의 코드들은 히스토그램 방법을 이용하여 추출하였고 FCM(Fuzzy c-means) 알고리즘을 이용하여 차량 번호판을 인식하였다. 80개의 실제 차량 영상을 대상으로 실험한 결과는 제안된 번호판 영역 추출 방법이 기존의 RGB정보를 이용한 방법과 HSI를 이용한 방법보다 추출율이 개선되었다 그리고 FCM 알고리즘을 이용한 차량 번호판 인식이 효율적인 것을 확인하였다. 실험을 통하여 성능 향상을 보인 제안된 차량 번호판 방법을 이용하여 주차관리시스템을 개발하였다.

  • PDF

ON A CLASS OF BIVARIATE MEANS INCLUDING A LOT OF OLD AND NEW MEANS

  • Raissouli, Mustapha;Rezgui, Anis
    • 대한수학회논문집
    • /
    • 제34권1호
    • /
    • pp.239-251
    • /
    • 2019
  • In this paper we introduce a new formulation of symmetric homogeneous bivariate means that depends on the variation of a given continuous strictly increasing function on (0, ${\infty}$). It turns out that this class of means includes a lot of known bivariate means among them the arithmetic mean, the harmonic mean, the geometric mean, the logarithmic mean as well as the first and second Seiffert means. Using this new formulation we introduce a lot of new bivariate means and derive some mean-inequalities.