• Title/Summary/Keyword: The optimal number of cluster

검색결과 125건 처리시간 0.023초

클러스터간 중첩성과 분리성을 이용한 퍼지 분할의 평가 기법 (A Cluster Validity Index Using Overlap and Separation Measures Between Fuzzy Clusters)

  • 김대원;이광형
    • 한국지능시스템학회논문지
    • /
    • 제13권4호
    • /
    • pp.455-460
    • /
    • 2003
  • 본 논문에서는 퍼지 클러스터링 알고리즘에 의해 구해진 퍼지 분할에 대한 최적 클러스터 수를 결정하는 방법을 제안한다. 제안된 척도는 퍼지 클러스터들간의 중첩성과 분리성을 이용한다. 중첩성은 클러스터간 인접도를 이용하여 계산하며, 분리성은 데이터에 대한 상관성 정도로 나타낸다. 따라서 중첩성이 낮고 분리성이 높을수록 좋은 클러스터 결과라고 할 수 있다. 표준 데이터 집합을 대상으로 기존의 척도들과 비교 실험함으로써 제안된 척도의 신뢰성을 검증하였다.

Fuzzy Training Based on Segmentation Using Spatial Region Growing

  • Lee Sang-Hoon
    • 대한원격탐사학회지
    • /
    • 제20권5호
    • /
    • pp.353-359
    • /
    • 2004
  • This study proposes an approach to unsupervisedly estimate the number of classes and the parameters of defining the classes in order to train the classifier. In the proposed method, the image is segmented using a spatial region growing based on hierarchical clustering, and fuzzy training is then employed to find the sample classes that well represent the ground truth. For cluster validation, this approach iteratively estimates the class-parameters in the fuzzy training for the sample classes and continuously computes the log-likelihood ratio of two consecutive class-numbers. The maximum ratio rule is applied to determine the optimal number of classes. The experimental results show that the new scheme proposed in this study could be used to select the regions with different characteristics existed on the scene of observed image as an alternative of field survey that is so expensive.

RGB 공간상의 국부 영역 블럭을 이용한 칼라 영상 양자화 (Color Image Quantization Using Local Region Block in RGB Space)

  • 박양우;이응주;김기석;정인갑;하영호
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1995년도 학술대회
    • /
    • pp.83-86
    • /
    • 1995
  • Many image display devices allow only a limited number of colors to be simultaneously displayed. In displaying of natural color image using color palette, it is necessary to construct an optimal color palette and map each pixel of the original image to a color palette with fast. In this paper, we proposed the clustering algorithm using local region block centered one color cluster in the prequantized 3-D histogram. Cluster pairs which have the least distortion error are merged by considering distortion measure. The clustering process is continued until to obtain the desired number of colors. Same as the clustering process, original color image is mapped to palette color via a local region block centering around prequantized original color value. The proposed algorithm incorporated with a spatial activity weighting value which is smoothing region. The method produces high quality display images and considerably reduces computation time.

Recommendation of Optimal Treatment Method for Heart Disease using EM Clustering Technique

  • Jung, Yong Gyu;Kim, Hee Wan
    • International Journal of Advanced Culture Technology
    • /
    • 제5권3호
    • /
    • pp.40-45
    • /
    • 2017
  • This data mining technique was used to extract useful information from percutaneous coronary intervention data obtained from the US public data homepage. The experiment was performed by extracting data on the area, frequency of operation, and the number of deaths. It led us to finding of meaningful correlations, patterns, and trends using various algorithms, pattern techniques, and statistical techniques. In this paper, information is obtained through efficient decision tree and cluster analysis in predicting the incidence of percutaneous coronary intervention and mortality. In the cluster analysis, EM algorithm was used to evaluate the suitability of the algorithm for each situation based on performance tests and verification of results. In the cluster analysis, the experimental data were classified using the EM algorithm, and we evaluated which models are more effective in comparing functions. Using data mining technique, it was identified which areas had effective treatment techniques and which areas were vulnerable, and we can predict the frequency and mortality of percutaneous coronary intervention for heart disease.

COREA 프로젝트를 위한 검출기 모의실험 (DETECTOR SIMULATIONS FOR THE COREA PROJECT)

  • 이성원;강혜성
    • 천문학논총
    • /
    • 제21권2호
    • /
    • pp.87-94
    • /
    • 2006
  • The COREA (COsmic ray Research and Education Array in Korea) project aims to build a ground array of particle detectors distributed over Korean Peninsular, through collaborations of high school students, educators, and university researchers, in order to study the origin of ultra high energy cosmic rays. COREA array will consist of about 2000 detector stations covering several hundreds of $km^2$ area at its final configuration and detect electrons and muons in extensive air-showers triggered by high energy particles. During the intial phase COREA array will start with a small number of detector stations in Seoul area schools. In this paper, we have studied by Monte Carlo simulations how to select detector sites for optimal detection efficiency for proton triggered air-showers. We considered several model clusters with up to 30 detector stations and calculated the effective number of air-shower events that can be detected per year for each cluster. The greatest detection efficiency is achieved when the mean distance between detector stations of a cluster is comparable to the effective radius of the air-shower of a given proton energy. We find the detection efficiency of a cluster with randomly selected detector sites is comparable to that of clusters with uniform detector spacing. We also considered a hybrid cluster with 60 detector stations that combines a small cluster with ${\Delta}{\iota}{\approx}100m$ and a large cluster with ${Delta}{\iota}{\approx}1km$. We suggest that it can be an ideal configuration for the initial phase study of the COREA project, since it can measure the cosmic rays with a wide range energy, i.e., $10^{16}eV{\leq}E{\leq}10^{19}eV$, with a reasonable detection rate.

Optimizing the maximum reported cluster size for normal-based spatial scan statistics

  • Yoo, Haerin;Jung, Inkyung
    • Communications for Statistical Applications and Methods
    • /
    • 제25권4호
    • /
    • pp.373-383
    • /
    • 2018
  • The spatial scan statistic is a widely used method to detect spatial clusters. The method imposes a large number of scanning windows with pre-defined shapes and varying sizes on the entire study region. The likelihood ratio test statistic comparing inside versus outside each window is then calculated and the window with the maximum value of test statistic becomes the most likely cluster. The results of cluster detection respond sensitively to the shape and the maximum size of scanning windows. The shape of scanning window has been extensively studied; however, there has been relatively little attention on the maximum scanning window size (MSWS) or maximum reported cluster size (MRCS). The Gini coefficient has recently been proposed by Han et al. (International Journal of Health Geographics, 15, 27, 2016) as a powerful tool to determine the optimal value of MRCS for the Poisson-based spatial scan statistic. In this paper, we apply the Gini coefficient to normal-based spatial scan statistics. Through a simulation study, we evaluate the performance of the proposed method. We illustrate the method using a real data example of female colorectal cancer incidence rates in South Korea for the year 2009.

텐서보팅과 마르코프 랜덤 필드를 이용한 자연 영상의 텍스트 이진화 (Natural Scene Text Binarization using Tensor Voting and Markov Random Field)

  • 최현수;이귀상
    • 스마트미디어저널
    • /
    • 제4권4호
    • /
    • pp.18-23
    • /
    • 2015
  • 본 논문에서는 텐서보팅을 이용하여 기존 마르코프 랜덤 필드 메소드 안의 가우시안 혼합 모델 함수의 성능을 향상시킬 수 있는 적합한 클러스터 개수 검출 방법을 제시한다. 제안하는 방법의 핵심 포인트는 텐서보팅의 인풋 데이터 토큰의 연속성인 saliency map을 통한 중심점 개수의 추출이다. 우리는 가장 먼저 주어진 자연 영상에서 전경 및 배경 후보 영역을 분리한다. 다음으로, 분리된 각 후보 영역에 대하여 텐서보팅을 적용하여 적절한 클러스터 개수를 추출한다. 우리는 검출된 클러스터 개수를 이용하여 정확한 가우시안 혼합 모델 모델링을 수행할 수 있다. 그리고 이를 적용한 마르코프 랜덤 필드의 unary term과 pairwise term을 계산하여 자연 영상의 텍스트 이진화 결과를 반환한다. 실험 결과, 제안된 방법이 최적의 클러스터 개수를 반환하고, 향상된 텍스트 이진화 결과를 반환함을 확인하였다.

Energy Saving in Cluster-Based Wireless Sensor Networks through Cooperative MIMO with Idle-Node Participation

  • Fei, Li;Gao, Qiang;Zhang, Jun;Wang, Gang
    • Journal of Communications and Networks
    • /
    • 제12권3호
    • /
    • pp.231-239
    • /
    • 2010
  • In cluster-based wireless sensor networks, the energy could be saved when the nodes that have data to transmit participate in cooperative multiple-input multiple-output (MIMO). In this paper, by making the idle nodes that have no data to transmit participate in the cooperative MIMO, it is found that much more energy could be saved. The number of the idle nodes that participate in the cooperative MIMO is optimized to minimize the total energy consumption. It is also found that the optimal number of all the nodes participating in cooperative communication does not vary with the number of nodes that have data to transmit. The proposition is proved mathematically. The influence of long-haul distance and modulation constellation size on the total energy consumption is investigated. A cooperative MIMO scheme with help-node participation is proposed and the simulation results show that the proposed scheme achieves significant energy saving.

연결도와 에너지 가중치 기반의 라우팅 프로토콜 (Routing Protocol based on Connectivity Degree and Energy Weight)

  • 정윤수
    • 중소기업융합학회논문지
    • /
    • 제4권1호
    • /
    • pp.7-15
    • /
    • 2014
  • 이 논문에서는 노드 당 소비 전력의 균형을 달성하기 위해 네트워크 수명의 최적 경로 탐색 과정을 달성하기 위한 효율적인 라우팅 프로토콜을 제안한다. 제안 프로토콜은 각 중간 노드가 전력 레벨 및 자식 노드의 분기 수를 유지하고 노드에 가장 가까운 이웃 노드로 데이터를 전송한다. 제안 프로토콜은 클러스터내에 존재하는 싱크의 수명을 연장시키기 위해서 각 노드의 에너지 소비를 최소화 한다. 또한, 제안 프로토콜은 노드의 잔류 에너지와 기지국과의 거리를 기준으로 인접한 중계 노드를 선택한다. 실험 결과, 제안 프로토콜은 기존 프로토콜에 비해 네트워크 내 잔존하는 노드들의 수명을 7.5 % 의 높였다.

  • PDF

자기조직화지도에서 연결강도에 기반한 새로운 군집타당성지수 (A new cluster validity index based on connectivity in self-organizing map)

  • 김상민;김재직
    • 응용통계연구
    • /
    • 제33권5호
    • /
    • pp.591-601
    • /
    • 2020
  • 자기조직화지도는 고차원의 원자료를 노드들로 이루어진 저차원의 공간으로 투영하는 비지도학습 방법이다. 이 방법은 고차원의 자료를 노드들을 사용하여 2 또는 3차원의 공간에서 시각화할 수 있고, 이를 통해 자료의 특성을 탐색하는데 유용하다. 자료의 구조를 파악하기 위해 종종 노드들에 대한 군집분석을 시도하는데, 군집분석의 중요한 문제중 하나는 군집의 개수를 결정하는 것이다. 이 문제를 해결하기 위해 다양한 군집타당성지수들이 지금까지 개발되어 왔고, 이러한 지수들은 자기조직화지도의 노드들의 군집분석에 직접적으로 적용될 수 있다. 그러나, 자기조직화 지도가 원자료의 위상적 특성을 저차원 공간에 반영할 수 있다는 특징을 갖는데 반해, 이러한 일반적인 지수들은 이를 고려하지 않는 문제가 있다. 이에 본 연구에서는 원자료의 위상적 특성을 고려한 노드들 사이의 연결강도를 기반으로 하는 군집타당성지수를 제안한다. 이 새로운 군집타당성지수의 성능은 모의실험을 통해 기존의 군집타당성지수들과의 비교되고 검증된다.