• 제목/요약/키워드: and clustering

검색결과 5,621건 처리시간 0.029초

계층 발생 프레임워크를 이용한 군집 계층 시각화 (Visualizing Cluster Hierarchy Using Hierarchy Generation Framework)

  • 신동화;이세희;서진욱
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권6호
    • /
    • pp.436-441
    • /
    • 2015
  • 군집화 알고리즘은 그 종류에 따라 만들어낼 수 있는 군집의 종류와 보여줄 수 있는 정보의 수준이 차이가 난다. 밀도기반 군집화 알고리즘은 데이터 분포 상의 임의의 모양을 가진 군집을 잘 잡아내지만 보여줄 수 있는 계층정보가 매우 적거나 없는 수준이고, 반면 계층적 군집화 알고리즘은 자세한 계층 정보를 보여주지만 구 모양의 군집 외에는 잘 잡아내지 못한다. 이 논문에서는 이러한 두 군집화 방식의 대표적 알고리즘인 OPTICS와 응집 계층 군집화 알고리즘의 장점만을 취하는 계층 발생 프레임워크를 제시하고 이와 더불어 효과적 데이터 분석을 위한 여러 시각화, 상호작용 기법을 지원하는 시각적 분석 애플리케이션을 제공한다.

퍼지 클러스터링을 이용한 칼라 영상 분할 (A study on the color image segmentation using the fuzzy Clustering)

  • 이재덕;엄경배
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 1999년도 춘계종합학술대회
    • /
    • pp.109-112
    • /
    • 1999
  • Image segmentation is the critical first step in image information extraction for computer vision systems. Clustering methods have been used extensively in color image segmentation. Most analytic fuzzy clustering approaches are divided from the fuzzy c-means(FCM) algorithm. The FCM algorithm uses fie probabilistic constraint that the memberships of a data point across classes sum to 1. However, the memberships resulting from the FCM do not always correspond to the intuitive concept of degree of belonging or compatibility. Moreover, the FCM algorithm has considerable trouble under noisy environments in the feature space. Recently, a possibilistic approach to clustering(PCM) for solving above problems was proposed. In this paper, we used the PCM for color image segmentation. This approach differs from existing fuzzy clustering methods for color image segmentation in that the resulting partition of the data can be interpreted as a possibilistic partition. So, the problems in the FCM can be solved by the PCM. But, the clustering results by the PCM are not smoothly bounded, and they often have holes. The region growing was used as a postprocessing after smoothing the noise points in the pixel seeds. In our experiments, we illustrate that the PCM us reasonable than the FCM in noisy environments.

  • PDF

한글 저자명 군집화를 위한 계층적 기법 비교 (Exploration of Hierarchical Techniques for Clustering Korean Author Names)

  • 강인수
    • 정보관리연구
    • /
    • 제40권2호
    • /
    • pp.95-115
    • /
    • 2009
  • 저자식별은 학술문헌에 출현한 동명저자명들을 실세계의 서로 다른 사람들로 대응시키는 것이다. 이를 위해 임의의 동명저자명쌍의 유사도를 계산하고 이를 바탕으로 동명저자명 개체들을 군집화하는 단계를 거친다. 저자명의 군집화 기법으로 주로 계층적 군집법이 사용되었으나 다양한 계층적 군집법에 대한 비교 평가는 미흡했다. 이 연구는 다이스계수, 코사인유사도, 유클리디안 거리, 자카드계수, 피어슨 상관계수 등의 다양한 개체거리/유사도수식과 계층적 군집법들의 상관관계와 계층적 군집기법들의 한글 저자식별 성능에 대한 비교/분석을 다룬다.

무선센서네트워크에서의 에너지 효율적인 재클러스터링 알고리즘 (An Energy Efficient Re-clustering Algorithm in Wireless Sensor Networks)

  • 박혜빈;정진우
    • 한국인터넷방송통신학회논문지
    • /
    • 제15권3호
    • /
    • pp.155-161
    • /
    • 2015
  • 무선 센서 네트워크에서 효율적인 에너지 소비는 매우 중요한 이슈이다. 해당 이슈에 대해서 최근 연구들에서는 클러스터 기반 라우팅 프로토콜들을 해법으로 제시하고 있다. 이러한 프로토콜에서는 클러스터 헤드의 에너지 고갈을 방지하기 위해 재클러스터링이 필요한데, 재클러스터링 과정에서 발생하는 오버헤드도 적지 않다. 지나치게 빈번한 재클러스터링으로 인한 오버헤드를 줄이기 위해서 본 연구에서는 클러스터 헤드와 에너지 임계값의 비교를 통해 재클러스터링의 빈도를 조절하는 알고리즘을 제안하였다. 클러스터 헤드가 에너지 임계값보다 높은 에너지 수준을 가지고 있을 경우 클러스터를 유지하여 재클러스터링으로 인한 오버헤드를 줄였고, 낮을 경우 재클러스터링을 하여, 클러스터 헤드의 수명을 최대한 연장하였다. 제안한 알고리즘을 시뮬레이션을 통해 평가하여 기존 알고리즘 대비 우수한 에너지 효율을 가지는 것을 확인하였다.

무선 센서 네트워크에서 싱크노드와 인접한 노드의 균등한 에너지 소모를 위한 클러스터링 알고리즘 (Clustering Algorithm to Equalize the Energy Consumption of Neighboring Node on Sink in Wireless Sensor Networks)

  • 정진욱;진교홍
    • 한국정보통신학회논문지
    • /
    • 제12권6호
    • /
    • pp.1107-1112
    • /
    • 2008
  • 무선 센서 네트워크의 클러스터링(Clustering)기법은 센서 노드의 에너지 소모를 최소화하기 위한 목적으로 개발되어 Network Lifetime을 증대시키는 효과를 보인다. 기존의 클러스터링 기법들은 센서 노드들이 CH(Cluster Head) 역할을 교대로 수행함으로써 각 노드의 에너지 소모를 균등하도록 하여 Network Lifetime을 향상시키는 방법을 제안하였지만, 싱크(Sink) 노드와 인접한 노드들의 에너지 소모를 최소화하는 방안은 제시하지 못했다. 본 논문에서는 싱크 노드의 POS(Personal Operating Space)내에 존재하는 인접 노드들의 일부를 클러스터의 멤버(Member) 노드로 가입시키지 않고, 직접 싱크 노드와 통신하게 함으로써 싱크 노드와 인접한 CH의 에너지 소모를 줄여 Network Lifetime을 연장하는 클러스터링 알고리즘을 제안하였다.

유전자 알고리즘을 이용한 클러스터링 기반 협력필터링 (Clustering-based Collaborative Filtering Using Genetic Algorithms)

  • 이수정
    • 창의정보문화연구
    • /
    • 제4권3호
    • /
    • pp.221-230
    • /
    • 2018
  • 추천 시스템의 주요 방법인 협력 필터링 기술은 실제 상업용 온라인 시스템에서 성공적으로 구현되어 서비스가 제공되고 있다. 그러나, 이 기술은 본질적으로 여러 가지 단점을 내포하는데, 데이터 희소성, 콜드 스타트, 확장성 문제 등이 그 예이다. 확장성 문제를 해결하기 위하여 클러스터링 기법을 활용한 협력 필터링 방법이 연구되어 왔다. 본 연구에서 제안하는 협력 필터링 시스템에서는 가장 널리 활용되는 클러스터링 기법들 중 하나인 K-means 알고리즘의 단점을 개선하고자 유전자 알고리즘을 이용한다. 또한, 기존 연구에서 최적화된 클러스터링 결과를 추구하였던 것과는 달리, 제안 방법은 클러스터링 결과를 활용한 협력 필터링 시스템 성능의 최적화를 목표로 하므로, 실질적으로 시스템의 성능을 향상시킬 수 있다.

칼라 특징 값을 이용한 correspondence 와 clustering (Correspondence and clustering using color features)

  • 김성동;진성아;주문원
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2001년도 추계학술발표논문집
    • /
    • pp.177-181
    • /
    • 2001
  • 본 논문에서는 칼라차 영상을 이용하여 물체들의 움직임을 분석하고 이동 형태들의 대한 RGB 특징 값을 추출하였으며 그 동안 미해결 과제로 남았던 이동 물체들 사이의 영역정합(matching)과 군집화 (clustering)를 이용하여 대응(Correspondence)관계를 확인하는 문제를 해결하여 이동 물체들을 추구하여 보았다.

  • PDF

Bayesian Curve Clustering in Microarray

  • 이경은
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 한국데이터정보과학회 2006년도 PROCEEDINGS OF JOINT CONFERENCEOF KDISS AND KDAS
    • /
    • pp.39-42
    • /
    • 2006
  • We propose a Bayesian model-based approach using a mixture of Dirichlet processes model with discrete wavelet transform, for curve clustering in the microarray data with time-course gene expressions.

  • PDF

공간데이타 마이닝을 위한 효율적인 그리드 셀 기반 공간 클러스터링 알고리즘 (An Efficient Grid Cell Based Spatial Clustering Algorithm for Spatial Data Mining)

  • 문상호;이동규;서영덕
    • 정보처리학회논문지D
    • /
    • 제10D권4호
    • /
    • pp.567-576
    • /
    • 2003
  • 대용량의 공간데이터베이스로부터 암시적이고 유용한 지식을 자동적으로 추출하는 공간데이터 마이닝은 데이타 양이 급격히 증가하면서 필요성이 더욱 증대되고 있다. 공간데이터 마이닝에서 데이타를 분석하여 유사한 그룹으로 분류하는 공간 클러스터링은 매우 중요한 분야이다. 기존 연구에서 공간 클러스터링을 위한 여러 가지 알고리즘들이 제시되었지만, 다음과 같은 문제점들이 있다. 먼저 클러스터링을 위하여 객체들 간의 거리론 기반으로 하므로 데이타 양이 많아질수록 계산 비용이 커진다. 또한, 메모리 상주 데이타를 대상으로 하므로 대용량의 데이타인 경우에 효율이 떨어진다. 본 논문에서는 공간데이터 마이닝을 위하여 그리드 셀을 기반으로 한 효율적인 공간 클러스터링 방법을 제시한다. 이 클러스터링에서는 기존 공간 클러스터링 기법들의 문제점을 해결하는데 중점을 둔다. 세부적으로 공간 클러스터링의 효율성을 높이기 위하여 클러스터링시에 발생하는 비용(계산량)을 감소시키는 것이다. 이를 위해서 공간지역성을 보장하는 대표적인 공간분할 방법인 그리드 셀을 기반으로 한 공간 클러스터링 기법을 제시한다.

흡연, 음주와 운동습관의 군집현상을 통한 건강행태의 고위험군: 국민건강영양 조사 (High Risk Groups in Health Behavior Defined by Clustering of Smoking, Alcohol, and Exercise Habits: National Heath and Nutrition Examination Survey)

  • 강기원;성주헌;김창엽
    • Journal of Preventive Medicine and Public Health
    • /
    • 제43권1호
    • /
    • pp.73-83
    • /
    • 2010
  • Objectives: We investigated the clustering of selected lifestyle factors (cigarette smoking, heavy alcohol consumption, lack of physical exercise) and identified the population characteristics associated with increasing lifestyle risks. Methods: Data on lifestyle risk factors, sociodemographic characteristics, and history of chronic diseases were obtained from 7,694 individuals ${\geq}20$ years of age who participated in the 2005 Korea National Health and Nutrition Examination Survey (KNHANES). Clustering of lifestyle risks involved the observed prevalence of multiple risks and those expected from marginal exposure prevalence of the three selected risk factors. Prevalence odds ratio was adopted as a measurement of clustering. Multiple correspondence analysis, Kendall tau correlation, Man-Whitney analysis, and ordinal logistic regression analysis were conducted to identify variables increasing lifestyle risks. Results: In both men and women, increased lifestyle risks were associated with clustering of: (1) cigarette smoking and excessive alcohol consumption, and (2) smoking, excessive alcohol consumption, and lack of physical exercise. Patterns of clustering for physical exercise were different from those for cigarette smoking and alcohol consumption. The increased unhealthy clustering was found among men 20-64 years of age with mild or moderate stress, and among women 35-49 years of age who were never-married, with mild stress, and increased body mass index (>$30\;kg/m^2$). Conclusions: Addressing a lack of physical exercise considering individual characteristics including gender, age, employment activity, and stress levels should be a focus of health promotion efforts.