• Title/Summary/Keyword: 덴드로그램

Search Result 14, Processing Time 0.026 seconds

Reachability Plot for Non-monotonic Dendrograms (비단조적 덴드로그램을 위한 Reachability Plot)

  • Jeon, Yong-Kweon;Lee, Tae-Hoon;Lee, Byung-Han;Yoon, Sung-Roh
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06b
    • /
    • pp.441-443
    • /
    • 2012
  • 계층 군집화 (Hierarchical Clustering)는 전역정보를 활용하여 군집화를 하기 때문에 다양한 군집 분석(Cluster Analysis) 방법들 중에 비교적 많이 이용되고 있으나 군집화의 결과를 덴드로그램의 형태로 나타내 전체 군집들의 정보를 직관적으로 확인하기에는 어려움이 존재한다. 이러한 문제를 개선하기 위해서 기존 Dendrogram의 정보를 크게 훼손하지 않고 직관적으로 클러스터의 정보를 확인할 수 있는 Reachability plot이 개발되었다. 그러나 Centroid Linkage 방식과 같이 덴드로그램이 비단조적이 될 수 있는 계층 군집화에서는 이것을 기존의 Reachability plot 방식으로 변환할 경우 정보가 왜곡 되어 나타날 수 있다. 따라서 우리는 이러한 문제를 해결하기 위한 방법을 제안함으로써 비단조적 덴드로그램의 경우에도 군집들을 정보의 왜곡 없이 표현할 수 있도록 하였다.

Clustering and Leaf Ordering for Gene Expression Profiles (유전자 발현 데이터에 대한 클러스터링과 리프오더링 연구)

  • 여상수;이정원;김성권
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.736-738
    • /
    • 2002
  • 계층적 클러스터링(hierarchical clustering)은 유전자 발현 데이터를 분석할 때 일반적으로 사용하는 방법이다. 계층적 클러스터링의 결과물은 유전자 발현 데이터의 덴드로그램이다. 이 덴드로그램에서 인접한 리프 노드들간의 유사도는 높아지게 하고 멀리 떨어진 노드들간의 유사도는 낮아지게 하기 위해서, 리프 노드들을 재배열하는 과정을 리프오더링이라고 한다. 본 논문에서는 전체 리프 노드들을 대상으로 하는 리프오더링 알고리즘들을 변형하여 각 클러스터별로 리프오더링을 하는 접근방식을 제안하고, 기존의 리프오더링 알고리즘을 사용했을 때의 결과와 제안하는 접근방식을 사용했을 때의 결과를 비교 분석하였다.

  • PDF

Strategy for Visual Clustering (시각적 군집분석에 대한 전략)

  • 허문열
    • The Korean Journal of Applied Statistics
    • /
    • v.14 no.1
    • /
    • pp.177-190
    • /
    • 2001
  • 전통적으로 많이 사용하는 군집분석의 방법들은 개체간의 거리를 고려하여 이들을 분류해 내는 것이며, 따라서 거리 측정 방법에 따라 여러 형태의 군집분석 방법이 나타나게 된다. 어떤 방법을 적용하던 간에 그 결과는 고정된 수치로써 나타난다. 다차원 자료의 구조파악이 몇 개의 수치로 나타나게 되면 어쩔 수 없이 정보의 손실이 발생하게 된다. 이를 보완하기 위해 시각적 매체를 동원하여 다차원 자료의 구조를 파악하는 연구가 있었으며, 이를 시각적 군집분석이라고 명명하고 있다. 본 연구에서는 시각적 군집분석에 대한 기본적 개념과 이를 위한 통계 도형의 활용, 구현방법 등에 대해 살펴보기로 한다.

  • PDF

Categorical Data Analysis by Using Spatial Scan Statistics and Echelon Analysis

  • Mun, Seung-Ho;Sin, Jae-Gyeong
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 2004.04a
    • /
    • pp.183-194
    • /
    • 2004
  • 본 연구에서는 공간 검색 통계량(spatial scan statistics)과 에셜론 해석법을 이용한 범주형 자료분석을 다룬다. 이를 위해 우선, 에셜론 덴드로그램을 이용하여 주어진 분활표의 계층적 구조(hierarchical structure)를 결정하고서 이로부터 핫스팟(hotspot)의 후보를 검출한다. 다음으로 우도비(likelihood ratio)를 기초로 유의하게 높거나 낮게 나타나는 지역에 대한 공간 검색 통계량을 산출한다. 마지막으로, 이 통계량을 바탕으로 핫스팟을 검출한다.

  • PDF

A Reviews on the Performance Evaluation Based on Network Analysis and Super-Efficiency Analysis (연결망분석과 초효율성분석의 결합을 통한 효율성 순위 측정에 관한 고찰)

  • Choi, Kyoung-Ho;Kwag, Hee-Jong
    • Journal of Digital Convergence
    • /
    • v.11 no.10
    • /
    • pp.255-262
    • /
    • 2013
  • Data envelopment analysis(DEA) is a linear programming procedure designed to evaluate the relative efficiency of a set of peer entities called decision making units which use the same inputs to produce the same outputs. It has been widely employed in a variety of disciplines as an efficiency or performance measurement tool for comparing a set of entities such as firms, banks, hospitals, nations and organizations. The method, however, cant's make the priority of their performance when many units have efficiency score of unity or 100 percent. In this paper, we propose a new approach which combine qualitative method(graphical approach using network analysis) and quantitative method(super-efficient analysis using DEA), and present the results of an empirical analysis using the data of the Korean professional baseball players. As a result, there were 12 DMU that priority is hardly realized through DEA. However, this problem could be solved with super-efficiency analyzing. Also, more in-depth interpretation was able through integrating results of dendrogram and super-efficiency analyzing and prospecting it in qualitative, quantitative ways.

Design of OTP based on Mobile Device using Voice Characteristic Parameter (음성 특징 파라메터를 이용한 모바일 기반의 OTP 설계)

  • Cha, Byung-Rae;Kim, Nam-Ho;Kim, Jong-Won
    • Journal of Advanced Navigation Technology
    • /
    • v.14 no.4
    • /
    • pp.512-520
    • /
    • 2010
  • As the applications based on Mobile and Ubiquitous becoming more extensive, the communication security issues of those applications are appearing to be the most important concern. Therefore, every part of the system should be thoroughly designed and mutually coordinated in order to support overall security of the system. In this paper. we propose new technique which uses the voice features in order to generate Mobile One Time Passwords(OTPs). Voice is considered to be one of the powerful personal authentication factors of biometrics and it can be used for generating variable passwords for one time use. Also we performed a simulation of homomorphic variability of voice feature points using dendrogram and distribution of voice feature points for proposed password generation method.

Development of Clustering Algorithm and Tool for DNA Microarray Data (DNA 마이크로어레이 데이타의 클러스터링 알고리즘 및 도구 개발)

  • 여상수;김성권
    • Journal of KIISE:Computer Systems and Theory
    • /
    • v.30 no.10
    • /
    • pp.544-555
    • /
    • 2003
  • Since the result data from DNA microarray experiments contain a lot of gene expression information, adequate analysis methods are required. Hierarchical clustering is widely used for analysis of gene expression profiles. In this paper, we study leaf-ordering, which is a post-processing for the dendrograms output by hierarchical clusterings to improve the efficiency of DNA microarray data analysis. At first, we analyze existing leaf-ordering algorithms and then present new approaches for leaf-ordering. And we introduce a software HCLO(Hierarchical Clustering & Leaf-Ordering Tool) that is our implementation of hierarchical clustering, some of existing leaf-ordering algorithms and those presented in this paper.

Assessment of water quality monitoring system in reservoir (저수지 수질측정망 평가)

  • Lee, Yo-Sang;Lee, Gwang-Man
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2012.05a
    • /
    • pp.185-185
    • /
    • 2012
  • 수질관리에 있어서 무엇보다도 중요한 것이 신뢰성 있는 수질자료를 확보하는 것이다. 우리나라는 원수수질관리를 위해 1970년대 후반부터 수질측정망 단위의 정기적 수질측정이 이루어지기 시작하여 2008년에는 1,476개 지점으로 운영되고 있다. 수질모니터링은 조사지점, 수질항목, 측정 주기 등이 매우 중요한 요인이 되며, 이중에서 특히 조사지점은 가장 중요한 사항으로 판단된다. 그러나 지금까지 저수지에서 수질조사를 위한 관측지점은 대부분 정성적 판단에 따라 정해져 왔기 때문에 수질대표성에 문제가 되기도 하였다. 본 논문에서는 이와같은 수질측정망 구축시 문제점을 개선하기 위해 과학적인 통계기법을 적용한 수질측정망 구축방안을 제시하였다. 구축된 수질 측정망 구축시스템은 통계적 분석기법을 기반으로 만들었으며, 이용자의 사용 편의성을 고려하여 간단한 입력으로 측정망을 구축할 수 있는 체계로 구성하였다. 시스템에서는 시계열분석과 유사성 계산을 실시하여 덴드로그램으로 결과를 제시하며, 이용자가 최종 산점도 출력시스템에 원하는 군집의 개수를 입력하면 수질 특성 파악이 가능한 주성분 산점도가 출력되도록 하였고, 군집 내 관측지점의 중심점을 대표지점으로 선정하도록 되어있다. 본 논문에서는 기존에 운영되고 있는 저수지 수질측정지점을 대상으로 분석을 실시하였다. 그러나 기존 측정지점의 개수가 적어 통계분석 결과 적용에 한계가 있어 수질모델링을 통한 수질자료 증폭을 실시하였으며, 이를 바탕으로 다수의 측정지점을 대상으로 수질측정망 평가를 실시하였다. 본 논문에서는 용담댐, 밀양댐, 충주댐, 안동댐 및 남강댐을 대상으로 평가를 실시하였으며, 약간의 지점변동이 필요한 것으로 평가되었다.

  • PDF

Analysis of Genetic Relationship among Cymbidium germplasms Using RAPD and URP (RAPD와 URP를 이용한 심비디움 유전자원 유연관계 분석)

  • Park, Pue Hee;Kim, Mi Seon;Lee, Young Ran;Park, Pil Man;Lee, Dong Soo;Yae, Byeong Woo
    • FLOWER RESEARCH JOURNAL
    • /
    • v.18 no.3
    • /
    • pp.201-206
    • /
    • 2010
  • The genetic relationship among 48 Cymbidium cultivars was analyzed using randomly amplified polymorphic DNA (RAPD) with eighty 10 mers random primers (Operon Technologies) and twelve 20 mers random primers. Forty eight Cymbidium cultivars included 34 oriental Cymbidium, 7 hybrids, and 7 western Cymbidium. 407 (9.9 per primer) and 56 polymorphic bands (9.5 per primer) were generated by polymerase chain reaction with selected thirty 10 mers primers, and nine 20 mers primers, respectively. The polymorphic fragments ranged from 0.4 to 1.5 kb in size. The dendrogram was constructed by using the UPGMA clustering algorithm based on genetic similarity. Forty eight Cymbidium cultivars were classified into four major groups at similarity coefficient value of 0.638.

Microarray data analysis using relative hierarchical clustering (상대적 계층적 군집 방법을 이용한 마이크로어레이 자료의 군집분석)

  • Woo, Sook Young;Lee, Jae Won;Jhun, Myoungshic
    • Journal of the Korean Data and Information Science Society
    • /
    • v.25 no.5
    • /
    • pp.999-1009
    • /
    • 2014
  • Hierarchical clustering analysis helps easily exploring massive microarray data and understanding biological phenomena with dendrogram. But, because hierarchical clustering algorithms only consider the absolute similarity, it is difficult to illustrate a relative dissimilarity, which consider not only the distance between a pair of clusters, but also how distant are they from the rest of the clusters. In this study, we introduced the relative hierarchical clustering method proposed by Mollineda and Vidal (2000) and compared hierarchical clustering method and relative hierarchical method using the simulated data and the real data in the various situations. The evaluation of the quality of two hierarchical methods was performed using percentage of incorrectly grouped points (PIGP), homogeneity and separation.