• 제목/요약/키워드: 계층적 군집법

검색결과 40건 처리시간 0.024초

한글 저자명 군집화를 위한 계층적 기법 비교 (Exploration of Hierarchical Techniques for Clustering Korean Author Names)

  • 강인수
    • 정보관리연구
    • /
    • 제40권2호
    • /
    • pp.95-115
    • /
    • 2009
  • 저자식별은 학술문헌에 출현한 동명저자명들을 실세계의 서로 다른 사람들로 대응시키는 것이다. 이를 위해 임의의 동명저자명쌍의 유사도를 계산하고 이를 바탕으로 동명저자명 개체들을 군집화하는 단계를 거친다. 저자명의 군집화 기법으로 주로 계층적 군집법이 사용되었으나 다양한 계층적 군집법에 대한 비교 평가는 미흡했다. 이 연구는 다이스계수, 코사인유사도, 유클리디안 거리, 자카드계수, 피어슨 상관계수 등의 다양한 개체거리/유사도수식과 계층적 군집법들의 상관관계와 계층적 군집기법들의 한글 저자식별 성능에 대한 비교/분석을 다룬다.

상수관로 누수위치 자료를 이용한 계층적 군집분석 (Hierarchical Clustering Analysis of Water Main Leak Location Data)

  • 박수완;임광채;최창록;김규리
    • 한국수자원학회논문집
    • /
    • 제42권3호
    • /
    • pp.177-190
    • /
    • 2009
  • 노후수도관 개량사업은 예산상, 시공상 등의 여러 제약조건에 의해서 장기적인 계획 하에 시행되게 된다. 본 연구에서는 연구대상지역에서 1992년부터 1997년 사이에 기록된 누수 위치좌표 약 8,000개를 이용하여 누수 위치들 간의 공간적 상관관계에 대한 계층적 군집분석을 수행한다. 계층적 군집분석방법 중 최단 연결법, 최장 연결법 및 평균 연결법을 적용하여 연구대상지역을 누수위치의 공간적 상관관계에 따라 분할하였으며, 각 군집 방법 별로 분할된 구역들을 비교하여 연구대상지역에 가장 적절한 군집 분석방법을 제시한다. 제시된 최적의 군집분석 방법을 이용하여 연구대상지역을 누수 위치들을 군집으로 분할한 후 군집으로 분할된 각 구역의 단위면적당 누수건수를 산정하고 이에 따라서 분할된 구역들에 대한 상수관망 유지관리 우선순위를 결정한다.

효모 마이크로어레이 유전자 발현 데이터에 대한 유전자 선별 및 군집분석 (Gene Screening and Clustering of Yeast Microarray Gene Expression Data)

  • 이경아;김태훈;김재희
    • 응용통계연구
    • /
    • 제24권6호
    • /
    • pp.1077-1094
    • /
    • 2011
  • 마이크로어레이 유전자 발현 데이터인 yeast cdc15에 대해 시계열 데이터의 특성을 반영한 푸리에 계수를 이용한 검정통계량과 FDR 다중비교법을 이용하여 차별화된 유전자를 선별한 후 선별된 유전자들에 대해 모형기반 군집방법, K-평균법, PAM, SOM, 계층적 Ward 군집방법과 Fuzzy 군집방법을 실시하였다. 군집방법에 따른 특성을 알아보고 군집화 결과와 내부유효성 측도로 연결성 측도, Dunn 지수와 실루엣 값을 살펴본다. 또한 GO분석을 통한 생물학적 의미도 파악해본다.

다단계 계층군집 영상분류법을 이용한 토지 피복 분석 (Analysis of Land-cover Types Using Multistage Hierarchical flustering Image Classification)

  • 이상훈
    • 대한원격탐사학회지
    • /
    • 제19권2호
    • /
    • pp.135-147
    • /
    • 2003
  • 본 연구는 한반도 위성 영상자료에 다단계 계층군집 영상분류법을 적용하여 관측지역의 피복특성을 분석한다. 다단계 계층군집 영상분류는 크게 두 단계로 이루어진다. 첫 번째 단계는 계층군집에 의해 공간적으로 근접하고 있는 이웃집단간의 결합을 하는 공간확장 영상분할 단계이고 두번째 단계는 결합지역의 공간적 제약 없이 영상분할 단계에서 분할된 집단을 계층군집에 의해 적은 한정적인 수의 클래스로 분류하는 과정이다. 계층군집 영상분류는 수치영상의 계층구조에 근거하여 매 단계 두 개의 집단을 한 개의 집단으로 합병하므로 클래스 수에 따른 분류집단 간의 관계를 나타내는 계층나무를 구성할 수 있다. 실험결과는 계층군집 영상분류에 의해 구성된 계층나무는 토지사용간의 계층구조를 자세히 밝혀주고 토지 피복 특성의 정확한 분석에는 좀 더 자세한 분광정보가 필요함을 보여주고 있다.

군집분석을 이용한 수도권 도시의 유형화에 관한 연구 (Charaterization of Cities in Seoul Metropolitan Area by Cluster Analysis)

  • 송민경;장훈
    • 대한공간정보학회지
    • /
    • 제18권1호
    • /
    • pp.83-88
    • /
    • 2010
  • 본 논문은 수도권 내 지역을 도시적 특성에 따라 군집 분석하여 수도권의 지역유형을 구분하고 그 특성을 파악하고자 하였다. 수도권 도시의 유형화를 위해 2005년을 시점으로 도시의 구성요소인 인구, 활동, 토지 및 시설을 나타내는 지표 10가지를 선정하였으며, 주성분분석을 통해 변수들의 공통된 특성이나 유사한 성질에 따라 공통인자를 추출하였다. 추출된 인자에 대한 인자득점을 이용하여 군집분석을 행하였고, 군집분석의 방법은 계층적 군집방법인 최단연결법, 최장연결법, 평균연결법, 와드법을 이용하였다. 그 결과 수도권을 5개의 군집으로 유형화 할 수 있었다.

효모 마이크로어레이 유전자발현 데이터에 대한 군집화 비교 (Comparison of clustering with yeast microarray gene expression data)

  • 이경아;김재희
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권4호
    • /
    • pp.741-753
    • /
    • 2011
  • 마이크로어레이 유전자 발현데이터인 효모데이터를 이용하여 군집분석을 실시하였다. 모형기반 군집방법, K-평균법, 중앙값 중심분포 (PAM), 자기 조직화 지도 (SOM), 계층적 Ward 군집방법을 이용하여 군집화를 실시하고, 연결성 측도 (connectivity), Dunn지수, 실루엣 측도 (silhouette)를 이용하여 각 군집방법에 대한 유효성을 측정하고 군집분석 결과를 비교하고자한다.

군집분석 비교 및 한우 관능평가데이터 군집화 (A Comparison of Cluster Analyses and Clustering of Sensory Data on Hanwoo Bulls)

  • 김재희;고윤실
    • 응용통계연구
    • /
    • 제22권4호
    • /
    • pp.745-758
    • /
    • 2009
  • 자발적인 군집을 유도하는 다변량 통계기법으로 널리 사용되는 군집분석은 데이터에 기반한 탐색적 방법으로 쓰이며 군집원칙에 따라 여러 가지 방법이 제안되어 왔다. 또한 군집화된 결과에 대하여 유효성을 측정하는 측도도 다양한방법이 개발되었다. 본 연구에서는 계층적 군집분석 방법으로 최장연결법과 Ward의 방법, 비계층적 군집분석 방법으로 K-평균법 그리고 확률분포정보를 활용한 모형기반 군집분석방법을 이용하여 모의실험으로 군집분석을 실시하고 군집유효성 측도로는 연결성, Dunn 지수, 실루엣을 구하여 각 군집방법에 대해 유효성을 비교한다. 또한, 한우 관능평가 데이터에 군집분석을 적용하여 최적의 군집 상황을 구하고자 한다.

우리나라 기상자료에 대한 군집분석 (Clustering analysis of Korea's meteorological data)

  • 여인권
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권5호
    • /
    • pp.941-949
    • /
    • 2011
  • 이 논문에서는 1999년 1월 1일부터 2010년 6월 30일까지 전국 72개 관측소에서 측정된 우리나라 기상자료를 평균연결법에 의한 계층적 병합방법을 통해 군집분석을 실시하고 각 기상자료에서 유도된 군집의 특성을 파악해 본다. 이 분석에서 유도된 군집과 2010년 기후변화에 따른 식중독 발생연구에서 사용되었던 산맥을 경계로 구분한 군집을 비교해 본다.

한강 유역에서의 강우 지역빈도 해석 방법의 비교 연구 (Comparative Study of Regional Frequency Analysis Methods of Rainfall in Han River Basin)

  • 엄명진;임승택;남우성;조원철;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2008년도 학술발표회 논문집
    • /
    • pp.1072-1076
    • /
    • 2008
  • 본 연구에서는 한강유역 109개 지점의 강우관측소에서 관측된 지속기간별 연최대강우량을 기본으로 각 지속기간별 L-모멘트값을 산정하고, 한강유역에 적합한 빈도해석기법을 정의하기 위하여 지역구분을 실시하였다. 지역구분을 위한 군집분석을 수행하기 위하여 각 지점별 기상학적 인자와 지형학적 인자를 변수로 사용하였다. 군집분석 기법인 Ward, 평균연결법, Fuzzy-c means, Two-Step방법을 이용하여 지역구분을 실시하였다. GIS를 이용하여 각 방법들을 이용하여 군집된 결과를 도시한 결과 Fuzzy-c means방법으로 구분된 지역구분이 적합한 것으로 나타났다. 또한 구분된 지역의 동질성 여부를 판단하고 적정 분포형을 선정하였으며 지점빈도해석 및 지역빈도해석을 통하여 빈도별 확률 수문량을 산정하였다. 산정된 결과의 정확도 알아보기 위해 모의발생을 시킨 후, 각 기법별로 산정된 상대 평균 제곱근 오차(Relative Root Mean Square Error, RRMSE)를 비교 분석한 결과 대체적으로 지수홍수법과 계층적 방법이 낮은 RRMSE를 나타냈다. 따라서 한강유역에서는 지수홍수법과 계층적 방법을 적용한 지역빈도해석이 적합한 것으로 판단된다.

  • PDF

태양 플레어 폭발 예보를 위한 흑점군 자동분석 프로그램 개발 (Development of an Automatic Program to Analyze Sunspot Groups for Solar Flare Forecasting)

  • 박종엽;문용재;최성환;박영득
    • 천문학회보
    • /
    • 제38권2호
    • /
    • pp.98-98
    • /
    • 2013
  • 태양의 활동영역에서 관측할 수 있는 흑점은 주로 흑점군으로 관측되며, 태양폭발현상의 발생을 예보하기 위한 중요한 관측 대상 중 하나이다. 현재 태양 폭발을 예보하는 모델들은 McIntosh 흑점군 분류법을 사용하며 통계적 모델과 기계학습 모델로 나누어진다. 컴퓨터는 흑점군의 형태학적 특성을 연속적인 값으로 계산하지만 흑점군의 형태적 다양성으로 인해 McIntosh 분류법과 일치하지 않는 경우가 있다. 이러한 이유로 컴퓨터가 계산한 흑점군의 형태학적인 특성을 예보에 직접 적용하는 것이 필요하다. 우리는 흑점군을 검출하기 위해 최소신장트리(Minimum spanning tree : MST)를 이용한 계층적 군집화 기법을 수행하였다. 그래프(Graph)이론에서 최소신장트리는 정점(Vertex)과 간선(Edge)으로 구성된 간선의 가중치의 합이 최소인 트리이다. 우리는 모든 흑점을 정점, 그들의 연결을 간선으로 적용하여 최소신장트리를 작성하였다. 또한 최소신장트리를 활용한 계층적 군집화기법은 초기값에 따른 군집화 결과의 차이가 없기 때문에 흑점군 검출에 있어서 가장 적합한 알고리즘이다. 이를 통해 흑점군의 기본적인 형태학적인 특성(개수, 면적, 면적비 등)을 계산하고 최소신장트리를 통해 가장 면적이 큰 흑점을 중심으로 트리의 깊이(Depth)와 차수(Degree)를 계산하였다. 이 방법을 2003년 SOHO/MDI의 태양 가시광 영상에 적용하여 구한 흑점군의 내부 흑점수와 면적은 NOAA에서 산출한 값들과 각각 90%, 99%의 좋은 상관관계를 가졌다. 우리는 이 연구를 통해 흑점군의 형태학적인 특성과 더불어 예보에 직접적으로 활용할 수 있는 방법을 논의하고자 한다.

  • PDF