• 제목/요약/키워드: 군집타당성지수

검색결과 4건 처리시간 0.019초

자기조직화지도에서 연결강도에 기반한 새로운 군집타당성지수 (A new cluster validity index based on connectivity in self-organizing map)

  • 김상민;김재직
    • 응용통계연구
    • /
    • 제33권5호
    • /
    • pp.591-601
    • /
    • 2020
  • 자기조직화지도는 고차원의 원자료를 노드들로 이루어진 저차원의 공간으로 투영하는 비지도학습 방법이다. 이 방법은 고차원의 자료를 노드들을 사용하여 2 또는 3차원의 공간에서 시각화할 수 있고, 이를 통해 자료의 특성을 탐색하는데 유용하다. 자료의 구조를 파악하기 위해 종종 노드들에 대한 군집분석을 시도하는데, 군집분석의 중요한 문제중 하나는 군집의 개수를 결정하는 것이다. 이 문제를 해결하기 위해 다양한 군집타당성지수들이 지금까지 개발되어 왔고, 이러한 지수들은 자기조직화지도의 노드들의 군집분석에 직접적으로 적용될 수 있다. 그러나, 자기조직화 지도가 원자료의 위상적 특성을 저차원 공간에 반영할 수 있다는 특징을 갖는데 반해, 이러한 일반적인 지수들은 이를 고려하지 않는 문제가 있다. 이에 본 연구에서는 원자료의 위상적 특성을 고려한 노드들 사이의 연결강도를 기반으로 하는 군집타당성지수를 제안한다. 이 새로운 군집타당성지수의 성능은 모의실험을 통해 기존의 군집타당성지수들과의 비교되고 검증된다.

고차원 (유전자 발현) 자료에 대한 군집 타당성분석 기법의 성능 비교 (Comparison of the Cluster Validation Methods for High-dimensional (Gene Expression) Data)

  • 정윤경;백장선
    • 응용통계연구
    • /
    • 제20권1호
    • /
    • pp.167-181
    • /
    • 2007
  • 유전자 발현 자료(gene expression data)는 전형적인 고차원 자료이며, 이를 분석하기 위한 여러 가지 군집 알고리즘(clustering algorithm)과 군집 결과들을 검증하는 군집타당성분석 기법(cluster validation technique)이 제안되고 있지만, 이들 군집 타당성을 분석하는 기법의 성능에 대한 비교, 평가는 매우 드물다. 본 논문에서는 저차원의 모의실험 자료와 실제 유전자 발현 자료에 대하여 군집 타당성분석 기법들의 성능을 비교하였으며, 그 결과 내적 측도에서는 Dunn 지수, Silhouette 지수 순으로 뛰어났고 외적 측도에서는 Jaccard 지수가 성능이 가장 우수한 것으로 평가되었다.

개미 군집 최적화 알고리즘과 센티워드넷을 이용한 사용자 감성 동향 분석 방법 연구 (A Study on Sentiment Trend Analysis Method Using Ant Colony Optimization Algorithm and SentiWordNet)

  • 권경락;강대현;최수봉;박한샘;정인정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.948-951
    • /
    • 2014
  • 본 논문에서는 개미 군집 최적화 알고리즘과 센티워드넷(SentiWordNet)을 이용한 감성 분석 방법을 제안한다. 먼저, 데이터 수집 단계에서는 소설 웹(예: 페이스북)으로부터 주어 (subject), 서술어(predicate), 목적어(object)의 3 개의 요소로 구성된 RDF (Resource Description Framework)의 형태로 데이터를 수집한다. 그리고 개미 군집 최적화 알고리즘을 이용하여 수집된 RDF 튜플(tuple)을 수치화한 후, 사용자의 감성에 대하여 제안한 수식을 이용하여 페르몬(pheromone)을 계산한다. 센티워드넷을 통하여 얻은 감성 지수를 반영하여 이전 단계에서 계산된 여러 개의 페르몬 값에 대한 전체 감성 지수를 계산한다. 제안한 방법의 타당성 검증을 위하여 전체 감성 지수를 바탕으로 계산된 사용자의 감성 동향이 적절하게 분석됨을 사용자의 실제 생활과의 비교를 통하여 보인다.

인공어초의 기능도와 성숙도 평가를 위한 생태학적 지수에 대한 연구 (A Study on the Ecological Indices for the Assessment of the Function and Maturity of Artificial Reefs)

  • 유재원;홍현표;황재연;이민수;이용우;이채성;황선도
    • 한국해양학회지:바다
    • /
    • 제19권1호
    • /
    • pp.8-34
    • /
    • 2014
  • 국외의 대형 무척추동물과 해조류 군집을 대상으로 해역의 생태학적 상태를 평가하는 모델을 이용하여 인공어초와 인접한 자연초의 상태를 비교함으로써 우리나라 연안역에 설치된 인공어초의 기능도(FI, Functional Index; 군집구조의 안정성과 생산성의 추정)와 성숙도(MI, Maturity Index; 자연초 생물학적 패러미터와의 비교)를 평가할 수 있는, 복수의 생태학적 지수(ecological index)로 구성된 시스템을 개발하였다. 이 생태평가 모델을 서해안 연안바다목장 5개 지역(백령-대청, 연평, 태안, 서천 그리고 부안)의 자연초와 인공어초 또는 어초시설예정지(자연초)에 적용한 결과, 기능도(FI)는 지역별로 평균 31.6%(백령-대청)부터 72.5%(부안), 성숙도(MI)는 53.1%(서천)부터 76.9%(태안)의 범위를 나타내었다. 인공어초의 기능도와 성숙도는 태안에서 가장 양호하였으며, 인접한 인공어초와 자연초 간의 FI는 유의한 선형 관계를 갖는 것으로 나타났다($r^2=0.83$, p=0.01). 이 같은 결과는 그 해역의 생물 군집의 상태가 어초의 기능도를 결정하는 데에 중요한 요인으로 작용할 수 있음을 의미한다. 생태학적 상태에 대한 평가 결과는 효율적인 재원의 활용과 의사 결정에 책임이 있는 환경 및 자원 관리자에게 중요한 정보로 활용될 수 있을 것이다. 평가 결과의 정확도를 개선하고 강화하기 위해 다음과 같은 세 가지가 필요하다: (1)평가 결과의 타당성 검증과 이에 기초한 지시자 기준의 보정(rescaling)을 지속하고, (2) 시스템의 적용 및 자료의 축적을 통해 획득된 관찰과 경험을 적극적으로 활용하며, (3) 새로운 지수들을 지속적으로 개발, 검증하고 추가해 나가는 노력이 요구된다.