• 제목/요약/키워드: K-medoid

검색결과 6건 처리시간 0.016초

유전자 알고리즘에 기반한 K-medoid 클러스터링 알고리즘에서의 최적의 k-탐색과 적용 (Optimal k-search and Its Application in k-medoid Clustering Algorithm based on Genetic Algorithm)

  • 안선영;윤혜성;이상호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (A)
    • /
    • pp.55-57
    • /
    • 2006
  • k-medoid 클러스터링 알고리즘은 고정된 클러스터 수(k)를 가지고 실험하기 때문에 데이터에 대한 사전 지식이 없으면 올바른 분석이 어렵고, 클러스터 수를 변경하면서 여러 번 반복 실험하여 실험 결과에 대한 타당성을 조사해야 하기 때문에 데이터의 크기가 커질수록 시간 비용이 증가하는 단점이 생긴다. 본 논문에서는 k-medoid 클러스터링 알고리즘 분석에 있어서 가장 어려운 문제 중 하나인 적절한 클러스터 수 k를 사회 네트워크 분석 방법 중 매개중심 값을 이용하여 찾는 새로운 방법을 제안하고 이를 실제 마이크로 어레이 데이터에 적용하여 유전자 알고리즘에 기반한 k-medoid 클러스터링을 수행함으로써 좀 더 정확한 클러스터링 결과를 보인다.

  • PDF

한국 철강산업 변화와 기술지식 네트워크 형성 과정 (Changes in Korea Steel Industry and Formation Process of Technology-knowledge network)

  • 박소현
    • 한국경제지리학회지
    • /
    • 제19권3호
    • /
    • pp.474-490
    • /
    • 2016
  • 본 논문은 국내 철강산업이 어떻게 기술적 다양화, 조직적 유연화, 지리적 분산화를 경험했는지 조사하고, 그 과정 속에서 기술지식 네트워크가 어떠한 방식으로 형성되었는지 분석했다. 특허 공동출원 자료를 기반으로 기술지식 네트워크를 구축하고, 각 2003년과 2013년 누적네트워크에 대한 k-medoid 클러스터링 분석 및 브로커리지 분석을 실시했다. 그 결과 네트워크 내 행위자가 점차 다양해진 동시에 동일 클러스터 내 내부성이 강화되었고, 산업 내 조직간 소속, 경쟁, 협력 관계 등이 네트워크 형성에 반영되어 있는 것으로 나타났다. 또한 대기업 및 비영리 연구기관 외에, 중소기업의 브로커 역할이 관찰되었다.

  • PDF

다변량 L-moment를 이용한 이변량 강우빈도해석에서 수문학적 동질지역 선정 (Hydrological homogeneous region delineation for bivariate frequency analysis of extreme rainfalls in Korea)

  • 신주영;정창삼;주경원;허준행
    • 한국수자원학회논문집
    • /
    • 제51권1호
    • /
    • pp.49-60
    • /
    • 2018
  • 다변량 지역빈도해석은 기존에 사용되어온 다변량 빈도해석과 지역빈도해석의 장점을 가지고 있는 방법으로 다양한 변수를 고려함으로써 수문현상에 대하여 많은 정보를 얻을 수 있다. 현재까지는 우리나라의 수문자료를 이용하여 다변량 지역빈도해석이 시도된 적이 없어 국내의 수문자료를 대상으로 다변량 지역빈도해석의 적용성을 검토할 필요가 있다. 본 연구에서는 다변량 지역빈도해석의 수문학적 동질지역을 설정하는 단계에 집중하여 이변량 수문자료인 연최대 강우량-지속기간 자료에 대하여 수문학적 동질지역을 설정하였다. 이변량 지역빈도해석에서 사용되는 지역구분방법의 한국의 연최대 강우량-지속기간 자료에 대한 적용성을 평가하였고 그 특성을 분석하였다. 기상청 71개 지점에 대하여 분석을 실시하였다. 군집해석방법으로는 K-medoid 방법을 적용하였고, 불일치 척도와 이질성 척도를 이용하여 지역구분이 적절히 되었는지를 판정하였다. 군집해석 결과 한국은 총 5개의 지역으로 나누어지며, 두 지역을 제외하고는 지역 내 모든 지점의 불일치 척도가 기준치 이하인 것으로 나타났다. 자료연수가 짧은 지점에서 불일치 척도가 높게 나오는 것을 확인하였다. 구분된 모든 지역은 지역 내 지점들의 자료들이 동질한 것으로 나타났고 각 지점간의 상관성이 매우 높은 것으로 나타났다.

Medoid Determination in Deterministic Annealing-based Pairwise Clustering

  • Lee, Kyung-Mi;Lee, Keon-Myung
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제11권3호
    • /
    • pp.178-183
    • /
    • 2011
  • The deterministic annealing-based clustering algorithm is an EM-based algorithm which behaves like simulated annealing method, yet less sensitive to the initialization of parameters. Pairwise clustering is a kind of clustering technique to perform clustering with inter-entity distance information but not enforcing to have detailed attribute information. The pairwise deterministic annealing-based clustering algorithm repeatedly alternates the steps of estimation of mean-fields and the update of membership degrees of data objects to clusters until termination condition holds. Lacking of attribute value information, pairwise clustering algorithms do not explicitly determine the centroids or medoids of clusters in the course of clustering process or at the end of the process. This paper proposes a method to identify the medoids as the centers of formed clusters for the pairwise deterministic annealing-based clustering algorithm. Experimental results show that the proposed method locate meaningful medoids.

RBF 네트웍의 중심 개수와 위치의 통합 결정을 위한 Two-Phase 알고리즘 (Two-Phase Algorithm for Determining the Number and the Locations of RBF Centers)

  • 이대원;이재욱
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회/대한산업공학회 2003년도 춘계공동학술대회
    • /
    • pp.827-834
    • /
    • 2003
  • 기존의 RBF네트웍의 중심 결정에 관한 연구에서는 은닉중의 노드 수(즉 중심의 개수)가 결정되었다는 가정하에 그 위치만을 결정하는 알고리즘들이 개발되었다. 그러나 RBF 네트웍 의 성능과 계산속도는 중심의 개수에도 민감하기 때문에, 중심 위치와 개수의 통합적인 고려가 필요하다. 본 논문에서는 RBF 네트웍의 중심결정에 있어서 그 위치 뿐만 아니라 개수까지 동시에 고려하는 Two-Phase 알고리즘을 제안한다. Two-Phase 알고리즘은 두 단계로 구성된다 찻 번째 단계에서는 Bi-section 방법과 보정된 k-medoid 군집화 기법을 이용하여 네트웍의 최소 중심 개수와 위치를 결정한다. 두번째 단계에서는 RBF 네트웍의 weight를 결정하고 네트웍 설계를 마친다. 제안된 알고리즘을 다양한 수지 예제에 적용한 결과, 중심결정에 관한 기존의 알고리즘에 비해 더 적은 수의 중심으로 더 정확한 예측성능을 보임을 알 수 있었다.

  • PDF

대용량의 고차원 데이터 공간에서 프로젝션 필터링 기반의 부분차원 클러스터링 기법 (Partial Dimensional Clustering based on Projection Filtering in High Dimensional Data Space)

  • 이혜명;정종진
    • 한국전자거래학회지
    • /
    • 제8권4호
    • /
    • pp.69-88
    • /
    • 2003
  • 현재 알려진 대부분의 클러스터링 알고리즘들은 고차원 공간에서 데이터가 갖는 고유의 희소성 및 잡음으로 인하여 성능이 급격히 저하되는 경향이 있다. 이에 따라 최근에 클러스터 형성에 연관성이 있는 차원만을 선택하고, 연관성이 적은 차원들을 제거함으로써 클러스터링의 성능을 높일 수 있는 부분차원 클러스터링 기법이 연구되고 있다. 그러나 현재 연구된 부분차원 클러스터링 기법은 그리드 기반 방법으로서 차원의 증가에 따라 그리드 셀의 수가 방대해짐으로써 공간 및 시간적 인 효율성 이 저하된다. 또한, 대부분의 알고리즘들은 데이터 집합에서 대표객체를 찾아 클러스터 형성에 관계 있는 차원만을 조사하기 때문에 대량의 고차원 공간 데이터에 대해서는 최상의 대표객체를 선택하는데 어려움이 많다는 문제점이 있다. 본 논문에서는 입력 차원의 순서와 무관하게 동일한 클러스터를 탐사할 수 있는 효율적인 부분차원 클러스터링 알고리즘인 CLIP을 제안한다. CLIP은 클러스터 형성에 밀접하게 연관된 임의의 차원에서 클러스터를 탐사한 후에, 그에 종속적인 다음 차원에 대해서 점진적인 프로젝션을 이용하여 클러스터를 탐사하는 기법이다. 점진적 프로젝션 기법은 제안된 알고리즘의 핵심 기법으로서 방대한 양의 탐색공간과 클러스터링을 식별하는 계산시간을 크게 줄인다. 이에 따라 CLIP 알고리즘을 평가하기 위해 합성 데이타를 이용한 실험을 통하여 알고리즘의 정확성 및 효율성, 알고리즘 결과의 동등성에 대한 실험 및 비교 분석 결과를 제시한다.

  • PDF