• 제목/요약/키워드: 결정군집

검색결과 505건 처리시간 0.027초

기온과 강수량의 수치모델 격자자료를 이용한 기상관측지점의 월별 군집화 (Cluster analysis by month for meteorological stations using a gridded data of numerical model with temperatures and precipitation)

  • 김희경;김광섭;이재원;이영섭
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권5호
    • /
    • pp.1133-1144
    • /
    • 2017
  • 기상자료를 이용한 군집분석은 기상 특성에 근거한 기상 지역의 세분화를 가능하게 하고 군집을 이루는 지형별 기상 특성의 파악을 용이하게 한다. 이때 기상관측자료를 이용한 군집분석은 관측지점의 밀도가 다르기 때문에 우리나라의 기상특성이 고르게 반영되지 못할 수 있다. 반면 수치모델 격자자료는 $5km{\times}5km$ 간격으로 조밀하고 고른 자료의 생산이 가능하므로 우리나라의 기상 특성을 고르게 반영할 수 있다. 본 연구에서는 기온과 강수량의 수치모델 격자자료를 이용하여 군집분석을 수행하고, 그 결과를 바탕으로 기상관측지점에 대한 군집을 결정하였다. 기상 특성이 월별로 상이할 수 있기 때문에 군집분석은 월별로 수행하였으며, K-Means 군집분석 방법의 단점을 보완하고자 계층적 군집분석 방법인 Ward 방법과 결합하여 적용하였다. 그 결과 우리나라 기상관측지점들에 대해 시 공간적으로 세분화된 군집화가 이루어졌다.

씬씨내티 대도시지역의 산업군집과 경계설정 (Industrial Clusters and Their Boundaries: A Case Study for Plants in the Cincinnati metropolitan Area)

  • 이보영
    • 한국지역지리학회지
    • /
    • 제6권3호
    • /
    • pp.169-184
    • /
    • 2000
  • 미국의 씬씨내티 대도시지역을 대상으로 인자분석 및 Hot Spot 분석에 의해 산업 군집과 그것의 경계가 확인되어졌다. 전통적 투입 산출 접근법이 비공간적 산업 군집을 추출하는 반면 이 연구는 전통적 접근을 GIS 기법과 결합하여 경계를 설정한다. 투입 산출 산업 군집의 결과를 선도산업 부문과 결합하여 5개 선도 산업 군집을 추출하였는데 그것은 음식료품, 화학, 금속, 금속제품, 기계공업 부분이다. 그리고 Hot Spot 기법을 이용하여 연구지역의 산업 군집을 Arcview에 통합하여 시각화하였다. 산업 군집의 공간적 결합정도와 공간적 한계를 결정하는 것은 경제의 공간구조의 효율성을 측정하는 부가적 접근이 될 수 있다. 산업 군집과 산업의 공간적 군집 접근은 하나의 공장이나 기업의 수준보다 집계적인 차원에서 산업의 공간적 배열의 새로운 모형 개발 기초의 가능성을 제시한다.

  • PDF

자기조직화지도에서 연결강도에 기반한 새로운 군집타당성지수 (A new cluster validity index based on connectivity in self-organizing map)

  • 김상민;김재직
    • 응용통계연구
    • /
    • 제33권5호
    • /
    • pp.591-601
    • /
    • 2020
  • 자기조직화지도는 고차원의 원자료를 노드들로 이루어진 저차원의 공간으로 투영하는 비지도학습 방법이다. 이 방법은 고차원의 자료를 노드들을 사용하여 2 또는 3차원의 공간에서 시각화할 수 있고, 이를 통해 자료의 특성을 탐색하는데 유용하다. 자료의 구조를 파악하기 위해 종종 노드들에 대한 군집분석을 시도하는데, 군집분석의 중요한 문제중 하나는 군집의 개수를 결정하는 것이다. 이 문제를 해결하기 위해 다양한 군집타당성지수들이 지금까지 개발되어 왔고, 이러한 지수들은 자기조직화지도의 노드들의 군집분석에 직접적으로 적용될 수 있다. 그러나, 자기조직화 지도가 원자료의 위상적 특성을 저차원 공간에 반영할 수 있다는 특징을 갖는데 반해, 이러한 일반적인 지수들은 이를 고려하지 않는 문제가 있다. 이에 본 연구에서는 원자료의 위상적 특성을 고려한 노드들 사이의 연결강도를 기반으로 하는 군집타당성지수를 제안한다. 이 새로운 군집타당성지수의 성능은 모의실험을 통해 기존의 군집타당성지수들과의 비교되고 검증된다.

Bayesian 기법의 모수 추정을 이용한 결정트리 상태 공유 모델링 (Decision Tree State Tying Modeling Using Parameter Estimation of Bayesian Method)

  • 오상엽
    • 디지털융복합연구
    • /
    • 제13권1호
    • /
    • pp.243-248
    • /
    • 2015
  • 인식 모델을 구성할 때 정의되지 않은 모델, 인식 모델 구성 후에 추가되어진 모델, 모델이 부족하여 하나의 모델 클러스터링으로 모델링하여 생성된 인식 모델들은 인식률 저하의 원인이 된다. 이러한 원인을 개선하기 위하여 Bayesian 기법의 모수 추정을 이용한 결정트리 상태 공유 모델링 방법을 제안하였다. 제안 방법은 Bayesian 기법의 파라미터 추정을 통하여 탐색된 결과로부터 결정트리 기반 상태 공유 모델링의 최대 확률 기법에 따라 인식모델을 결정한다. 본 논문에서 제안하여 시뮬레이션 데이터를 이용한 실험 결과에서 제안한 군집화 방식을 비교하여 1.29%의 음성인식 오류감소율을 보였으며, 기존 군집화 방식에 비해 개선된 성능을 보였다.

가계저축유형을 결정요인에 관한 연구 (A Study of Family Saving Patterns and the Determinants)

  • 주인숙
    • 가정과삶의질연구
    • /
    • 제12권1호
    • /
    • pp.62-71
    • /
    • 1994
  • 본 연구는 가계의 저축운용형태에 따라 가계저축유형을 분류하며 또한 각 저축유형 의 결정요인을 규명하고자 하였다. 분석을 위하여 국민은행이 실시한 1990년도 가계금융이 용실태조사 자료를 이용하였다. 군집분석에 의해 가계저축의 유형을 분류하였으며 가계저축 유형에 대한 결정요인을 찾기 위하여 로짓분석을 사용하였다. 가계적축은 상이한 5개의 유 형으로 분류하였으며 각 유형은 그에 해당하는 가계 저축행태의 특징에 근거하여 수익추구형, 안전지향형, 지역밀착형, 인간관계중시형 및 유비무환형으로 명명하였다. 가계저축유형별 결정요인을 유형에 따라 다소 차이를 보였으나 가계소득, 가구주의 직업, 가구주의 학력이 가장 중요한 결정요인 것으로 나타났다.

  • PDF

논문 검색 결과의 효과적인 브라우징을 위한 단어 군집화 기반의 결과 내 군집화 기법 (A Search-Result Clustering Method based on Word Clustering for Effective Browsing of the Paper Retrieval Results)

  • 배경만;황재원;고영중;김종훈
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권3호
    • /
    • pp.214-221
    • /
    • 2010
  • 검색 결과 내 군집화(search-result clustering)는 검색 엔진으로부터 검색된 결과 내에서 비슷한 문서를 자동으로 군집화하는 기법이다. 본 논문에서는 논문 검색 서비스에 전문화된 새로운 결과 내 군집화 기법을 제안한다. 제안하는 시스템은 '범주체계생성기(Category Hierarchy Generation System)'와 '논문군집기(Paper Clustering System)'로 구성되어있다. '범주체계생생기'는 KOSEF의 연구 범주 체계를 이용하여 분야 시소러스라 불리는 범주 체계를 생성하고, K-means 알고리즘을 이용한 단어 군집화 알고리즘을 사용하여 분야 시소러스의 키워드 집합을 확장한다. '논문군집기'는 top-down 방식과 bottom-up 방식을 이용하여 각 논문의 범주를 결정한다. 제안하는 시스템은 논문 검색 서비스와 같은 전문 분야에 대한 검색 서비스에 유용하게 사용될 수 있을 것이다.

Conditional Random Fields 구조에서 궤적군집화를 이용한 혼잡 영상의 이동 객체 검출 (Detection of Moving Objects in Crowded Scenes using Trajectory Clustering via Conditional Random Fields Framework)

  • 김형기;이광국;김회율
    • 한국멀티미디어학회논문지
    • /
    • 제13권8호
    • /
    • pp.1128-1141
    • /
    • 2010
  • 본 논문은 궤적을 군집화하여 혼잡한 영상에서 이동 객체를 검출하는 방법을 제안한다. 제안하는 방법은 객체의 외형 정보에 기반한 기존의 방법들과는 달리 객체의 움직임 정보만을 이용해 이동 객체를 검출한다. 이를 위하여 입력 영상의 매 프레임에서 특징점을 추출하며, 인접한 프레임간의 추적 과정을 통하여 특징점들의 궤적을 생성한다. 동일 객체에서 얻어진 궤적들은 유사한 움직임을 보일 것이라는 가정 하에 군집화 과정을 통하여 이동 객체를 검출한다. 궤적들의 군집화를 위하여 특징점 간의 위치, 움직임, 연속성에 기반한 에너지 함수로 궤적 간 유사도를 측정하였으며, conditional random fields (CRFs)를 이용하여 최적의 군집을 결정하였다. 기존의 궤적 군집화를 통한 이동 객체 검출 방법이 군집화 과정에서 한번 잘못 분류된 궤적은 잘못된 결과를 생성하는 것과는 달리, 제안한 방법에서는 군집화가 CRFs 상에서 에너지 최소화에 의해 수행되기 때문에 잘못 분류된 궤적이 반복 과정에서 다시 올바른 군집으로 재배열되는 것이 가능하다. 제안한 방법의 성능 측정을 위하여 서로 다른 혼잡도를 가지는 세 개의 영상을 이용하였으며, 약 94%의 검출률과 7%의 허위 경보율을 나타내었다.

상대인력 모델에 기반한 자연적 개체 군집화 알고리즘 (A Natural Clustering Algorithm based on the Relative Gravitation Model)

  • 김은주;고재필;변혜란;이일병
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권10호
    • /
    • pp.757-763
    • /
    • 2001
  • 본 논문에서는 상대인력 모델에 기반한 새로운 군집화 알고리즘, G-CLUS를 제안한다. 제한한 방법에서 모든 개체들은 초기에 동일한 질량을 가지고, 개체간의 인력에 의해 인력이 작용하는 방향으로 점진적으로 이동하게 되어, 초기 시작점 선택이나 군집의 개수를 미리 지정하지 않은 상태에서 자연스럽게 군집을 형성한다. 제안한 방법을 인력작용과정에서 군집의 수가 자연스럽게 결정되며, 한 개체가 받는 힘은 개체간의 인력을 합한 합력을 사용하기 때문에 이상치에 대한 민감성을 완화하였다. 본 알고리즘은 계산복잡도를 낮추기 위하여 큐브개념을 적용하여 O(nk)의 계산 복잡도를 유지하도록 하였다. 실험에서는 개체들의 움직임 특성, 군집화 모델에 따른 군집화 과정, 임의의 데이타 집합에 대한 군집화 결과를 보이고, 또한 타 군집화 알고리즘과 제안한 알고리즘 군집화 결화를 비교한다.

  • PDF

범주형 데이터의 분류를 위한 퍼지 군집화 기법 (A Fuzzy Clustering Algorithm for Clustering Categorical Data)

  • 김대원;이광형
    • 한국지능시스템학회논문지
    • /
    • 제13권6호
    • /
    • pp.661-666
    • /
    • 2003
  • 본 논문에서는 범주형 데이터의 분류를 위한 새로운 기법을 제시한다. 기존의 대표적인 퍼지 군집화 방법인 k-modes 알고리즘과 fuzzy k-modes 알고리즘은 군집의 중심을 단일 값으로 표현하고, 군집에 속하는 데이터의 빈도 수에 기반한 중신 갱신 기법을 사용하였다. 이와 같은 기존의 방법들은 분류의 경계가 모호한 데이트를 군집화할 경우, 알고리즘의 각 단계에서 발생하는 분류의 에러를 보정하지 못해 최종적으로 지역해에 빠지는 단점이 있다. 이를 극복하기 위해 본 논문에서는 군집 중심을 퍼지 집합을 이용하여 정의한다. 퍼지 군집 중심은 주어진 데이터와 군집간의 거리 관계를 퍼지 값을 이용해 표현하며, 각 군집의 중심은 데이터의 소속 정도 값을 이용해 갱신된다. 이와 같은 퍼지 중심 표현기법을 도입하여 범주형 데이터의 분류 시에 보다 세밀한 결정을 내림으로써, 인접한 군집들의 경계에서 발생하는 불확실성을 최소화한다. 기존의 대표적인 방법들과의 비교실험을 수행함으로써 제안한 방법의 성능을 검증하였다.