• 제목/요약/키워드: k-평균 군집

검색결과 652건 처리시간 0.029초

Dunn 지수를 이용한 최적 강수지역 군집수 분석 (The Analysis of Optimal Cluster Number of Precipitation Region with Dunn Index)

  • 엄명진;정창삼;남우성;정영훈;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2011년도 학술발표회
    • /
    • pp.87-91
    • /
    • 2011
  • 강수는 지역에 따라 발생양상이 매우 다른 자연현상 중 하나이다. 이러한 강수를 효과적으로 분석하여 확률강수량을 산정하기위해서 수문학에서는 다양한 방법이 시도되어 왔다. 우리나라에서는 지점빈도해석을 통한 확률강수량을 주로 사용해왔으나 최근 들어 Hosking and Wallis(1997)가 제안한 지역빈도해석을 활용을 적극 도모 하고 있는 중이다. 이러한 지역빈도해석 기법은 지점빈도해석 기법에 비하여 한정된 강수자료를 활용하는 측면 등 여러 가지 장점을 가진 확률 강수량 산정방법이다. 그러나 이 기법을 적용하여 확률강수량을 산정하기 위해서는 강수의 지역구분을 먼저 수행하여야 한다. 강수지역의 구분을 위해서는 여러 가지 기법이 존재하나 최근에는 Cluster 기법 중 K-means 방법이나 Fuzzy c-means 방법 등을 주로 적용하여 지역구분을 수행하고 있다. 그러나 K-means 방법이나 Fuzzy c-means 방법 등은 산정 방법내에서 최적 군집수를 결정할 수 있는 알고리즘이 없기 때문에 임의적으로 최적 군집수를 결정하여야 한다. 본 연구에서는 이러한 단점을 극복하기 위하여 Cluster 평가지수 중 하나인 Dunn 지수를 이용하여 최적 군집수를 제시하고자 한다. 본 연구에서 강수지역을 구분하기 위하여 적용한 인자는 월 평균 강수량, 연 평균 강수량, 월 최대 강수량, 경도, 위도, 고도 등이며, 이를 K-means, PAM 및 친근도 전파 기법을 통하여 강수지역을 구분하였다. 적정 군집수를 임의적으로 증가시켜 가면서 Dunn 지수를 산정하였다. 산정된 결과를 통하여 최적 군집수를 결정하였다.

  • PDF

흰개미 군집 알고리즘을 이용한 유사 블로그 추천 시스템에 관한 연구 (A Study of Similar Blog Recommendation System Using Termite Colony Algorithm)

  • 정기성;조이석;이말례
    • 한국인터넷방송통신학회논문지
    • /
    • 제13권1호
    • /
    • pp.83-88
    • /
    • 2013
  • 본 연구의 목적은 유사 블로그 추천 시스템을 통해서 특정 주제의 유사도에 따라 주제를 찾아 주는 것이다. 유사 추천 시스템을 실현하기 위해서는 대규모 데이터 집합에서 유사항목을 가진 그룹을 찾을 수 있도록 군집해야 한다. 군집화(clustering) 기법은 군집하고자 하는 목적에 따라 적합한 기법과 군집수가 결정되어야 한다. 군집기법으로는 가장 많이 사용되는 K-means 알고리즘을 사용 하였고 추천 알고리즘은 흰개미 군집 알고리즘을 사용하였다. 흰개미 습성 모델을 이용한 군집화 기법은 K-means 알고리즘이 갖고 있는 적절한 군집 갯수 문제점을 해결하고, 군집화 시간을 단축하며, 군집을 위한 군집 평균 이동횟수를 개선한다.

수많은 전략을 가진 차등 진화 (Differential Evolution with Numerous Strategies)

  • 오숙경;신성윤
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제61차 동계학술대회논문집 28권1호
    • /
    • pp.243-244
    • /
    • 2020
  • 본 논문에서는 SIM(Soft Island Model)을 통해 소집단 정보를 이동시키기 위한 KSDE라고 하는 수많은 전략을 제안한다. 먼저, 전체 모집단은 k- 평균 군집 알고리즘에 의해 k 개의 하위 모집단으로 분리된다. 둘째, 소집단에 돌연변이 조작을 수행하기 위해 전략 풀에서 돌연변이 전략을 무작위로 선택한다. 마지막으로, 이 알고리즘의 모집단 다양성을 개선하기 위해 하위 집단 정보가 SIM을 통해 마이그레이션 된다.

  • PDF

데이터마이닝에 의한 고객세분화 개발 (A Development of Customer Segmentation by Using Data Mining Technique)

  • 진서훈
    • 응용통계연구
    • /
    • 제18권3호
    • /
    • pp.555-565
    • /
    • 2005
  • 고객세분화는 기업이 관계하고 있는 고객을 이해하고 그 이해를 바탕으로 효과적인 고객관리를 수행하기 위해 필수적인 요소인데 데이터마이닝이 기업의 정보관리영역에 적극적으로 활용되면서 보다 과학적이고 최적화된 형태로 개발되고 있다. 본 연구에서는 신용카드고객 의 카드사용행태에 근거하여 각 고객을 서로 유사한 사용행태를 보이는 고객군으로 세분화하는 과정을 소개하였다. 고객이 실제로 신용카드를 사용하면서 발생시킨 거래정보에만 의존하여 고객세분화를 개발하였으며 이는 마케팅의 관점에서 상당히 의미있는 내용이 될 수 있다. 고객세분화의 개발을 위하여 데이터마이닝기법인 k-평균 군집방법과 최장연결법에 의한 계보적 군집방법을 단계적으로 활용하는 이단계 군집방법을 이용하였다.

행동 시계열 데이터와 k-평균 군집화를 통한 젖소의 일일 행동패턴 검출 (Daily Behavior Pattern Extraction using Time-Series Behavioral Data of Dairy Cows and k-Means Clustering)

  • 이성훈;박기철;박재화
    • 한국소프트웨어감정평가학회 논문지
    • /
    • 제17권1호
    • /
    • pp.83-92
    • /
    • 2021
  • 지난 동안 낙농업계에서는 다양한 센서 기술과 ICT 응용이 도입되어왔으며 축적된 낙농 데이터를 토대로 과학적인 낙농생산관리가 가능해졌다. 그러나 이러한 시도들은 젖소의 출산이나 우유 생산량과 같은 낙농 생산성에 직접적으로 관여하는 요인들에 대해서만 집중적으로 이루어졌으며 이러한 결과에 근본적으로 관여하는 생리학적 혹은 동물심리학적 요인에 대해서는 연구가 더딘 실정이다. 이 논문에서는 이러한 연구의 일환으로서 젖소의 시간별 행동 데이터로부터 일일 행동패턴을 검출하는 기초적인 방안을 제시하였다. k-평균 군집화를 통해 한 젖소의 1594일간 행동을 네 개의 군집으로 구분하였으며 각 군집에 속한 데이터와 군집의 대푯값을 시각화하여 군집 형성의 합리성을 확인하였다. 또한 개체의 일별 군집 변화를 토대로 군집 개수의 적정성을 판단하였다. 이 연구 결과가 향후 젖소의 이상상태나 질병징후의 포착 연구에 기여하기를 기대한다.

토지이용유형별 보행량 영향 요인 비교·분석 - 서울시 유동인구 조사자료를 바탕으로 (A comparison analysis of factors to affect pedestrian volumes by land-use type using Seoul Pedestrian Survey data)

  • 장진영;최성택;이향숙;김수재;추상호
    • 한국ITS학회 논문지
    • /
    • 제14권2호
    • /
    • pp.39-53
    • /
    • 2015
  • 본 연구는 서울시 유동인구조사자료를 활용하여 토지이용유형별로 보행량에 영향을 미치는 요인을 비교분석하였다. 우선, 조사지점 주변의 주거, 상업, 공업, 녹지 등의 토지이용을 바탕으로 K-평균 군집분석을 통해 5개의 군집으로 분류하고, 군집별 1일 및 시간대별 평균보행량의 차이를 비교하였다. 이어서, 군집별로 보행량에 영향을 미치는 요인을 3가지 공간적 위계의 설명변수로 구분하여 다중선형회귀분석을 통해 영향 요인을 규명하고 군집별로 차이점을 비교하였다. 분석결과, 보도 너비는 모든 군집에서 보행량의 증가요인으로 분석되었으나, 다른 변수들의 경우 군집별로 설명변수가 상이하고, 공간위계별로 영향력도 다른 것으로 나타났다. 본 연구의 결과는 향후 토지이용유형별 가로관련 정책을 수립하는 기초자료로 활용할 수 있을 것으로 판단된다.

군집분류를 이용한 흙막이 벽체 배면 지반의 상대적 침하거동 분석 (Analysis of Relative Settlement Behavior of Retaining Wall Backside Ground Using Clustering)

  • 곽영준;한희수
    • 지질공학
    • /
    • 제33권1호
    • /
    • pp.189-200
    • /
    • 2023
  • 도시화와 산업화에 따라 도심지에 개발이 늘어나면서 지반침하로 인한 피해가 지속적으로 발생되고 있으며, 도심지에서의 건물붕괴는 대규모 인명 및 재산 피해로 이어질 위험이 크다. 굴착지반에 균등하지 않은 하중이 작용하고, 대상지반의 사전지식이 없는 경우의 지반거동에 대해서는 연구가 거의 이루어지지 않았다. 이에 따라 지반 조사 정보가 없는 흙막이 공사의 굴착 과정에서 발생되는 배면 지반의 침하거동을 분석하는 방법이 기존에는 없었고, 본 연구에서는 시계열 데이터를 가공하여 상대적 침하거동과 상호관련성을 분석하여 흙막이 벽체 배면 지반의 침하거동을 분석하고자 하였다. 본 논문에서는 평균침하량차지수와 평균상대침하량차를 정의 및 계산하였으며, 이를 좌표계에 도시하여 시간경과에 따라 측점간의 상대적 침하거동을 분석하였다. 또한 관측점들의 군집을 분류할 수 있는 기준이 필요하여 k-평균군집분석과 Dunn Index를 이용하여 분류하였다. 분석결과 계측지점의 침하량이 일정한 값으로 수렴하면서 모든 군집들이 안정영역으로 이동한 것을 확인할 수 있었으며, 군집은 세분화되었다. 이러한 분석결과를 바탕으로 연구대상의 각 측점 간 상관관계를 분석하여 연구대상 지반의 독자거동영역과 동일거동영역을 구분할 수 있었다. 이처럼 측점들 간의 상대적 침하거동을 분석을 통해 거동영역을 구분할 수 있다면, 주변지역의 융기, 지반파괴영역 예측, 터파기 공사 시 활동파괴의 방지 등 침하관리와 안정관리에 도움을 줄 수 있다고 판단된다.

군집기법을 이용한 연강수량 예보개선에 관한 연구 (A Study on the Improvement of Quantitative Precipitation Forecast using a Clustering Method)

  • 김광섭;조소현
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2009년도 학술발표회 초록집
    • /
    • pp.94-97
    • /
    • 2009
  • 연 및 계절강수량의 정확한 예보는 수자원관리에 매우 중요하다. 예보 정확도를 높이기 위한 다양한 연구가 계속 진행되어 왔다. 그럼에도 불구하고 강수자료가 가지는 매우 큰 불확실성 때문에 예보의 정확도 향상은 계속되는 숙제로 우리에게 남아 있다. 이를 개선하기 위하여 본 연구에서는 군집화 기법을 이용한 연 및 계절 강수량 예측개선에 대한 연구 결과를 제시하였다. 이를 위하여 연강수량, 계절강수량 및 월강수량의 예측을 위하여 전구에서 일어나는 각종 기후 인자들과의 상관성 분석은 대단히 중요하다. 전 세계적으로 어느 특정 지역에서의 선행 기후인자 변화 양상이 우리나라의 강수량에 높은 상관성을 가지며 영향을 미친다면 예측을 위한 매우 유용한 정보라 하겠으나 국내 강수량과 기후 지수 사이의 선형 상관성은 매우 낮을 뿐만 아니라 지체상관성도 특정 지체에서 매우 큰 상관성을 보이는 인자를 찾기 어려움을 알 수 있다. 이를 극복하기 위하여 본 연구에서는 k-mean clustering을 이용하여 우리나라 주변의 기후조건을 분류하고 기후조건에 따른 강수량의 변화를 분석하였다. 남중국해역($105^{\circ}E\;^{\sim}\;135^{\circ}E$, $0^{\circ}N\;^{\sim}\;35^{\circ}N$), 우리나라 연안 해역 ($110^{\circ}E\;^{\sim}\;150^{\circ}E$, $20^{\circ}N\;^{\sim}\;40^{\circ}N$), 인도양 해역 ($75^{\circ}E\;^{\sim}\;105^{\circ}E$, $0^{\circ}N\;^{\sim}\;25^{\circ}N$) 및 아라비아 해역 ($45^{\circ}E\;^{\sim}\;75^{\circ}E$, $0^{\circ}N\;^{\sim}\;30^{\circ}N$ 평균 해수면 온도 변화에 따라 8개 군집으로 분류한 분석결과로 분석결과 2008년도는 그룹 5에 해당하며 그룹 5의 기후 상태는 근해와 남중국해역의 평균 해수면 온도가 평년보다 낮고 인도양 해역과 아라비아 해역의 평균 해수면 온도는 평년값과 비슷한 상태를 나타낸다. 그룹 5에 해당하는 기후조건에서 차년의 강수평균은 평년값 보다 적음을 보였다. 이러한 특성은 전체 유역에 걸쳐 동일하게 나타났다. 이에 대한 계절적 평균 분포는 군집 5에 대한 차년도 강수의 평균 계절분포는 전체적으로 평년값보다 낮게 나타났다. 이에 근거하여 올해 연 평균 강수량은 평년값보다 적을 것이며 전체 계절에 대하여도 평년값보다 적은 강수량이 올 것으로 판단된다. 이는 기상청의 2009년 봄철 기후전망과 유사한 예측 결과를 보여준다.

  • PDF

댐예정지를 중심으로 한 웅천천 수계의 어류군집에 관하여 (The Fish community of the Ungchon Stream Around the New Dam Intended Area)

  • 홍영표;장민호;강호;최신석
    • 환경생물
    • /
    • 제17권1호
    • /
    • pp.79-88
    • /
    • 1999
  • 1994년부터 1996년도까지 계류성 독립하천인 웅천천 수계의 보령댐 수몰예정지역을 중심으로 하여 6개지점에서 어류상, 주목할만한 어종 및 어류군집에 대하여 조사하였다. 본 조사지역에서 94년에서 96년 사이에 채집을 통하여 서식이 확인된 종은 11과 25속으로 총 29종이었으며 이중 9종은 한국특산어종이었다. 이 중 멸종위기종인 감돌고기와 퉁사리, 특산어종인 꺽지는 본 지역에서 확인되지 않아 절멸된 것으로 생각된다. 우세어종은 갈겨니, 피라미, 긴몰개가 우세한 그룹의 어종으로 나타났다. 지점별 평균풍부도는 0.68개체/$m^2$, 평균체적밀도는 1.45개체/㎥로 나타났으며, 종의 다양도는 상류와 하류보다는 중류가 가장 높게 나타났다. 군집간 유사도는 1군집과 4군집, 5군집과 6군집이 유사하였으나 유의한 차이는 나타내지 않아 전체가 유사한 군집으로 나타났다.

  • PDF

κ-공간중위 군집방법을 활용한 층화방법 (Stratification Method Using κ-Spatial Medians Clustering)

  • 손순철;전명식
    • 응용통계연구
    • /
    • 제22권4호
    • /
    • pp.677-686
    • /
    • 2009
  • 표본조사에서 널리 쓰이는 모집단의 층화는 추정의 효율을 높이는 방법 중의 하나지만, 이상점을 포함하는 변수가 있는 경우에 여러 가지 문제점을 유발시킬 수 있다. 특히, 이상점이 존재하는 다변량 자료의 경우, 층화를 위한 $\kappa$-평균 군집방법은 이상점에 매우 민감하여 추정의 효율을 떨어뜨릴 수 있다. 본 연구에서는 이상점이 존재하는 다변량 자료의 층화를 위해 $\kappa$-평균 군집방법보다 강건하며 이상점을 따로 식별하는 과정이 배제된 $\kappa$-공간중위수 군집방법을 제안한다. 기존 관련연구인 박진우와 윤석훈 (2008)과 동일한 자료에 대한 사례분석을 통해 층화과정들을 비교, 검토하였으며 이들의 효율성을 추정량의 분산을 통해 비교하였다.