• Title/Summary/Keyword: 군집분석

Search Result 1,351, Processing Time 0.187 seconds

웹로그 데이터에 대한 군집분석 알고리즘에 관한 연구

  • Gang, Hyeon-Cheol;Han, Sang-Tae;Seon, Yeong-Su
    • Proceedings of the Korean Statistical Society Conference
    • /
    • /
    • pp.313-318
    • /
    • 2003
  • 최근 인터넷은 기업이 고객과 접촉할 수 있는 새로운 수단으로써 기업의 홍보나 서비스를 제공하는 기능을 수행할 뿐만 아니라 사업을 위한 중요한 도구로 여겨지고 있다. 따라서 방문자의 웹사이트 이용형태를 파악하기 위한 다양한 기법들이 제시되고 있으며, 웹로그 데이터에 대한 자료분석 기법들이 여러 학문분야에서 연구되고 있다. 본 연구에서는 웹로그 데이터에 대한 군집분석을 위해 거리측도 및 분석 알고리즘을 제안하였으며, 실제 자료에 이를 적용하여 제안된 알고리즘의 특성을 살펴보았다.

  • PDF

A Study of the Fuzzy Clustering Algorithm using a Growth Curve Model (성장곡선을 이용한 퍼지군집분석 기법의 연구)

  • 김응환;이석훈
    • The Korean Journal of Applied Statistics
    • /
    • v.14 no.2
    • /
    • pp.439-448
    • /
    • 2001
  • 본 연구는 시간자료(Longitudinal data)의 분석을 위하여 Fuzzy k-means 군집분석 방법을 확장한 알고리즘을 제안한다. 이 논문에서 제안하는 군집분석방법은 각각의 개체에 대응하는 성장곡선에 Fuzzy k-means 군집분석의 알고리즘을 결합하는 것을 핵심아이디어로한다. 분석결과는 생성된 군집을 성장곡선모형으로 표현할 수 있고 또한 추정된 모형의 식을 활용하여 새로운 개체를 분류도 할수 있음을 보인다. 그리고 이 군집분석방법은 아직 자라지 않은 나이 어린 개체가 미래에 어느 군집에 속할 것인가 하는 분류와 함께 이 개체의 향후 성장상태를 예측을 하는 데에도 적용이 가능하다. 제안된 알고리즘을 원숭이(macaque)의 상악동(maxillary sinus)의 자료에 적용한 실례로 보인다.

  • PDF

Cluster Analysis of Snowfall Observatory Using K-means Algorithm (K-평균 알고리즘을 이용한 적설관측소 군집분석)

  • Lee, Munseok;Chung, Gunhui
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • /
    • pp.412-412
    • /
    • 2018
  • 최근 지구온난화의 영향으로 겨울철 한파를 야기하는 일이 잦아지고 있다. 우리나라에도 그 영향으로 매년 겨울 한파가 지속되고 있다. 그러므로 겨울철 적설량을 기록하고 갑작스러운 재난에 대비하는 것은 지구온난화의 또 다른 숙제가 되었다. 우리나라는 전통적으로 폭설 피해가 크지 않았기 때문에 적설관측소의 수가 강우관측소에 비해 현저히 적다. 그리하여 추가적인 적설관측소의 설치가 필요하다고 판단되지만, 이에 앞서 우리나라의 현재 적설관측소의 분포현황을 분석하였다. 1월, 2월, 12월의 최대 최심신적설량과 관측소 고도자료를 K-평균 알고리즘의 4개의 변수로 사용하였으며, 전국에서 총 94개의 적설관측소를 자료보유기간으로 분류하여 군집분석을 수행하였다. 군집분석 결과 서해안지역, 태백 소백산맥을 따라 존재하는 내륙산악지역, 경상도와 남해안 그리고 제주도지역, 울릉도와 대관령으로 군집이 형성되었다. 또한, 제주도의 적설관측소가 해안가 위주로 설치되어있어, 비교적 눈이 많이 오는 한라산 산간지역에 추가적인 적설관측소 설치가 고려되어야 할 것이다.

  • PDF

A study on electricity demand forecasting based on time series clustering in smart grid (스마트 그리드에서의 시계열 군집분석을 통한 전력수요 예측 연구)

  • Sohn, Hueng-Goo;Jung, Sang-Wook;Kim, Sahm
    • The Korean Journal of Applied Statistics
    • /
    • v.29 no.1
    • /
    • pp.193-203
    • /
    • 2016
  • This paper forecasts electricity demand as a critical element of a demand management system in Smart Grid environment. We present a prediction method of using a combination of predictive values by time series clustering. Periodogram-based normalized clustering, predictive analysis clustering and dynamic time warping (DTW) clustering are proposed for time series clustering methods. Double Seasonal Holt-Winters (DSHW), Trigonometric, Box-Cox transform, ARMA errors, Trend and Seasonal components (TBATS), Fractional ARIMA (FARIMA) are used for demand forecasting based on clustering. Results show that the time series clustering method provides a better performances than the method using total amount of electricity demand in terms of the Mean Absolute Percentage Error (MAPE).

Cluster analysis for highway speed according to patterns and effects (고속도로 구간별 통행속도의 패턴과 영향에 따른 군집분석)

  • Kim, Byungsoo;An, Soyoung;Son, Jungmin;Park, Hyemi
    • The Korean Journal of Applied Statistics
    • /
    • v.29 no.5
    • /
    • pp.949-960
    • /
    • 2016
  • This paper uses all sections of highway data (VDS) for two years (Jan. 2014-Dec. 2015), with 15 minute units. The first purpose of this study is to find clusters with similar patterns that appear repeatedly with time variables of month, week and hour. The cluster analysis results indicate a variety of patterns of average traffic speeds by time variables depending on the clusters; subsequently, these can be utilized to model for the forecast of the speed at a specific time. The second purpose is to do cluster analysis for grouping sections by effect nets that are closely related to each other. For the similarity measure we use cross-correlation functions calculated after pre-whitening the speed of each section. The cluster analysis gets 19 clusters, and sections within a cluster are geographically close. These results are expected to help to forecast a real-time speed.

Functional clustering for clubfoot data: A case study (클럽발 자료를 위한 함수적 군집 분석: 사례연구)

  • Lee, Miae;Lim, Johan;Park, Chungun;Lee, Kyeong Eun
    • Journal of the Korean Data and Information Science Society
    • /
    • v.25 no.5
    • /
    • pp.1069-1077
    • /
    • 2014
  • A clubfoot is a kind of congenital deformity of foot, which is internally rotated at the ankle. In this paper, we are going to cluster the curves of relative differences between regular and operated feet. Since these curves are irregular and sparsely sampled, general clustering models could not be applied. So the clustering model for sparsely sampled functional data by James and Sugar (2003) are applied and parameters are estimated using EM algorithm. The number of clusters is determined by the distortion function (Sugar and James, 2003) and two clusters of the curves are found.

Market Segmentation on Recreational Forest Visitors by Cluster Analysis (군집분석을 통한 자연휴양림 이용객의 시장세분화)

  • Shin, Hyun-Kyu;Shin, Hong-Chul
    • The Journal of the Korea Contents Association
    • /
    • v.10 no.3
    • /
    • pp.364-372
    • /
    • 2010
  • The purpose of this study is to segment recreational forest's visitors for marketing based on purpose of visit. Using the factor analysis, cluster analysis, cross tab, and t-test to find out different behavioral intention in each clusters, the result elicited some implications. First, 2 clusters was founded and has difference in behavioral intentions. Cluster 1(married, 200~300hundred won income) has higher satisfaction, revisit intention, recommendation intention. The result shows that market researcher in recreational forest should approach different marketing strategy and has various facility, active program. This research need to survey broad region to generalized result.

Clustering Validity Assessment Using Relative Criteria for finding Optimal Clusters (최적의 군집을 찾기 위한 상대적 군집 평가 방법)

  • 김영옥;이수원
    • Proceedings of the Korean Information Science Society Conference
    • /
    • /
    • pp.334-336
    • /
    • 2002
  • 군집 분석은 데이터의 속성을 분석하여 서로 유사한 패턴을 가진 데이터를 묶는 방법이다. 군집 분석은 많은 응용 분야에서 쓰이고 있으나, 수행된 군집 분석 결과가 과연 정확한 결과이고 의미 있는 결과인지를 평가하는데 어려움이 있다. 본 논문에서는 군집이 형성된 데이터를 분석하여 군집 분석 결과를 평가하는 상대적 군집 평가 방법을 제안한다. 본 논문에서는 상대적 군집 평가 방법의 인덱스를 정의하고 형성된 군집 분석 결과에 적용해 최적의 군집, 의미 있는 군집을 찾을 수 있음을 보인다. 또한 실험을 통해 제안한 인덱스의 적합성을 보이며, 제안한 인덱스가 기존의 인덱스에 비해 최적의 군집, 의미 있는 군집을더 잘 찾을 수 있음을 보인다.

  • PDF

K-모드 알고리즘과 ROCK 알고리즘의 비교 및 개선방안

  • 김보화;김규성
    • Proceedings of the Korean Statistical Society Conference
    • /
    • /
    • pp.163-167
    • /
    • 2001
  • 데이터 마이닝에서 분석의 대상으로 하는 대용량 자료에는 연속형 자료와 범주형 자료가 모두 포함된다. 전통적인 군집분석은 연속형 자료를 대상으로 하는 방법들이다. 본 연구에서는 범주형 자료를 대상으로 하는 군집분석방법인 K-모드 알고리즘과 락(ROCK) 알고리즘을 비교${\cdot}$분석하였다. 그리고 두 알고리즘이 갖는 방법론적인 단점을 보안하여 군집의 효과를 높일 수 있는 개선 방안을 제안하였다.

  • PDF