• 제목/요약/키워드: K-means cluster

검색결과 615건 처리시간 0.028초

군집분석 기법을 이용한 공공도서관 그룹화에 대한 연구 (A Study of Library Grouping using Cluster Analysis Methods)

  • 곽철완
    • 한국비블리아학회지
    • /
    • 제31권3호
    • /
    • pp.79-99
    • /
    • 2020
  • 이 연구의 목적은 공공도서관 그룹화를 위해 적합한 군집분석 모델을 파악하고 그 특징을 분석하는데 있다. 국가도서관통계시스템의 공공도서관 통계 데이터를 사용하였으며, 군집분석 기법의 3가지 모델을 적용하였다. 공공도서관 규모를 기준으로 군집분석을 실시한 결과 크게 2가지 군집으로 구분되었으며, 군집의 크기는 크게 한쪽으로 치우쳤다. 그룹화 모델로 도서관 규모를 기준으로 삼으면, 계층적 군집분석의 와드측정법과 k-평균군집분석 모델이 적합하였다. 공공도서관 그룹화 연구 결과에 대한 시사점은 다음과 같다. 첫째, 통계 데이터 외에 도서관 서비스 관련 다양한 데이터 수집이 진행되어야 한다. 둘째, 분석 대상이 되는 데이터 세트에 적합한 분석 모델이 적용되어야 한다. 셋째, 도서관 서비스 향상을 위해 군집분석 기법의 다양한 분야 적용 가능성에 대한 적극적인 연구가 필요가 있다.

군집분석 (Cluster Analysis)을 활용한 사용자 등급 기반의 서비스 수락 정책 (User-Class based Service Acceptance Policy using Cluster Analysis)

  • 박혜숙;백두권
    • 정보처리학회논문지D
    • /
    • 제12D권3호
    • /
    • pp.461-470
    • /
    • 2005
  • 본 논문에서는 마케팅에서 주로 적용되는 CRM(Customer Relationship Management)의 군집분석 방법을 활용하여 콘텐츠 서비스를 이용하는 고객들을 서비스 패턴에 따라 세분화(Segmentation)하고, 군집별로 미디어 서버의 자원을 차별적으로 할당하여, 기업의 수익성을 높이기 위한 새로운 정책을 제시하였다. 새로운 서비스 정책의 구현을 위해 첫째, 고객 데이터에 대해 군집분석 중에서 K Means Method를 적용하여 고객들의 서비스 패턴 (총 사이트 방문 횟수, 서비스 종류, 서비스 이용 기간, 지불금액, 평균 서비스 시간, 사이트 방문 당 서비스 요금)과 수익에 대한 기석도 둥을 분석하였다. 고객들은 수익에 대한 기여도에 따라 4개의 군집으로 분류되었다. 둘째, 군집별로 미디어 서버 자원을 할당하는 알고리즘인 CRFA(Client Request Filtering Algorithm)를 제시하였다. CRFA 는 고객이 속한 군집의 자원 한도 내에서 승인제어를 실시하는 기능을 수행하였다. 분석된 결과에 의하면 CRFA를 적용하였을 때 기업의 네트워크 비용은 감소하고 기업의 수익에 기여도가 높은 군집에 속한 고객들의 수락률이 높아졌음을 알 수 있었다.

능동적 학습을 위한 군집기반 초기훈련집합 선정 (Selection of An Initial Training Set for Active Learning Using Cluster-Based Sampling)

  • 강재호;류광렬;권혁철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권7호
    • /
    • pp.859-868
    • /
    • 2004
  • 본 논문에서는 능동적 학습이 보다 적은 수의 훈련예제로도 높은 학습성능을 달성할 수 있도록 군집화기법을 이용하여 초기훈련집합을 선정하는 방안을 제안한다. 본 제안 방안은 유사한 예제들보다는 다양한 예제들로 그리고 특수한 예제들보다는 보편적인 예제들로 구성한 집합이 학습에 유리할 것이라는 가정을 바탕으로, 먼저 k-means 군집화 기법으로 예제들을 군집화한 후, 각 군집을 가장 잘 표현하는 대표예제로 개별 군집의 중심점과 가장 가까운 예제를 선정하여 초기훈련집합을 구성한다. 또한 개별 군집의 중심점을 가상의 예제로 가정하여, 이와 연관된 대표예제의 카테고리를 부여함으로써 추가의 훈련예제로 활용하는 방안을 함께 제안한다. 여러 문서 분류 문제를 대상으로 실험한 결과, 본 제안 방안으로 선정한 초기훈련집합에서 출발한 능동적 학습이 임의로 선정한 초기훈련집합에서 출발한 경우에 비해 보다 적은 수의 훈련예제로도 동등한 성능을 달성할 수 있음을 확인하였다.

다차원 데이터의 군집분석을 위한 차원축소 방법: 주성분분석 및 요인분석 비교 (A dimensional reduction method in cluster analysis for multidimensional data: principal component analysis and factor analysis comparison)

  • 홍준호;오민지;조용빈;이경희;조완섭
    • 한국빅데이터학회지
    • /
    • 제5권2호
    • /
    • pp.135-143
    • /
    • 2020
  • 본 논문은 농식품 소비자패널 데이터에서 소비자의 유형을 나눌 때에 변수간 연관성이 많은 장바구니 분석에서 전처리 방법과 차원축소의 방법을 제안한다. 군집분석은 다변량 자료에서 관측 개체를 몇 개의 군집으로 나눌 때 널리 사용되는 분석기법이다. 하지만 여러 개의 변수가 연관성을 가진 경우에는 차원축소를 통한 군집분석이 더 효과적일 수 있다. 본 논문은 1,987 가구를 대상으로 조사한 식품소비 데이터를 K-means 방법을 사용하여 군집화하였으며, 군집을 나누기 위해 17개의 변수를 선정하였고, 17개의 다중공선성 문제와 군집을 나누기 위한 차원축소의 방법 중 주성분 분석과 요인분석을 비교하였다. 본 연구에서는 주성분분석과 요인분석 모두 2개의 차원으로 축소하였으며 주성분분석에서는 3개의 군집으로 나뉘었지만 분석하고자 하였던 소비 패턴에 대한 군집의 특성이 잘 나타나지 않았으며 요인분석에서는 분석가가 보고자 하는 소비 패턴의 특징이 잘 나타났다.

분포통계변화에 따른 XLPE 절연체의 부분방전 패턴해석 (Analysis of The Partial Discharge Pattern in XLPE Insulator due to Variation of Statistical Distribution)

  • 김탁용;;조경순;심현택;연규호;이충호;홍진웅
    • 한국전기전자재료학회:학술대회논문집
    • /
    • 한국전기전자재료학회 2006년도 하계학술대회 논문집 Vol.7
    • /
    • pp.83-84
    • /
    • 2006
  • In this paper, we examine discharge characteristics of cross-linked polyethylene (since then; XLPE) according to thickness. Voltage was applied to power frequency by step method, and calibration of discharge was set to 50[pC] (slope=8.333). After the voltage was applied, for 10 [sec] (600 [cycle]), occurring discharge and number were detected. Determine of input pattern is difficult because discharge pattern is irregular. Therefore we investigated pattern using the K-means Analysis and Weibull function. Also we investigated variation of centroid and cluster.

  • PDF

K-means 알고리즘을 활용한 수도권 도심항공 모빌리티(UAM) 수직이착륙장 위치 선정 및 평가 (Selection and Evaluation of Vertiports of Urban Air Mobility (UAM) in the Seoul Metropolitan Area using the K-means Algorithm)

  • 정준영;황호연
    • 한국항행학회논문지
    • /
    • 제25권1호
    • /
    • pp.8-16
    • /
    • 2021
  • 본 논문에서는 도심항공 모빌리티(UAM)를 우리나라 수도권에서 운용하기 위해 필요한 수직이착륙장의 위치를 선정하고 평가하였다. 통근통학 인구수 조사 데이터를 이용해 수요 데이터를 분석하였으며, MATLAB을 이용해 지도상에 표현하였다. 또한 데이터들을 군집화하기 위해 MATLAB에 내장되어있는 K 평균 알고리즘 함수를 이용해 수직이착륙장의 위치로 선정할 군집의 중심을 파악하였으며, 실루엣 기법을 이용해 군집화의 정확도와 신뢰도를 평가하였다. 또한 선정된 수직이착륙장의 위치가 실제 수직이착륙장 설치에 적합한지 위성 지도를 이용해 확인하였으며, 그 위치가 설치 불가능한 위치에 있는 경우 위치 조정 과정을 통해 최종 수직이착륙장의 위치를 선정하였다.

군집의 중요 용어와 위키피디아를 이용한 문서군집 향상 (Enhancing Document Clustering using Important Term of Cluster and Wikipedia)

  • 박선;이연우;정민아;이성로
    • 대한전자공학회논문지SP
    • /
    • 제49권2호
    • /
    • pp.45-52
    • /
    • 2012
  • 본 논문은 군집 중요 용어들과 위키피디아(Wikipedia)의 동음이의어를 이용하여 문서군집의 성능을 향상시키는 새로운 방법을 제안한다. 제안된 방법은 비음수행렬분해의 의미특징을 이용하여 군집 중요 용어들을 선택함으로서 군집을 대표할 수 있는 군집 주제(topic)의 개념을 잘 표현할 수 있으며, 군집의 중요 용어에 위키피디아의 동음이의어를 사용하여 확장함으로써 문서와 군집 간의 의미관계를 고려하지 않는 용어집합(bag-of-words) 문제를 해결할 수 있다. 또한 확장된 군집의 중요 용어를 이용하여 문서집합을 재 군집하여 초기 군집을 정제함으로써 군집방법의 성능을 높일 수 있다. 실험결과 제안방법을 적용한 문서군집방법이 다른 문서군집 방법에 비하여 좋은 성능을 보인다.

단어 군집 기반 모바일 애플리케이션 범주화 (Word Cluster-based Mobile Application Categorization)

  • 허정만;박소영
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권3호
    • /
    • pp.17-24
    • /
    • 2014
  • 본 논문에서는 단어 군집 정보를 활용하여 모바일 애플리케이션의 범주를 분류하는 방법을 제안한다. 제안하는 방법은 모바일 애플리케이션 설명이 짧을 수 있다는 점을 고려하여, 모바일 애플리케이션 설명에 포함된 단어 정보 뿐만 아니라 각 단어의 단어 군집 대표 정보를 범주화 자질로 활용한다. 그리고, 모바일 애플리케이션의 카테고리가 세분화되어 있으므로, 제안하는 방법은 범주별 단어 발생 빈도를 K 평균 군집화 알고리즘에 적용하여 단어 군집을 생성한다. 모바일 애플리케이션 설명이 설치사양과 같이 범주와 관련없는 내용이 있을 수 있다는 점을 반영하여, 제안하는 방법은 단어 군집 중에서 범주화에 유용한 일부 단어 군집만을 선별하여 활용한다. 실험결과 제안하는 방법은 단어 군집 정보를 활용하여 모바일 애플리케이션 범주화 재현율을 5.65% 개선시켰다.

초도양산 군수품에 대한 정량적 위험등급평가 방안 연구 (A study on the quantitative risk grade assessment of initial mass production for weapon systems)

  • 정영탁;함영훈;노태주;안만기;고경와
    • 품질경영학회지
    • /
    • 제46권3호
    • /
    • pp.441-452
    • /
    • 2018
  • Purpose: The purpose of this paper is to study quantitative risk grade assessment for objective government quality assurance activities based on risk management in initial mass production for weapon systems. Methods: The Defense quality management regulations and foreign risk assessment documents are referred to analyze problems performing quality assurance actives. The failure rate data, maintainability and cost of products have been studied to quantify the risk Likelihood and impact. The analyzed data were classified as risk grade assessment through K-means Cluster Analysis method. Results: Results show that a proposed method can objectively evaluate risk grade. The analyzed results are clustered into three levels such as high, middle and low. Two products are allocated high, eleven low and seven middle. Conclusion: In this paper, quantitative risk grade assessment methods were presented by analyzing risk ratings based on objective data. The findings showed that the methods would be effective for initial mass production for weapon systems.

Prediction of Energy Consumption in a Smart Home Using Coherent Weighted K-Means Clustering ARIMA Model

  • Magdalene, J. Jasmine Christina;Zoraida, B.S.E.
    • International Journal of Computer Science & Network Security
    • /
    • 제22권10호
    • /
    • pp.177-182
    • /
    • 2022
  • Technology is progressing with every passing day and the enormous usage of electricity is becoming a necessity. One of the techniques to enjoy the assistances in a smart home is the efficiency to manage the electric energy. When electric energy is managed in an appropriate way, it drastically saves sufficient power even to be spent during hard time as when hit by natural calamities. To accomplish this, prediction of energy consumption plays a very important role. This proposed prediction model Coherent Weighted K-Means Clustering ARIMA (CWKMCA) enhances the weighted k-means clustering technique by adding weights to the cluster points. Forecasting is done using the ARIMA model based on the centroid of the clusters produced. The dataset for this proposed work is taken from the Pecan Project in Texas, USA. The level of accuracy of this model is compared with the traditional ARIMA model and the Weighted K-Means Clustering ARIMA Model. When predicting,errors such as RMSE, MAPE, AIC and AICC are analysed, the results of this suggested work reveal lower values than the ARIMA and Weighted K-Means Clustering ARIMA models. This model also has a greater loglikelihood, demonstrating that this model outperforms the ARIMA model for time series forecasting.