• 제목/요약/키워드: k-means 군집 기법

Search Result 153, Processing Time 0.03 seconds

Crowd Analysis System Using Human Recognition and Clustering Techniques (사람인식 및 클러스터링 기법을 이용한 군집분석 시스템)

  • Tae-jeong Park;Ji-ho Park;Bo-yoon Seo;Jun-ha Shin;Kyung-hwan Choi;Hongseok Yoo
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2023.07a
    • /
    • pp.485-487
    • /
    • 2023
  • 최근 코로나 19 방역지침 해제로 인한 대면적인 활동이 많아지면서 사람에 대한 서비스 제공이 중요한 이슈가 되었다. 하지만 사람들이 밀집되어있는 곳에서는 서비스가 원할하게 이루어지지 않는 경우가 대부분이다. 본 논문에서는 객체인식 알고리즘 기술인 Yolo와 OpenCv를 통해 카메라로 영상 속의 사람들을 인식하여 군집화 기술인 K-means 클러스터링을 이용해서 사람에 대한 군집화를 진행후 우선순위를 선정하고 좌표를 지정하여서 로봇이 군집의 좌표로 이동하여서 사람들에게 직접 접근하여 서비스를 제공할 수 있도록 하였다.

  • PDF

Selection of An Initial Training Set for Active Learning Using Cluster-Based Sampling (능동적 학습을 위한 군집기반 초기훈련집합 선정)

  • 강재호;류광렬;권혁철
    • Journal of KIISE:Software and Applications
    • /
    • v.31 no.7
    • /
    • pp.859-868
    • /
    • 2004
  • We propose a method of selecting initial training examples for active learning so that it can reach high accuracy faster with fewer further queries. Our method is based on the assumption that an active learner can reach higher performance when given an initial training set consisting of diverse and typical examples rather than similar and special ones. To obtain a good initial training set, we first cluster examples by using k-means clustering algorithm to find groups of similar examples. Then, a representative example, which is the closest example to the cluster's centroid, is selected from each cluster. After these representative examples are labeled by querying to the user for their categories, they can be used as initial training examples. We also suggest a method of using the centroids as initial training examples by labeling them with categories of corresponding representative examples. Experiments with various text data sets have shown that the active learner starting from the initial training set selected by our method reaches higher accuracy faster than that starting from randomly generated initial training set.

A Study on Research Paper Classification Using Keyword Clustering (키워드 군집화를 이용한 연구 논문 분류에 관한 연구)

  • Lee, Yun-Soo;Pheaktra, They;Lee, JongHyuk;Gil, Joon-Min
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.7 no.12
    • /
    • pp.477-484
    • /
    • 2018
  • Due to the advancement of computer and information technologies, numerous papers have been published. As new research fields continue to be created, users have a lot of trouble finding and categorizing their interesting papers. In order to alleviate users' this difficulty, this paper presents a method of grouping similar papers and clustering them. The presented method extracts primary keywords from the abstracts of each paper by using TF-IDF. Based on TF-IDF values extracted using K-means clustering algorithm, our method clusters papers to the ones that have similar contents. To demonstrate the practicality of the proposed method, we use paper data in FGCS journal as actual data. Based on these data, we derive the number of clusters using Elbow scheme and show clustering performance using Silhouette scheme.

Group Classification on Management Behavior of Diabetic Mellitus (당뇨 환자의 관리행태에 대한 군집 분류)

  • Choi, Soon-Ho
    • Proceedings of the KAIS Fall Conference
    • /
    • 2010.11b
    • /
    • pp.759-762
    • /
    • 2010
  • 본 연구는 당뇨인지환자들의 당뇨 조절에 관계되는 요인들을 포괄적으로 반영하는 집단으로 분류한 후 이를 기반으로 보다 효율적인 당뇨관리사업을 할 수 있는 기초자료를 제공하기 위해 수행되었다. 연구를 위해 2007년, 2008년도 국민건강영양조사를 통해 검진에 참여한 당뇨인지환자 666명의 자료를 수집하여 분석하였다. 당뇨인지환자의 관리행태에 대한 군집분류는 K-means 기법을 이용하였다. 당뇨인지환자의 군집은 건강행태사업 대상군, 중점관리사업 대상군, 합병증검사사업 대상군으로 분류되었다. 당뇨 조절율을 높이기 위해서는 각 군집의 특성에 따라 보다 특화된 당뇨관리 프로그램이 적용되어야 할 것이다.

  • PDF

Classification by Clustering Analysis for Watersheds Measuring Sediment Yield (유사량 측정 유역 군집분석에 따른 분류)

  • Shin, Seung Sook;Park, Sang Deog;Park, Sangyeon;Yun, Minu
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.114-114
    • /
    • 2017
  • 하천의 유사량 자료는 하상변동 예측, 저수지 퇴사량 추정, 유사조절 계획 수립 등 유역과 하천관리 그리고 하천 시설물 관리를 위해 필요하다. 최근 4대강 사업구간에 대한 담수용 보로 유입되는 유사량과 하천 유사의 종횡단적 분포와 하상변동량 등의 산정에 기초자료로 활용하고자 유사량 관측망이 구축되어 있다. 본 연구에서는 하천 유사량에 영향을 미치는 유역특성인자에 대한 군집분석을 통해 유사 발생 유역을 분류하고자 한다. 체계화된 유량 및 유사량 측정 방법에 의해 신뢰할만한 유량-총유사량 관계식을 갖는 유량조사사업단의 35개 유역을 대상으로 한다. 유역 군집분석을 수행하고자 유역과 하천에 대한 지형인자, 토양인자, 토지이용 등의 유역특성 매개변수 자료를 수집하였고, 매개변수별 유사도거리 산정에 오류를 줄이기 위해 매개변수를 무차원화 하였다. 유역의 비유사량은 유역면적, 유역경사, 토성, 토지이용 등에 영향을 받았다. K-means 기법에 의해 군집분석을 수행한 결과 유사량 측정 유역은 A, B, C, D 4개의 그룹으로 분류되었다. B그룹 유역은 첨두홍수량이 크고 발생시간이 짧은 유역 및 하천 조건을 가지고 있었으며, 직접유출이 증가하는 지표조건과 침식이 활발한 토양조건을 갖는 것으로 파악되었다. 그룹별로 실측 비유사량을 검토한 결과 B그룹에 포함된 유역의 유사량이 다른 유역에 비해 상대적으로 크게 발생하였다. 이러한 결과는 유역특성 매개변수의 군집분석을 통한 유역의 군집분류가 유역과 하천의 유사관리 측면에서 유용한 관리방안으로 활용될 수 있음을 의미한다.

  • PDF

Comparison of Initial Seeds Methods for K-Means Clustering (K-Means 클러스터링에서 초기 중심 선정 방법 비교)

  • Lee, Shinwon
    • Journal of Internet Computing and Services
    • /
    • v.13 no.6
    • /
    • pp.1-8
    • /
    • 2012
  • Clustering method is divided into hierarchical clustering, partitioning clustering, and more. K-Means algorithm is one of partitioning clustering and is adequate to cluster so many documents rapidly and easily. It has disadvantage that the random initial centers cause different result. So, the better choice is to place them as far away as possible from each other. We propose a new method of selecting initial centers in K-Means clustering. This method uses triangle height for initial centers of clusters. After that, the centers are distributed evenly and that result is more accurate than initial cluster centers selected random. It is time-consuming, but can reduce total clustering time by minimizing the number of allocation and recalculation. We can reduce the time spent on total clustering. Compared with the standard algorithm, average consuming time is reduced 38.4%.

A Fine Dust Measurement Technique using K-means and Sobel-mask Edge Detection Method (K-means와 Sobel-mask 윤곽선 검출 기법을 이용한 미세먼지 측정 방법)

  • Lee, Won-Hyeung;Seo, Ju-Wan;Kim, Ki-Yeon;Lin, Chi-Ho
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.22 no.2
    • /
    • pp.97-101
    • /
    • 2022
  • In this paper, we propose a method of measuring Fine dust in images using K-means and Sobel-mask based edge detection techniques using CCTV. The proposed algorithm collects images using a CCTV camera and designates an image range through a region of interest. When clustering is completed by applying the K-means algorithm, outline is detected through Sobel-mask, edge strength is measured, and the concentration of fine dust is determined based on the measured data. The proposed method extracts the contour of the mountain range using the characteristics of Sobel-mask, which has an advantage in diagonal measurement, and shows the difference in detection according to the concentration of fine dust as an experimental result.

Estimation of urban drinking water consumption patterns based on smart water grid monitoring data by k-means clustering in Vietnam (k-means 군집화 기법을 이용한 베트남 스마트워터그리드 계측 데이터 기반 도시 물 사용 패턴 추정)

  • Koo, Kang Min;Han, Kuk Heon;Lee, Gyumin;Jun, Kyung Soo;Yum, Kyung Taek
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2021.06a
    • /
    • pp.419-419
    • /
    • 2021
  • 수자원 관리 패러다임은 공급 위주에서 수요관리로 전환되고 있다. 가용한 수자원은 한정적이나 급속한 인구증가와 도시화로 인한 물 수요의 증가로 수요관리의 효율성이 중시되고 있기 때문이다. 기존 상수도시스템은 노후화로 가동효율이 점차 낮아지고 있으며, 인력으로 월 또는 격월로 소비자의 물 사용량을 검침해 실시간 관리가 불가능하여 수요와 공급의 불균형을 초래한다. 이러한 문제를 해결할 대안으로 IT 기술과 전통적인 물관리 기술을 접목한 Smart Water Grid는 양방향 통신장치를 이용해 실시간으로 소비자의 물 사용량을 모니터링한다. 물 사용 특성을 잘 파악하면 보다 정확한 물 수요 예측이 가능하다. 특히 소비자들의 시간별, 평일, 주말, 그리고 주별 물 사용 특성을 파악하면 미래 물 수요 예측에 도움이 된다. 예측된 물 수요량에 따라 물 공급 배분 계획을 수립하여 운영 효율성을 높일 수 있다. 물 수요예측 방법 중 k-mean 군집분석은 시간별 물 사용량을 이용해 서로 유사한 여러 개의 부분집합으로 할당하여 분류하는 Machine learing 방법으로 물 사용의 유사성을 파악할 수 있다. SWG 연구단은 2019년 Vietnam Hai Duong province에 SWG Pilot plant를 구축하고 27개의 Smart water meter를 설치하여 운영하고 있다. 이에 본 연구에서는 소비자의 물 사용 특성을 분석하기 위해 27개 SWM로부터 수신된 2019년 11월 14일부터 2020년 12월 3일까지 1시간 단위의 물 사용량 데이터를 수집하였다. 그리고 k-mean 군집 방법을 이용해 시간별, 평일, 주말, 그리고 주별 물 사용 특성을 분석하였다. 이 때 최적의 군집 개수 결정을 위해 Elbow 방법을 적용하였다. 분석 결과 각 소비자의 물 사용량 특성에 따라 평균 물 수요패턴 추정이 가능하며, 향후 물 수요 예측에 도움이 될 것으로 사료된다.

  • PDF

Magnifying Block Diagonal Structure for Spectral Clustering (스펙트럼 군집화에서 블록 대각 형태의 유사도 행렬 구성)

  • Heo, Gyeong-Yong;Kim, Kwang-Baek;Woo, Young-Woon
    • Journal of Korea Multimedia Society
    • /
    • v.11 no.9
    • /
    • pp.1302-1309
    • /
    • 2008
  • Traditional clustering methods, like k-means or fuzzy clustering, are prototype-based methods which are applicable only to convex clusters. On the other hand, spectral clustering tries to find clusters only using local similarity information. Its ability to handle concave clusters has gained the popularity recent years together with support vector machine (SVM) which is a kernel-based classification method. However, as is in SVM, the kernel width plays an important role and has a great impact on the result. Several methods are proposed to decide it automatically, it is still determined based on heuristics. In this paper, we proposed an adaptive method deciding the kernel width based on distance histogram. The proposed method is motivated by the fact that the affinity matrix should be formed into a block diagonal matrix to generate the best result. We use the tradition Euclidean distance together with the random walk distance, which make it possible to form a more apparent block diagonal affinity matrix. Experimental results show that the proposed method generates more clear block structured affinity matrix than the existing one does.

  • PDF

A Similar Price Zone Determination of Public Land Price Using K-means Clustering Technique (K-평균 군집화 기법을 이용한 공시지가 유사가격권의 설정)

  • 이성규;홍성언;박수홍
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • 2004.03a
    • /
    • pp.367-372
    • /
    • 2004
  • 비교표준지를 이용하여 개별공시지가를 산정하는 우리나라 제도 하에서 가장 중요한 문제는 개별필지 주변의 표준지 중에서 어떤 표준지를 선택ㆍ이용하여 지가를 산정해야 하는가이다. 그러나 지침상에서는 비교표준지 선정시 중요 요인으로 작용하고 있는 유사가격권에 대하여 수치적인 기준이 아닌 모호한 개념상으로 규정하고 있어 비교표준지 선정에 있어 부정확성을 초래하고 있다. 따라서, 본 연구에서는 객관적인 기준과 수치적인 기준의 부재로 많은 문제점을 발생시키고 있는 유사가격권 설정의 문제를 해결하고자 K-평균 군집화 기법을 활용하여 가격권을 설정하고 이에 대한 타당성을 제시하고자 한다.

  • PDF