• Title/Summary/Keyword: K-Means 클러스터링

Search Result 368, Processing Time 0.023 seconds

Color Sensible Psychology of Child in Image (영상에서의 아동의 색채 감성 심리)

  • Shin, Seong-Yoon;Baek, Jeong-Uk;Rhee, Yang-Won
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2010.10a
    • /
    • pp.649-650
    • /
    • 2010
  • This paper construct the sensibility database by extracting sensibility of 28 colors based on 12 color wheel. And, after the large color values are grouped by clustering of input image using k-mean algorithm, sensibility was extracted by matching with color and database. Also, we see the color sensible psychology of child using color distribution of children in painting.

  • PDF

Design of PCA-based pRBFNNs Pattern Classifier for Digit Recognition (숫자 인식을 위한 PCA 기반 pRBFNNs 패턴 분류기 설계)

  • Lee, Seung-Cheol;Oh, Sung-Kwun;Kim, Hyun-Ki
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.25 no.4
    • /
    • pp.355-360
    • /
    • 2015
  • In this paper, we propose the design of Radial Basis Function Neural Network based on PCA in order to recognize handwritten digits. The proposed pattern classifier consists of the preprocessing step of PCA and the pattern classification step of pRBFNNs. In the preprocessing step, Feature data is obtained through preprocessing step of PCA for minimizing the information loss of given data and then this data is used as input data to pRBFNNs. The hidden layer of the proposed classifier is built up by Fuzzy C-Means(FCM) clustering algorithm and the connection weights are defined as linear polynomial function. In the output layer, polynomial parameters are obtained by using Least Square Estimation (LSE). MNIST database known as one of the benchmark handwritten dataset is applied for the performance evaluation of the proposed classifier. The experimental results of the proposed system are compared with other existing classifiers.

Word Segmentation Algorithm for Handwritten Documents based on k-means Clustering (k-평균 클러스터링을 이용한 필기 문서 영상의 단어 분리법)

  • Ryu, Jewoong;Cho, Nam Ik
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2014.06a
    • /
    • pp.38-41
    • /
    • 2014
  • 본 논문에서는 필기 문서 영상을 분석하여 단어 단위로 요소들을 분할하는 방법을 제안한다. 일반적으로 인쇄 문서에 비하여 필기 문서에서는 글자 간 간격이 일정하지 않을 뿐만 아니라 필기자 또는 작성된 언어에 따라 특성이 매우 다르게 나타나기 때문에 단어를 분리하는 것은 어려운 문제로 간주되었고 많은 연구가 진행되었다. 제안하는 방법은 이 문제를 해결하기 위하여 글자 획의 두께를 고려하여 정규화시킨 각 연결 요소간 간격과 간격 안에 존재하는 글자 픽셀의 수로 구성된 2 차원의 특징값을 추출하였다. 이 특징값을 바탕으로, 제안하는 방법은 k-평균 클러스터링을 이용하여 각 텍스트라인을 구성하는 연결 요소간 간격을 단어 사이의 간격과 단어 내부 글자간의 간격으로 분류하였다. ICDAR 2013 Handwriting Segmentation Contest 데이터베이스에 대한 실험 결과 제안하는 방법은 가장 우수한 성능을 나타내었다.

  • PDF

Detection of the Defected Regions in Manufacturing Process Data using DBSCAN (DBSCAN 기반의 제조 공정 데이터 불량 위치의 검출)

  • Choi, Eun-Suk;Kim, Jeong-Hun;Nasridinov, Aziz;Lee, Sang-Hyun;Kang, Jeong-Tae;Yoo, Kwan-Hee
    • The Journal of the Korea Contents Association
    • /
    • v.17 no.7
    • /
    • pp.182-192
    • /
    • 2017
  • Recently, there is an increasing interest in analysis of big data that is coming from manufacturing industry. In this paper, we use PCB (Printed Circuit Board) manufacturing data to provide manufacturers with information on areas with high PCB defect rates, and to visualize them to facilitate production and quality control. We use the K-means and DBSCAN clustering algorithms to derive the high fraction of PCB defects, and compare which of the two algorithms provides more accurate results. Finally, we develop a system of MVC structure to visualize the information about bad clusters obtained through clustering, and visualize the defected areas on actual PCB images.

Design of Resource Grouping for Desktop Grid Computing and Its Application Methods to Fault-Tolerance (데스크톱 그리드 컴퓨팅을 위한 자원 그룹핑 설계 및 결함포용으로의 적용 방안)

  • Shon, Jin Gon;Gil, Joon-Min
    • Journal of Digital Contents Society
    • /
    • v.14 no.2
    • /
    • pp.171-178
    • /
    • 2013
  • Desktop grid computing is the computing paradigm that can execute large-scale computing jobs using the desktop resources with heterogeneity and volatility. However, such the computing environment can not guarantee the stability and reliability of task execution because the desktop resources with different performance can freely participate and leave in task execution. Therefore, in this paper, we design resource grouping scheme using k-means clustering algorithm with an aim to provide desktop grid computing with the stability and reliability of task execution. Moreover, we conduct resource grouping using the execution log data of actual desktop grid systems and present application methods of desktop resource groups to fault-tolerance.

Data Preprocessing and ML Analysis Method for Abnormal Situation Detection during Approach using Domestic Aircraft Safety Data (국내 항공기 위치 데이터를 활용한 이착륙 접근 단계에서의 항공 위험상황 탐지를 위한 데이터 전처리 및 머신 러닝 분석 기법)

  • Sang Ho Lee;Ilrak Son;Kyuho Jeong;Nohsam Park
    • Journal of Platform Technology
    • /
    • v.11 no.5
    • /
    • pp.110-125
    • /
    • 2023
  • In this paper, we utilize time-series aircraft location data measured based on 2019 domestic airports to analyze Go-Around and UOC_D situations during the approach phase of domestic airports. Various clustering-based machine learning techniques are applied to determine the most appropriate analysis method for domestic aviation data through experimentation. The ADS-B sensor is solely employed to measure aircraft positions. We designed a model using clustering algorithms such as K-Means, GMM, and DBSCAN to classify abnormal situations. Among them, the RF model showed the best performance overseas, but through experiments, it was confirmed that the GMM showed the highest classification performance for domestic aviation data by reflecting the aspects specialized in domestic terrain.

  • PDF

Fault Diagnosis of Induction Motor Using Clustering and Principal Component Analysis (클러스터링과 주성분 분석기법을 이용한 유도전동기 고장진단)

  • Park Chan-Won;Lee Dae-Jong;Park Sung-Moo;Chun Myung-Geun
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2006.05a
    • /
    • pp.208-211
    • /
    • 2006
  • 본 논문에서는 3상 유도전동기의 고장진단을 수행하기 위해 패턴인식에 기반을 둔 진단 알고리즘을 제안한다. 실험 장치는 유도전동기 구동의 고장신호를 얻기 위하여 구축하였으며, 취득된 데이터를 이용하여 진단 알고리즘을 구축하였다. 취득된 데이터 중에서 진단을 위해 사용될 훈련데이터는 퍼지 기반 클러스터링 기법을 이용하여 신뢰성 높은 데이터를 선택하여 고장별 신호를 추출하였다. 진단 알고리즘으로는 데이터를 주성분 분석기법을 적용하였으며, 최종 분류를 위해 Euclidean 기반 거리척도 기법을 이용하였다. 다양한 부하 및 고장신호에 대하여 제안된 방법을 적용하여 타당성을 검증하였다.

  • PDF

Video Segmentation Using a $color-x^2$ intensity histogram-based FCM Clustering (컬러-$x^2$ 명도 히스토그램기반 FCM 클러스터링을 이용한 비디오 분할)

  • Lee, Ji-Hyun;Kang, Oh-Hyung;Na, Do-Won;Rhee, Yang-Won
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.11a
    • /
    • pp.189-192
    • /
    • 2005
  • 비디오 분할의 목적은 같은 내용들을 가지는 프레임들의 순서를 표현하는 각 샷의 비디오 순서 분할을 위한 것이다. 그리고 색인에 대한 각 샷으로부터 키 프레임을 선택한다. 존재하는 비디오 분할 방법들은 2가지 그룹들로 분류될 수 있다. 먼저 경계값이 할당되어야만 하는 샷 전환 검출(SCD) 접근과 클러스터 수의 사전 지식이 요구되는 클러스터 접근이다. 본 논문에서는 컬러-$x^2$명도 히스토그램 기반 FCM(fuzzy c-means) 클러스터링 알고리즘을 사용하는 비디오 분할 방법을 제안하였다. 이 알고리즘은 앞에서 기술한 2가지 접근의 혼합이다. 그리고 이것은 두 가지 접근들의 결점을 극복하도록 설계 되었다. 실험 결과들은 컬러-$x^2$명도 히스토그램 기반 FCM 클러스링 알고리즘이 강건하고 비디오 시퀀스들의 다양한 형태들에 응용할 수 있다고 제안한다.

  • PDF

Design Method of Smart Device User Clustering for Correlation Analysis between Immersive and Biological Signals (몰입도와 생체신호 간 상관관계분석을 위한 스마트기기 사용자 군집방법설계)

  • Lee, KiHoon;Kim, JinAh;Moon, NamMee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.05a
    • /
    • pp.323-325
    • /
    • 2018
  • 본 논문은 몰입도와 생체신호 간의 상관관계를 분석하기 위한 데이터 수집 및 데이터 군집에 대한 연구이다. 스마트기기를 이용해 걸음 수, 심박 수, 수면깊이와 같은 생체 데이터수집과, 수집한 데이터를 토대로 사용자의 행동패턴을 분석한다. 사용자 생체 데이터를 k-means 클러스터링과 계층적 클러스터링을 혼합해 이용해 앞서 나열한 데이터와 사용자의 집중도와 연관관계분석이 최종 목표이다.

Parallel k-Modes Algorithm for Spark Framework (스파크 프레임워크를 위한 병렬적 k-Modes 알고리즘)

  • Chung, Jaehwa
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.6 no.10
    • /
    • pp.487-492
    • /
    • 2017
  • Clustering is a technique which is used to measure similarities between data in big data analysis and data mining field. Among various clustering methods, k-Modes algorithm is representatively used for categorical data. To increase the performance of iterative-centric tasks such as k-Modes, a distributed and concurrent framework Spark has been received great attention recently because it overcomes the limitation of Hadoop. Spark provides an environment that can process large amount of data in main memory using the concept of abstract objects called RDD. Spark provides Mllib, a dedicated library for machine learning, but Mllib only includes k-means that can process only continuous data, so there is a limitation that categorical data processing is impossible. In this paper, we design RDD for k-Modes algorithm for categorical data clustering in spark environment and implement an algorithm that can operate effectively. Experiments show that the proposed algorithm increases linearly in the spark environment.