• Title/Summary/Keyword: k-means clustering Algorithm

Search Result 545, Processing Time 0.025 seconds

Design of RBFNN-Based Pattern Classifier for the Classification of Precipitation/Non-Precipitation Cases (강수/비강수 사례 분류를 위한 RBFNN 기반 패턴분류기 설계)

  • Choi, Woo-Yong;Oh, Sung-Kwun;Kim, Hyun-Ki
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.24 no.6
    • /
    • pp.586-591
    • /
    • 2014
  • In this study, we introduce Radial Basis Function Neural Networks(RBFNNs) classifier using Artificial Bee Colony(ABC) algorithm in order to classify between precipitation event and non-precipitation event from given radar data. Input information data is rebuilt up through feature analysis of meteorological radar data used in Korea Meteorological Administration. In the condition phase of the proposed classifier, the values of fitness are obtained by using Fuzzy C-Mean clustering method, and the coefficients of polynomial function used in the conclusion phase are estimated by least square method. In the aggregation phase, the final output is obtained by using fuzzy inference method. The performance results of the proposed classifier are compared and analyzed by considering both QC(Quality control) data and CZ(corrected reflectivity) data being used in Korea Meteorological Administration.

Data Clustering Algorithm Adaptive to Data Forms (데이터 형태에 적응하는 클러스터링 알고리즘)

  • Lee, K.H.;Lee, K.C.
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2000.10b
    • /
    • pp.1433-1436
    • /
    • 2000
  • 클러스터링에 있어서 k-means[7], DBSCAN[2], CURE[4], ROCK[5], PAM[8], 같은 기존의 알고리즘은 원형이나 타원형 등의 어느 고정된 모양에 의해 클러스터를 결정한다. 만약 클러스터 하려는 데이터의 분포가 우연히 알고리즘의 결정된 모양과 일치하면 정확한 해를 얻을 수 있다. 하지만 자연적인 데이터의 분포에서는 발생하기 어렵다. 데이터의 형태를 추적하여 이러한 문제점을 해결한 CHAMELEON[1] 알고리즘이 최근에 발표되었다. 하지만 모양에는 독립적이나 데이터의 양이 증가함에 따라 소요되는 시간이 폭발적으로 증가한다. 이것은 기존의 마이닝 데이터들이 대용량이라는 것을 고려하면 현실에 적용하기 힘든 문제점이 있다. 이러한 문제점을 해결하기 위해 본 논문에서는 K-means[7]]를 이용한 대표를 선출하는 방법으로 CHAMELEON[1]의 문제점 개선(EF-CHAMELEON)을 시도하였으며 여러 자연적인 형태의 도형들은 아주 작은 원형들의 집합으로 구성 될 수 있다는 생각을 기본으로 잡음에 영향을 받지 않을 정도로 아주 작은 초기 다수의 소형 클러스터를 K-mean을 이용하여 구성하고 이를 다시 크러스터간의 상대적인 거리를 이용하여 다시 머지 하는 방법으로 모양에 의존적인 문제를 해결하며 비교사 학습(unsupervised learning)에 충실하기 위해 임계값을 적용 적정 단계에서 알고리즘을 멈추게 한 ADF 알고리즘을 소개한다. 실험 데이터는 기존의 여러 클러스터링 알고리즘이 판별 할 수 없었던 다양한 모양을 가지고있는 2차원 배열을 사용하여 ADF. CHAMELEON[1], EF-CHAMELEON,의 성능을 비교하였다.

  • PDF

Novel Image Stabilizing Techniques toy Mobile Video Communications

  • Kang, Byoung-Su;Kim, Jae-Won;Lee, Jun-Suk;Park, kang-Sun;Ko, Sung-Jea
    • Proceedings of the IEEK Conference
    • /
    • 2000.07a
    • /
    • pp.433-436
    • /
    • 2000
  • In this paper, we present two types of digital image stabilization (DIS) schemes for mobile video communications. In the first scheme, the DIS system, which is used as a preprocessor of the video encoder, compensates the camera’s undesirable shakes before encoding. This method can reduce the bit rate of encoded video sequence by attenuating the prediction error to be encoded. In the second proposed scheme, the DIS system is coupled with the video decoder. The second scheme uses the K-means clustering algorithm to estimate the camera motion using motion vectors decoded from the received video stream. Simulation results show that the first scheme improves coding efficiency, while the second scheme is computationally efficient since it does not require motion estimation.

  • PDF

Applying Collaborative Filtering for Analysis of User's behavior (사용자의 행동 분석을 위한 과거 기록의 협력 필터링 적용)

  • Kim, Yong-Jun;Park, Jung-Eun;Oh, Kyung-Hwan
    • 한국HCI학회:학술대회논문집
    • /
    • 2006.02a
    • /
    • pp.1289-1297
    • /
    • 2006
  • 모든 곳에 존재하는 네트워크 환경을 의미하는 '유비쿼터스' 시대와 최신 기술로 구현되어 인간을 도와주는 '지능형 로봇'의 시대가 도래하고 있다. 기술의 흐름은, 이제 우리에게 공장과 공원 등의 공공 장소뿐 만이 아니라, 생활의 기본이 되는 가정 안에서의 로봇을 받아들일 준비를 요구하고 있다. 로봇과 사용자는 실제 생활 속에서 많은 상호 작용을 하게 되며, 필연적으로 여러 가지의 불확실성을 내포하게 되는데, 각각의 요청들과 상황들은, 미리 정해진 규칙에 의거해 처리하기에는 너무 다양하다. 그 어려움을 극복하는 방법으로, 어떤 상황에 적응하는 방법으로 기억을 사용 하는 인간과 마찬가지로, 로봇은 새로운 요청을 처리하기 위해 과거의 기록을 사용할 수 있다. 여러 가지 과거의 기록들을 잘 정리해서 분류하여 저장해둔 후, 현재의 요청에 대한 답으로, 가장 가능성 있는 과거의 기록을 찾아내는 것이다. 본 논문에서는 사용자와 로봇 사이에서 상호 작용에서 발생할 수 있는 불확실성을 과거기록의 탐색을 통해 해결하고자 하였다. 과거 기록은 시간, 장소, 대상 물건, 행동 유형으로 구분되어 저장하였으며, 각각의 유사 가능성(Possibility)들의 합을 기준으로, 전체 기록을 K-Means 알고리즘을 통하여 군집화하고 협력 필터링을 기반으로 현재의 요청이 담고 있는 불확실성에 대한 가능성 있는 값을 추천해 주었다. 제한된 공간과 제한된 자료의 수에 의한 실험 결과로서의 한계를 가지고 있지만, 실제 가정용 로봇에서의 적용 가능성을 보여주었다.

  • PDF

Combined Image Retrieval System using Clustering and Condensation Method (클러스터링과 차원축약 기법을 통합한 영상 검색 시스템)

  • Lee Se-Han;Cho Jungwon;Choi Byung-Uk
    • Journal of the Institute of Electronics Engineers of Korea CI
    • /
    • v.43 no.1 s.307
    • /
    • pp.53-66
    • /
    • 2006
  • This paper proposes the combined image retrieval system that gives the same relevance as exhaustive search method while its performance can be considerably improved. This system is combined with two different retrieval methods and each gives the same results that full exhaustive search method does. Both of them are two-stage method. One uses condensation of feature vectors, and the other uses binary-tree clustering. These two methods extract the candidate images that always include correct answers at the first stage, and then filter out the incorrect images at the second stage. Inasmuch as these methods use equal algorithm, they can get the same result as full exhaustive search. The first method condenses the dimension of feature vectors, and it uses these condensed feature vectors to compute similarity of query and images in database. It can be found that there is an optimal condensation ratio which minimizes the overall retrieval time. The optimal ratio is applied to first stage of this method. Binary-tree clustering method, searching with recursive 2-means clustering, classifies each cluster dynamically with the same radius. For preserving relevance, its range of query has to be compensated at first stage. After candidate clusters were selected, final results are retrieved by computing similarities again at second stage. The proposed method is combined with above two methods. Because they are not dependent on each other, combined retrieval system can make a remarkable progress in performance.

Disambiguation of Author Names Using Co-citation (동시인용정보를 이용한 동명이인 저자의 중의성 해소)

  • Kang, In-Su
    • Journal of Information Management
    • /
    • v.42 no.3
    • /
    • pp.167-186
    • /
    • 2011
  • Co-citation means that two or more studies are cited together by a later study. This paper deals with the relationship between co-citation and author disambiguation. Author disambiguation is to cluster same-name author instances into real-world individuals. Co-citation may influence author disambiguation in terms that two or more related research works performed by the same person may be co-cited by some later studies. This article describes automated steps to gather co-citation information from Google scholar, and proposes a new clustering algorithm to effectively integrate co-citation information with other author disambiguation features. Experiments showed that co-citation helps to improve the performance of author disambiguation.

Word Segmentation Algorithm for Handwritten Documents based on k-means Clustering (k-평균 클러스터링을 이용한 필기 문서 영상의 단어 분리법)

  • Ryu, Jewoong;Cho, Nam Ik
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2014.06a
    • /
    • pp.38-41
    • /
    • 2014
  • 본 논문에서는 필기 문서 영상을 분석하여 단어 단위로 요소들을 분할하는 방법을 제안한다. 일반적으로 인쇄 문서에 비하여 필기 문서에서는 글자 간 간격이 일정하지 않을 뿐만 아니라 필기자 또는 작성된 언어에 따라 특성이 매우 다르게 나타나기 때문에 단어를 분리하는 것은 어려운 문제로 간주되었고 많은 연구가 진행되었다. 제안하는 방법은 이 문제를 해결하기 위하여 글자 획의 두께를 고려하여 정규화시킨 각 연결 요소간 간격과 간격 안에 존재하는 글자 픽셀의 수로 구성된 2 차원의 특징값을 추출하였다. 이 특징값을 바탕으로, 제안하는 방법은 k-평균 클러스터링을 이용하여 각 텍스트라인을 구성하는 연결 요소간 간격을 단어 사이의 간격과 단어 내부 글자간의 간격으로 분류하였다. ICDAR 2013 Handwriting Segmentation Contest 데이터베이스에 대한 실험 결과 제안하는 방법은 가장 우수한 성능을 나타내었다.

  • PDF

Design of Fuzzy k-Nearest Neighbors Classifiers based on Feature Extraction by using Stacked Autoencoder (Stacked Autoencoder를 이용한 특징 추출 기반 Fuzzy k-Nearest Neighbors 패턴 분류기 설계)

  • Rho, Suck-Bum;Oh, Sung-Kwun
    • The Transactions of The Korean Institute of Electrical Engineers
    • /
    • v.64 no.1
    • /
    • pp.113-120
    • /
    • 2015
  • In this paper, we propose a feature extraction method using the stacked autoencoders which consist of restricted Boltzmann machines. The stacked autoencoders is a sort of deep networks. Restricted Boltzmann machines (RBMs) are probabilistic graphical models that can be interpreted as stochastic neural networks. In terms of pattern classification problem, the feature extraction is a key issue. We use the stacked autoencoders networks to extract new features which have a good influence on the improvement of the classification performance. After feature extraction, fuzzy k-nearest neighbors algorithm is used for a classifier which classifies the new extracted data set. To evaluate the classification ability of the proposed pattern classifier, we make some experiments with several machine learning data sets.

Document clustering based on summarized document using K-means algorithm (요약 문서 기반 문서 클러스터링)

  • Oh, Hyung-Jin;Ko, Ji-Hyun;An, Dong-Un;Chung, Sung-Jong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.04a
    • /
    • pp.589-592
    • /
    • 2002
  • 정보검색 시스템에서 문서 클러스터링 기법은 사용자 질의에 대하여 검색된 문서를 문서간의 관련도에 따라 클러스터로 구성하고 사용자에게 검색 결과로 보여주는 것이다. 본 논문에서는 사용자의 질의에 대하여 검색된 문서를 자동 문서 요약기를 통해 얻은 요약 문서와 문서 전문을 문서들간의 유사도를 기반으로 동적으로 클러스터링 한다. 구현한 시스템의 클러스터링 효과를 검증한 결과 검색된 문서 전문을 클러스터링 한 방식에 비해 요약 문서를 클러스터링 한 방식이 정확률 측면에서 더 나은 성능을 보였다.

  • PDF

Mobile Automatic Conversion System using MLP (다층신경망을 이용한 모바일 자동 변환 시스템)

  • Han, Eun-Jung;Jang, Chang-Hyuk;Jung, Kee-Chul
    • Journal of Korea Multimedia Society
    • /
    • v.12 no.2
    • /
    • pp.272-280
    • /
    • 2009
  • The recent mobile industry is providing of a lot of image on/off-line contents are being converted into the mobile contents for architectural design. However, it is difficult to provide users with the existing on/off-line contents without any considerations due to the small size of the mobile screen. In existing methods to overcome the problem, the comic contents on mobile devices are manually produced by computer software such as Photoshop. In this paper, I describe the Automatic Comics Conversion(ACC) system that provides the variedly form of offline comic contents into mobile device of the small screen using Multi-Layer Perceptorn(MLP). ACC produces an experience together with the comic contents fitting for the small screen, which introduces a clustering method that is useful for variety types of comic images and characters as a prerequisite as a stage for preserving semantic meaning. An application is to use the frame form of pictures, website and images in order into mobile device the availability and can bounce back the freeze images contents into dynamic images content.

  • PDF