• Title/Summary/Keyword: Automatic Clustering

Search Result 242, Processing Time 0.025 seconds

그래프 컷을 이용한 학습된 자기 조직화 맵의 자동 군집화 (Automatic Clustering on Trained Self-organizing Feature Maps via Graph Cuts)

  • 박안진;정기철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권9호
    • /
    • pp.572-587
    • /
    • 2008
  • SOFM(Self-organizing Feature Map)은 고차원의 데이타를 군집화(clustering)하거나 시각화(visualization)하기 위해 많이 사용되고 있는 비교사 학습 신경망(unsupervised neural network)의 한 종류이며, 컴퓨터비전이나 패턴인식 분야에서 다양하게 활용되고 있다. 최근 SOFM이 실제 응용분야에 다양하게 활용되고 좋은 결과를 보이고 있지만, 학습된 SOFM의 뉴론(neuron)을 다시 군집화해야 하는 후처리가 필요하며, 대부분의 경우 수동으로 이루어지고 있다. 후처리를 자동으로 하기 위해 k-means와 같은 기존의 군집화 알고리즘을 많이 이용하지만, 이 방법은 특히 다양한 모양의 클래스를 가진 고차원의 데이타에서 만족스럽지 못한 결과를 보인다. 다양한 모양의 클래스에서 좋은 성능을 보이기 위해, 본 논문에서는 그래프 컷(graph cut)을 이용하여 학습된 SOFM을 자동으로 군집화하는 방법을 제안한다. 그래프 컷을 이용할 때 터미널(terminal)이라는 두 개의 추가적인 정점(vertex)이 필요하며, 터미널과 각 정점 사이의 가중치는 대부분 사용자에 의해 입력받은 사전정보를 기반으로 설정된다. 제안된 방법은 SOFM의 거리 매트릭스(distance matrix)를 기반으로 한 모드 탐색(mode-seeking)과 모드의 군집화를 통하여 자동으로 사전정보를 설정하며, 학습된 SOFM의 군집화를 자동으로 수행한다. 실험에서 효율성을 검증하기 위해 제안된 방법을 텍스처 분할(texture segmentation)에 적용하였다. 실험 결과에서 제안된 방법은 기존의 군집화 알고리즘을 이용한 방법보다 높은 정확도를 보였으며, 이는 그래프기반의 군집화를 통해 다양한 모양의 클러스터를 처리할 수 있기 때문이다.

K-Means 클러스터링을 활용한 선박입항패턴 단계화 연구 (A Study on Phase of Arrival Pattern using K-means Clustering Analysis)

  • 이정석;이형탁;조익순
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2020년도 추계학술대회
    • /
    • pp.54-55
    • /
    • 2020
  • 4차 산업혁명으로 인공지능, 사물인터넷, 빅데이터 등의 기술이 조선 해운 산업에 매우 밀접하게 연관 되고 있고 이는 자율운항선박의 탄생을 가져왔다. 현재 선박의 기술적 특성상 속력을 갑자기 낮출 수 없으므로 항만에 접안하기 위해 예인선의 도움, 도선사의 승선, 육상관제센터의 선박 컨트롤 등 복잡한 커뮤니케이션을 필요로 한다. 본 연구에서는 자율운항선박이 도입될 경우 선박이 입항하기 위한 컨트롤 기준을 어떻게 설정할지 해결하고자 클러스터링 분석을 사용하였다. 입항 선박의 축적된 AIS 데이터를 기반으로 입항 패턴을 정량적으로 단계화하고자 K-Means 클러스터링을 사용했고 SOG(Speed over Ground), COG(Course over Ground), ROT(Rate of Turn)를 사용하여 입항 단계를 6개로 구분하였다.

  • PDF

Automatic Left Ventricle Segmentation using Split Energy Function including Orientation Term from CTA

  • Kang, Ho Chul
    • International journal of advanced smart convergence
    • /
    • 제7권2호
    • /
    • pp.1-6
    • /
    • 2018
  • In this paper, we propose an automatic left ventricle segmentation method in computed tomography angiography (CTA) using separating energy function. First, we smooth the images by applying anisotropic diffusion filter to remove noise. Secondly, the volume of interest (VOI) is detected by using k-means clustering. Thirdly, we divide the left and right heart with split energy function. Finally, we extract only left ventricle from left and right heart with optimizing cost function including orientation term.

Mountain Clustering 기반 퍼지 RBF 뉴럴네트워크의 동정 (Identification of Fuzzy-Radial Basis Function Neural Network Based on Mountain Clustering)

  • 최정내;오성권;김현기
    • 한국정보전자통신기술학회논문지
    • /
    • 제1권3호
    • /
    • pp.69-76
    • /
    • 2008
  • 본 논문에서는 Mountain clustering 알고리즘을 이용한 Fuzzy Radial Basis Function Neural Network(FRBFNN)의 규칙 수를 자동생성 방법을 제시한다. FRBFNN은 기존 RBFNN에서 가우시안이나 타원형 형태의 특정 RBF를 사용하는 구조와 달리 클러스터의 중심값과의 거리에 기반을 둔 멤버쉽함수를 사용하여 전반부의 공간 분할 및 활성화 레벨을 결정한다. 또한 분할된 로컬영역에서의 입출력 특성을 나타내는 퍼지규칙의 후반부로서 고차 다항식을 고려하였다. 본 논문에서는 데이터의 밀집도에 기반을 두어 클러스터링을 수행하는 Mountain clustering 알고리즘을 사용하여 적합한 퍼지 규칙(클러스터)의 수와 클러스터의 중심값을 자동적으로 생성하는 방법을 제안한다. Mountain clustering으로부터 구해진 클러스터의 중심은 멤버쉽 값을 결정하는데 사용되며, Weighted Least Square Estimator (WLSE) 알고리즘을 사용하여 후반부 다항식의 계수를 추정한다. 제안된 알고리즘은 비선형 함수 모델링에 적용하여 성능의 우수성과 알고리즘의 타당성을 보인다.

  • PDF

디자인 패턴 구조를 이용한 클러스터링에 관한 연구 (A Study on Clustering Algorithm Using Design Pattern Structure)

  • 한정수;김귀정
    • 한국콘텐츠학회논문지
    • /
    • 제2권1호
    • /
    • pp.68-76
    • /
    • 2002
  • 클러스터링은 부품 분류의 대표적인 방법인데, 클래스나 모듈의 응집도와 결합도를 이용한 기존의 클러스터링 방법은 클래스간의 관계에 중점을 둔 디자인 패턴을 기존의 클러스터링 방법을 이용하는 것은 효과적일 수 있다. 본 논문에서는 디자인 패턴을 분류하기 위해 패턴 구조의 특성을 가지고 분류하였다. 그리고 클러스터링에 의한 분류는 패싯 분류에 의한 방법보다 높은 정확도를 보여주었다. 따라서 자동화된 분류방법인 클러스터링 알고리즘을 사용하여 디자인 패턴을 분류하는 것이 효과적이라 할 수 있다. 디자인 패턴의 분류는 검색 시 유사한 패턴들이 같은 카테고리에 저장이 되므로 유사 패턴을 비교하여 사용할 수 있으며, 패턴 클러스터링에 의해 분류되고, 패턴의 링크정보를 이용하여 저장하므로 저장소를 효율적으로 관리할 수 있다.

  • PDF

Deduplication and Exploitability Determination of UAF Vulnerability Samples by Fast Clustering

  • Peng, Jianshan;Zhang, Mi;Wang, Qingxian
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권10호
    • /
    • pp.4933-4956
    • /
    • 2016
  • Use-After-Free (UAF) is a common lethal form of software vulnerability. By using tools such as Web Browser Fuzzing, a large amount of samples containing UAF vulnerabilities can be generated. To evaluate the threat level of vulnerability or to patch the vulnerabilities, automatic deduplication and exploitability determination should be carried out for these samples. There are some problems existing in current methods, including inadequate pertinence, lack of depth and precision of analysis, high time cost, and low accuracy. In this paper, in terms of key dangling pointer and crash context, we analyze four properties of similar samples of UAF vulnerability, explore the method of extracting and calculate clustering eigenvalues from these samples, perform clustering by fast search and find of density peaks on a large number of vulnerability samples. Samples were divided into different UAF vulnerability categories according to the clustering results, and the exploitability of these UAF vulnerabilities was determined by observing the shape of class cluster. Experimental results showed that the approach was applicable to the deduplication and exploitability determination of a large amount of UAF vulnerability samples, with high accuracy and low performance cost.

슈퍼픽셀 DBSCAN 군집 알고리즘을 이용한 용융아연도금 강판의 부식이미지 분석 (Corrosion image analysis on galvanized steel by using superpixel DBSCAN clustering algorithm)

  • 김범수;김연원;이경황;양정현
    • 한국표면공학회지
    • /
    • 제55권3호
    • /
    • pp.164-172
    • /
    • 2022
  • Hot-dip galvanized steel(GI) is widely used throughout the industry as a corrosion resistance material. Corrosion of steel is a common phenomenon that results in the gradual degradation under various environmental conditions. Corrosion monitoring is to track the degradation progress for a long time. Corrosion on steel plate appears as discoloration and any irregularities on the surface. This study developed a quantitative evaluation method of the rust formed on GI steel plate using a superpixel-based DBSCAN clustering method and k-means clustering from the corroded area in a given image. The superpixel-based DBSCAN clustering method decrease computational costs, reaching automatic segmentation. The image color of the rusty surface was analyzed quantitatively based on HSV(Hue, Saturation, Value) color space. In addition, two segmentation methods are compared for the particular spatial region using their histograms.

지리정보를 이용한 자동사진분류 (Automatic Photograph Classification Using Geographical Information)

  • 홍영진;김성운;유명현;이영범;김상룡
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 1부
    • /
    • pp.692-698
    • /
    • 2006
  • 점점 더 많은 디지털 카메라와 휴대폰이 고해상도 카메라가 장착되고 대용량의 저장공간이 제공되면서 사용자들의 사진촬영 빈도가 증대하고 있다. 조만간 휴대폰의 저장된 사진을 효과적으로 관리하고 브라우징할 수 있는 기술이 필요한 시기가 올 것이다. 본 논문은 휴대폰이나 디지털 카메라 혹은 카메라가 장착되어 사진을 찍을 수 있는 모든 형태의 휴대단말에서 촬영된 개인사진을 지리적 위치정보를 이용하여 자동으로 분류하는 시스템을 제시한다. 기존의 시간정보를 이용하여 촬영시간의 근접성을 이용해 순차적으로 자동 분류하는 시스템과는 달리 위치정보를 이용하여 촬영위치에 따라 비순차적으로 자동 분류한다. 촬영위치 근접성을 결정하기 위해 밀도기반 클러스터링 알고리즘을 사용하여 전체 사진을 대분류하고 기존의 자동사진 분류방식에서는 다루지 않았던 일상사진과 비일상사진을 분류하고, 대분류된 사진을 시간정보를 이용하여 소분류 함으로서 자동 사진분류 성능을 높이고자 한다.

  • PDF

Region Identification on a Trained Growing Self-Organizing Map for Sequence Separation between Different Phylogenetic Genomes

  • Reinhard, Johannes;Chan, Chon-Kit Kenneth;Halgamuge, Saman K.;Tang, Sen-Lin;Kruse, Rudolf
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2005년도 BIOINFO 2005
    • /
    • pp.124-129
    • /
    • 2005
  • The Growing Self-Organizing Map (GSOM), an extended type of the Self-Organizing Map, is a widely accepted tool for clustering high dimensional data. It is also suitable for the clustering of short DNA sequences of phylogenetic genomes by their oligonucleotide frequency. The GSOM presents the result of the clustering process visually on a coloured map, where the clusters can be identified by the user. This paper describes a proposal for automatic cluster detection on this map without any participation by the user. It has been applied with good success on 20 different data sets for the purpose of species separation.

  • PDF

Consistent Triplets of Candidate Paralogs by Graph Clustering

  • Yun, Hwa-Seob;Muchnik, Ilya;Kulikowski, Casimir
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2005년도 BIOINFO 2005
    • /
    • pp.156-160
    • /
    • 2005
  • We introduce a fully automatic clustering method to classier candidate paralog clusters from a set of protein sequences within one genome. A set of protein sequences is represented as a set of nodes, each represented by the amino acid sequence for a protein with the sequence similarities among them constituting a set of edges in a graph of protein relationships. We use graph-based clustering methods to identify structurally consistent sets of nodes which are strongly connected with each other. Our results are consistent with those from current leading systems such as COG/KOG and KEGG based on manual curation. All the results are viewable at http://www.cs.rutgers.edu/${\sim}$seabee.

  • PDF