• Title/Summary/Keyword: 계층적 군집방법

Search Result 116, Processing Time 0.03 seconds

Effective Classification Method of Hierarchical CNN for Multi-Class Outlier Detection (다중 클래스 이상치 탐지를 위한 계층 CNN의 효과적인 클래스 분할 방법)

  • Kim, Jee-Hyun;Lee, Seyoung;Kim, Yerim;Ahn, Seo-Yeong;Park, Saerom
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.81-84
    • /
    • 2022
  • 제조 산업에서의 이상치 검출은 생산품의 품질과 운영비용을 절감하기 위한 중요한 요소로 최근 딥러닝을 사용하여 자동화되고 있다. 이상치 검출을 위한 딥러닝 기법에는 CNN이 있으며, CNN을 계층적으로 구성할 경우 단일 CNN 모델에 비해 상대적으로 성능의 향상을 보일 수 있다는 것이 많은 선행 연구에서 나타났다. 이에 MVTec-AD 데이터셋을 이용하여 계층 CNN이 다중 클래스 이상치 판별 문제에 대해 효과적인지를 탐구하고자 하였다. 실험 결과 단일 CNN의 정확도는 0.7715, 계층 CNN의 정확도는 0.7838로 다중 클래스 이상치 판별 문제에 있어 계층 CNN 방식 접근이 다중 클래스 이상치 탐지 문제에서 알고리즘의 성능을 향상할 수 있음을 확인할 수 있었다. 계층 CNN은 모델과 파라미터의 개수와 리소스의 사용이 단일 CNN에 비하여 기하급수적으로 증가한다는 단점이 존재한다. 이에 계층 CNN의 장점을 유지하며 사용 리소스를 절약하고자 하였고 K-means, GMM, 계층적 클러스터링 알고리즘을 통해 제작한 새로운 클래스를 이용해 계층 CNN을 구성하여 각각 정확도 0.7930, 0.7891, 0.7936의 결과를 얻을 수 있었다. 이를 통해 Clustering 알고리즘을 사용하여 적절히 물체를 분류할 경우 물체에 따른 개별 상태 판단 모델을 제작하는 것과 비슷하거나 더 좋은 성능을 내며 리소스 사용을 줄일 수 있음을 확인할 수 있었다.

  • PDF

A Divisive Clustering for Mixed Feature-Type Symbolic Data (혼합형태 심볼릭 데이터의 군집분석방법)

  • Kim, Jaejik
    • The Korean Journal of Applied Statistics
    • /
    • v.28 no.6
    • /
    • pp.1147-1161
    • /
    • 2015
  • Nowadays we are considering and analyzing not only classical data expressed by points in the p-dimensional Euclidean space but also new types of data such as signals, functions, images, and shapes, etc. Symbolic data also can be considered as one of those new types of data. Symbolic data can have various formats such as intervals, histograms, lists, tables, distributions, models, and the like. Up to date, symbolic data studies have mainly focused on individual formats of symbolic data. In this study, it is extended into datasets with both histogram and multimodal-valued data and a divisive clustering method for the mixed feature-type symbolic data is introduced and it is applied to the analysis of industrial accident data.

Font Classification using NMF and EMD (NMF와 EMD를 이용한 영문자 활자체 폰트분류)

  • Lee, Chang-Woo;Kang, Hyun;Jung, Kee-Chul;Kim, Hang-Joon
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.688-690
    • /
    • 2004
  • 최근 전자화된 문서 영상을 효율적으로 관리하고 검색하기 위한 문서구조분석 방법과 문서의 자동 분류에 관한 많은 연구가 발표되고 있다. 본 논문에서는 NMF(non-negative matrix factorization) 알고리즘을 사용하여 폰트를 자동으로 분류하는 방법을 제안한다. 제안된 방법은 폰트의 구분 특징들이 공간적으로 국부성을 가지는 부분으로 표현될 수 있다는 가정을 바탕으로, 전체의 폰트 이미지들로부터 각 폰트들의 구분 특징인 부분을 학습하고, 학습된 부분들을 특징으로 사용하여 폰트를 분류하는 방법이다. 학습된 폰트의 특징들은 계층적 군집화 알고리즘을 이용하여 템플릿을 생성하고, 테스트 패턴을 분류하기 위하여 템플릿 패턴과의 EMD(earth mover's distance)를 사용한다. 실험결과에서 폰트 이미지들의 공간적으로 국부적인 특징들이 조사되고, 그 특징들의 폰트 식별을 위한 적절성을 보였다. 제안된 방법이 기존의 문자인식. 문서 검색 시스템들의 전처리기로 사용되면. 그 시스템들의 성능을 향상시킬 것으로 기대된다.

  • PDF

A Study on the Site Selection of Public Libraries Using Analytic Hierarchy Process Technique and Geographic Information System (계층분석법과 지리정보시스템을 이용한 공공도서관 입지선정에 관한 연구)

  • Park, Sung-Jae;Lee, Jee-Yeon
    • Journal of the Korean Society for information Management
    • /
    • v.22 no.1 s.55
    • /
    • pp.65-85
    • /
    • 2005
  • This study proposes a new site selection model which reflects integrated opinions of several groups and identifies sites through objectivity of selection procedure. The proposed model consists of two parts, Analytic Hierarchy Process(AHP) and Geographic Information(GIS). This model was applied to Seocho-gu in Seoul. First, library site selection criteria were determined through literature study. Hierarchical relationship based on the questionnaire was determined and refined to be suited to Seocho-gu case. A survey was conducted with three groups, namely, library users, librarians, and public worker. A few inconsistent answers to the survey questionnaire were excluded and the relative importance of each criterion was measured. Next, an overlay method was used and the relative importance was used as a weight for selecting candidates. This process excluded the areas where a library was unable to be built, for example, rivers, military areas, other restricted areas by law, etc. and resulted in seventy-five sites. Five groups of candidates were identified according to the similarity of criteria. Finally, four groups, after eliminating one lowly fitted group, were determined.

Comparison of Initial Seeds Methods for K-Means Clustering (K-Means 클러스터링에서 초기 중심 선정 방법 비교)

  • Lee, Shinwon
    • Journal of Internet Computing and Services
    • /
    • v.13 no.6
    • /
    • pp.1-8
    • /
    • 2012
  • Clustering method is divided into hierarchical clustering, partitioning clustering, and more. K-Means algorithm is one of partitioning clustering and is adequate to cluster so many documents rapidly and easily. It has disadvantage that the random initial centers cause different result. So, the better choice is to place them as far away as possible from each other. We propose a new method of selecting initial centers in K-Means clustering. This method uses triangle height for initial centers of clusters. After that, the centers are distributed evenly and that result is more accurate than initial cluster centers selected random. It is time-consuming, but can reduce total clustering time by minimizing the number of allocation and recalculation. We can reduce the time spent on total clustering. Compared with the standard algorithm, average consuming time is reduced 38.4%.

Item Hierarchy based Frequent Itemset Ordering Method (항목 계층 구조에 기반한 빈발 항목 집합 나열 방법)

  • Kim, jun woo;Kang, hyun kyung
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2013.05a
    • /
    • pp.301-302
    • /
    • 2013
  • 연관 규칙 탐사는 이산적인 항목들을 포함하는 트랜잭션 데이터에 존재하는 항목 간 동시 발생 관계를 찾아내는 데 그 목적을 두고 있다. 연관 규칙은 {전항}${\rightarrow}${후항}의 형태를 갖고, 전, 후항은 모두 사전에 정의된 지지도 하한을 만족하는 빈발 항목 집합으로 구성된다. 연관 규칙 탐사에서 문제가 되는 것은 일반적으로 탐사되는 빈발 항목 집합의 개수가 많아지면서 규칙의 개수도 많아지고, 이들 사이에 중복성이 존재한다는 점이다. 따라서 단순히 지지도나 신뢰도 순으로 빈발 항목 집합이나 규칙을 나열하기보다는 항목들의 연관성을 고려하는 것이 분석자에게 보다 도움이 될 수 있다. 본 논문에서는 이를 위하여 연관 규칙 탐사와 함께 계층 군집 분석을 실시하여 항목들 간 연관성을 정리하고, 이를 토대로 빈발 항목 집합들을 나열하는 방법을 제안하고자 한다.

  • PDF

Socio-economic Polarization and Intra-urban Residential Segregation by Class (사회경제적 양극화와 도시 내 계층별 거주지 분리)

  • Chung, Su-Yeul
    • Journal of the Economic Geographical Society of Korea
    • /
    • v.18 no.1
    • /
    • pp.1-16
    • /
    • 2015
  • It is widely believed that increasing socio-economic polarization inspired by globalization and economic restructuring worsens residential segregation by class in Korean cities. However, the existing literature falls short in showing the recent changes of the residential segregation, particularly after the 1997 financial crisis, with reliable and systematic segregation measures. Noting that there are the two major dimension in residential segregation - evenness-concentration and exposure-clustering - this study introduced not only global measure (dissimilarity index and isolation/interaction index) but also local measures (location quotient and Local Moran's I) for each dimension. These measures are applied to the case study of Seoul in the 2000s. The class is defined by education attainment and the data is obtain through the MicroData System Service System(MDSS). The result shows that the residential segregation by education attainment persists through 2000s and even get worse in some dimension. More significantly, it turns out that high-class and low-class residence are nearly mirror-images of each other, indicating high segregation.

  • PDF

Property-based Hierarchical Clustering of Peers using Mobile Agent for Unstructured P2P Systems (비구조화 P2P 시스템에서 이동에이전트를 이용한 Peer의 속성기반 계층적 클러스터링)

  • Salvo, MichaelAngelG.;Mateo, RomeoMarkA.;Lee, Jae-Wan
    • Journal of Internet Computing and Services
    • /
    • v.10 no.4
    • /
    • pp.189-198
    • /
    • 2009
  • Unstructured peer-to-peer systems are most commonly used in today's internet. But file placement is random in these systems and no correlation exists between peers and their contents. There is no guarantee that flooding queries will find the desired data. In this paper, we propose to cluster nodes in unstructured P2P systems using the agglomerative hierarchical clustering algorithm to improve the search method. We compared the delay time of clustering the nodes between our proposed algorithm and the k-means clustering algorithm. We also simulated the delay time of locating data in a network topology and recorded the overhead of the system using our proposed algorithm, k-means clustering, and without clustering. Simulation results show that the delay time of our proposed algorithm is shorter compared to other methods and resource overhead is also reduced.

  • PDF

Adaptive bandwidth allocation scheme for MPEG video on ATM networks (ATM 망에서의 MPEG 비디오를 위한 적응적 가변 대역 할당 기법)

  • 한상범;김태윤
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10c
    • /
    • pp.778-780
    • /
    • 2001
  • ATM(Asynchronous Transfer Mode) 망은 사용자의 요구에 의해 대역폭을 할당한 수 있으므로 전송에 필요한 대역폭이 수시로 변화하는 MPEG 비디오를 전송하는데 적합하다. 그러나 MPEG 트래픽(traffic)은 셀(cell) 발생량의 변화가 심한 군집성 (burst)이 큰 트래픽 이기에 전송 품질을 유지하면서 동시에 망의 대역폭을 효율적으로 사용하는 전송을 구현하기가 매우 힘들다. 본 연구에서는 이러한 상반되는 두 가지의 목적을 수행하기 위하여 새로운 대역폭 할당 기법을 제안하였다. 사용자에게 최소한의 품질을 보장하면서 망에 대역폭의 여유가 있는 경우 고품질의 서비스가 가능토록 하는 방안으로 ATM 망의 CBR(Constant Bit Rate) 서비스와 VBR(Variable Bit Rate) 서비스를 복합적으로 사용하는 방법을 제안하였다. 이의 구현을 위하여 2 계층 구조의 MPEG 부호화기를 설계, 구현하였고 모의 실험을 통하여 기존의 단일 계층 CBR 서비스에 비하여 품질과 망의 효율성에 있어 충분히 우수함을 확인하여 그 효용성을 증명하였다.

  • PDF

A Bibliometric Study on the KCI Listed Theological Journals (KCI 등재 신학 학술지에 대한 계량서지학적 분석)

  • Yoo, Yeong Jun;Lee, Jae Yun
    • Journal of the Korean BIBLIA Society for library and Information Science
    • /
    • v.31 no.3
    • /
    • pp.5-27
    • /
    • 2020
  • This study aimed at analyzing the keywords and authors of the KCI listed theological journals and finding the official research performance of Korean theology. This study divided the periods in two according to how duplicate the authors are and found hierarchical clusters by analyzing 92 keywords using the McQuitty method. In analyzing them, the Ward linkage method was selected to prevent the authors from gathering into a small number of clusters. Also, to find how influential the journals were to the keywords, the keywords and the percentage of the journals in them were presented together. The authors were analyzed in terms of deciding the positions of them using normalized performance index representing the number of journals and growth index as a growth tendency. Especially, significant researchers were all reformed theologians in a growth index. In the analysis of the keywords of the KCI journals and the authors, the main subject terms of the Korean theology were related to systematic theology and the New Testament. By analyzing the KCI listed journals as the Korean official citation index, this study has made a difference to the advanced articles analyzing the non-KCI listed theological journals.