• Title/Summary/Keyword: 군집 기법

Search Result 1,014, Processing Time 0.032 seconds

Analysis and New Indices of Cluster Validity Indices in Summation Type (합형식의 군집 유효화 지수의 분석과 새로운 지수 개발)

  • Kim Minho;Ramakrishna R.S.
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.598-600
    • /
    • 2005
  • 군집 유효화 평가란 기본적으로 클래스 (Class)에 대한 정보가 주어지지 않은 상태에서 다양한 입력 변수에 의해 발생되는 군집화의 결과들을 평가하여 그들 중에서 주어진 데이터 집합의 자연적인 분할 상태에 가장 적합한 결과를 찾는 기법을 말한다. 군집 유효화 평가에서 그 척도로 사용되는 것이 군집 유효화 지수이다. 본 논문에서는 우선 현존하는 다양한 군집 유효화 지수들 중에서 합 형식을 가지는 지수들을 다룬다. 구체적으로 이 지수들의 설계 원리와 각 지수들의 부합성 (Compliance) 분석한다. 다음으로 분석을 통해 밝혀진 그들의 단점을 보완할 수 있는 새로운 군집 유효화 지수들을 제안한다. 마지막으로 기존의 군집 유효화 지수들을 포함한 새로이 제안한 지수들의 성능을 실험 학습을 통해 평가한다.

  • PDF

Clustered Hash Index-based Skyline Query (해시 색인 군집화 기반 스카이라인 질의)

  • Choi, Jong-Hyeok;Nasridinov, Aziz
    • Proceedings of The KACE
    • /
    • 2018.01a
    • /
    • pp.45-48
    • /
    • 2018
  • 스카이라인 질의는 지배라는 개념을 활용, 주어진 데이터로부터 데이터를 대표할 수 있는 데이터들을 탐색하기 때문에 사용자의 요청에 부합하는 최적의 결과를 탐색하거나 기업에서 의사결정을 이루기 위해 사용되는 등 넓은 활용을 보이고 있다. 하지만 스카이라인 질의는 데이터의 차원이 증가하는 경우 전체적인 성능의 감소와 함께 스카이라인으로 선택되는 데이터의 수가 급증하여 사용자에게 유용한 결과를 반환하지 못하게 된다. 이러한 문제를 해결하기 위해 최근에는 Top-k 질의 기반의 방식이나 군집화 기반의 기법을 적용한 방식의 스카이라인 질의들이 새롭게 제안되고 있지만 이들은 데이터의 편향이나 사용자로부터 입력된 k에 큰 영향을 받는 등 해당 질의 결과가 데이터들을 충분히 대표하거나 다양성을 만족시키지 못했다. 이러한 문제를 해결하기 위해 본 논문에서는 해시 색인 기법과 군집화 기법인 DBSCAN을 통해 주어진 데이터들을 충분히 대표함과 동시에 다양성을 만족할 수 있는 새로운 방식의 스카이라인인 CHI-SQ의 이론적 배경을 제안하고자 한다.

  • PDF

Clustering Optimization Cluster Count Determination for Tourist Destination Recommendation (관광지 추천을 위한 클러스터링 최적화 군집수 결정)

  • Hae-Jin Yeo;In-Whee Joe
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.371-373
    • /
    • 2023
  • factor 들이 많은 데이터의 군집화는 어려움을 요한다. K-means 클러스터링을 사용하여 군집화를 할 때, 각 데이터들이 가진 factor 의 개수가 상이한 경우 비슷한 성향을 가진 데이터임에도 불구하고 클러스터링이 적합하게 되지 않는 현상이 발생한다. 이러한 문제점을 해결하기 위해 최적의 군집화 개수를 결정하는 실루엣 기반 방법을 제안하고 제안기법의 성능을 평가한다.

Analysis on the Plant Community Structure of Chundong Valley in Sobaeksan National Park (소백산국립공원 천동계곡의 식물군집구조분석)

  • Lee, Kyong-Jae;Cho, Woo;Jo, Jae-Chang
    • Korean Journal of Environment and Ecology
    • /
    • v.6 no.2
    • /
    • pp.134-146
    • /
    • 1993
  • A survey of the Chundong valley forest in Mt. Sobaek was conducted using 20 sample plots of 500$m^2$ size. The classification by TWINSPAN and DCA, CCA ordination techniques were applied to the study area in order to classify them into several groups based on woody plants and environmental variables. By TWINSPAN techniques, the plant community were divided into four groups. The dividing groups are Pinus densiflora community, Qurcus variabilis -Q. mongolica -P. densiflora community, Fraxinus rhynchophylla community. The successional trends of tree species by DCA ordination techniques and DBH class distribution analysis seems to be from P. densiflora through Q. mongolica. Q. variabilis to F rhynchophylla. The correlation between the score of first two axes and soil pH, soil humus, soil calcium concentration, soil magnesium concentration was significantly positive in CCA ordination. The positive correlation between the score of first two axes of F. rhynchophylla community and soil humus, soil magnesium concentration and between ones of P. densiflora community and soil pH were calculated. But there is no correlation between species and environmental variables.

  • PDF

One-step spectral clustering of weighted variables on single-cell RNA-sequencing data (단세포 RNA 시퀀싱 데이터를 위한 가중변수 스펙트럼 군집화 기법)

  • Park, Min Young;Park, Seyoung
    • The Korean Journal of Applied Statistics
    • /
    • v.33 no.4
    • /
    • pp.511-526
    • /
    • 2020
  • Single-cell RNA-sequencing (scRNA-seq) data consists of each cell's RNA expression extracted from large populations of cells. One main purpose of using scRNA-seq data is to identify inter-cellular heterogeneity. However, scRNA-seq data pose statistical challenges when applying traditional clustering methods because they have many missing values and high level of noise due to technical and sampling issues. In this paper, motivated by analyzing scRNA-seq data, we propose a novel spectral-based clustering method by imposing different weights on genes when computing a similarity between cells. Assigning weights on genes and clustering cells are performed simultaneously in the proposed clustering framework. We solve the proposed non-convex optimization using an iterative algorithm. Both real data application and simulation study suggest that the proposed clustering method better identifies underlying clusters compared with existing clustering methods.

A Study on the Stochastic Optimization of Binary-response Experimentation (이항 반응 실험의 확률적 전역최적화 기법연구)

  • Donghoon Lee;Kun-Chul Hwang;Sangil Lee;Won Young Yun
    • Journal of the Korea Society for Simulation
    • /
    • v.32 no.1
    • /
    • pp.23-34
    • /
    • 2023
  • The purpose of this paper is to review global stochastic optimization algorithms(GSOA) in case binary response experimentation is used and to compare the performances of them. GSOAs utilise estimator of probability of success $\^p$ instead of population probability of success p, since p is unknown and only known by its estimator which has stochastic characteristics. Hill climbing algorithm algorithm, simple random search, random search with random restart, random optimization, simulated annealing and particle swarm algorithm as a population based algorithm are considered as global stochastic optimization algorithms. For the purpose of comparing the algorithms, two types of test functions(one is simple uni-modal the other is complex multi-modal) are proposed and Monte Carlo simulation study is done to measure the performances of the algorithms. All algorithms show similar performances for simple test function. Less greedy algorithms such as Random optimization with Random Restart and Simulated Annealing, Particle Swarm Optimization(PSO) based on population show much better performances for complex multi-modal function.

Comparative Study of Regional Frequency Analysis Methods of Rainfall in Han River Basin (한강 유역에서의 강우 지역빈도 해석 방법의 비교 연구)

  • Um, Myoung-Jin;Lim, Seung-Teak;Nam, Woo-Sung;Cho, Won-Cheol;Heo, Jun-Haeng
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2008.05a
    • /
    • pp.1072-1076
    • /
    • 2008
  • 본 연구에서는 한강유역 109개 지점의 강우관측소에서 관측된 지속기간별 연최대강우량을 기본으로 각 지속기간별 L-모멘트값을 산정하고, 한강유역에 적합한 빈도해석기법을 정의하기 위하여 지역구분을 실시하였다. 지역구분을 위한 군집분석을 수행하기 위하여 각 지점별 기상학적 인자와 지형학적 인자를 변수로 사용하였다. 군집분석 기법인 Ward, 평균연결법, Fuzzy-c means, Two-Step방법을 이용하여 지역구분을 실시하였다. GIS를 이용하여 각 방법들을 이용하여 군집된 결과를 도시한 결과 Fuzzy-c means방법으로 구분된 지역구분이 적합한 것으로 나타났다. 또한 구분된 지역의 동질성 여부를 판단하고 적정 분포형을 선정하였으며 지점빈도해석 및 지역빈도해석을 통하여 빈도별 확률 수문량을 산정하였다. 산정된 결과의 정확도 알아보기 위해 모의발생을 시킨 후, 각 기법별로 산정된 상대 평균 제곱근 오차(Relative Root Mean Square Error, RRMSE)를 비교 분석한 결과 대체적으로 지수홍수법과 계층적 방법이 낮은 RRMSE를 나타냈다. 따라서 한강유역에서는 지수홍수법과 계층적 방법을 적용한 지역빈도해석이 적합한 것으로 판단된다.

  • PDF

Prediction of Consumer Propensity to Purchase Using Geo-Lifestyle Clustering and Spatiotemporal Data Cube in GIS-Postal Marketing System (GIS-우편 마케팅 시스템에서 Geo-Lifestyle 군집화 및 시공간 데이터 큐브를 이용한 구매.소비 성향 예측)

  • Lee, Heon-Gyu;Choi, Yong-Hoon;Jung, Hoon;Park, Jong-Heung
    • Journal of Korea Spatial Information System Society
    • /
    • v.11 no.4
    • /
    • pp.74-84
    • /
    • 2009
  • GIS based new postal marketing method is presented in this paper with spatiotemporal mining to cope with domestic mail volume decline and to strengthening competitiveness of postal business. Market segmentation technique for socialogy of population and spatiotemporal prediction of consumer propensity to purchase through spatiotemporal multi-dimensional analysis are suggested to provide meaningful and accurate marketing information with customers. Internal postal acceptance & external statistical data of local districts in the Seoul Metropolis are used for the evaluation of geo-lifestyle clustering and spatiotemporal cube mining. Successfully optimal 14 maketing clusters and spatiotemporal patterns are extracted for the prediction of consumer propensity to purchase.

  • PDF

A Study of Progressive Parameter Calibrations for Rainfall-Runoff Models (강우-유출모형을 위한 매개변수 순차 보정기법 연구)

  • Kwak, Jae-Won;Kim, Duk-Gil;Hong, Il-Pyo;Kim, Hung-Soo
    • Journal of Wetlands Research
    • /
    • v.11 no.2
    • /
    • pp.107-121
    • /
    • 2009
  • Many rainfall-runoff models have been used for the flood forecasting. However, the determination of rainfall-runoff model parameters is very difficult. In this study, we investigated the efficiency of flood forecasting models by studying the optimization techniques for parameter calibration of SFM, Tank, and SSARR models. We analyzed the correlations between parameters in optimization techniques, then classified the parameters into parameter groups. For this we applied the sequential calibration method through the sensitivity analysis. As the results of the analysis, the parameter groups clibration method showed better result for peak flow and clibtation time.

  • PDF

Development of robust flocking control law for multiple UAVs using behavioral decentralized method (다수 무인기의 행위 기반 강인 군집비행 제어법칙 설계)

  • Shin, Jongho;Kim, Seungkeun;Suk, Jinyoung
    • Journal of the Korean Society for Aeronautical & Space Sciences
    • /
    • v.43 no.10
    • /
    • pp.859-867
    • /
    • 2015
  • This study proposes a robust formation flight control technique of multiple unmanned aerial vehicles(UAVs) using behavior-based decentralized approach. The behavior-based decentralized method has various advantages because it utilizes information of neighboring UAVs only instead of information of whole UAVs in the formation maneuvering. The controllers in this paper are divided into two methods: first one is based on position and velocity of neighboring UAVs, and the other one is based on position of neighboring UAVs and passivity technique. The proposed controllers assure uniformly ultimate boundedness of closed-loops system under time varying bounded disturbances. Numerical simulations are performed to validate the effectiveness of the proposed method.