• 제목/요약/키워드: Overlapping Clustering

검색결과 25건 처리시간 0.022초

의료서비스에서 혼합모형(Mixture model) 및 분석적 계층과정(AHP)를 이용한 입원환자의 시장세분화에 관한 연구 (Segmenting Inpatients by Mixture Model and Analytical Hierarchical Process(AHP) Approach In Medical Service)

  • 백수경;곽영식
    • 보건행정학회지
    • /
    • 제12권2호
    • /
    • pp.1-22
    • /
    • 2002
  • Since the early 1980s scholars have applied latent structure and other type of finite mixture models from various academic fields. Although the merits of finite mixture model are well documented, the attempt to apply the mixture model to medical service has been relatively rare. The researchers aim to try to fill this gap by introducing finite mixture model and segmenting inpatients DB from one general hospital. In section 2 finite mixture models are compared with clustering, chi-square analysis, and discriminant analysis based on Wedel and Kamakura(2000)'s segmentation methodology schemata. The mixture model shows the optimal segments number and fuzzy classification for each observation by EM(expectation-maximization algorism). The finite mixture model is to unfix the sample, to Identify the groups, and to estimate the parameters of the density function underlying the observed data within each group. In section 3 and 4 we illustrate results of segmenting 4510 patients data including menial and ratio scales. And then, we show AHP can be identify the attractiveness of each segment, in which the decision maker can select the best target segment.

최대 중첩구간을 이용한 새로운 GPS 궤적 클러스터링 (A new Clustering Algorithm for GPS Trajectories with Maximum Overlap Interval)

  • 김태용;박보국;박진관;조환규
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권9호
    • /
    • pp.419-425
    • /
    • 2016
  • 내비게이션 시스템에서 지도 데이터를 최신 정보로 유지하는 것은 중요한 일이다. 그러나 수작업을 통한 갱신은 비용이 많이 소요될 뿐만 아니라 갱신되는 정보를 즉각적으로 반영하기 힘들다. 본 논문에서는 GPS 데이터를 이용하여 자동으로 도로를 생성해주는 시스템에서 가장 중요한 문제 중 하나인 중심 도로를 추출하는 기법에 관하여 살펴보고자 한다. 중심도로를 추출하기 위해서는 클러스터링 시킨 궤적이 필요하지만, 실제 궤적은 클러스터링 되어있지 않다. 이 문제를 해결하기 위하여 본 논문에서는 최대 중첩구간 탐색과 궤적 클러스터링 과정을 통하여 효과적으로 궤적에 대해 클러스터링 하는 기법을 제안한다. 마지막으로 클러스터링 시킨 궤적에 대하여 가상달리기 기법을 적용하여 중심도로를 추출하였다. 실험 데이터로는 실제 대용량의 강남구, 성남시, 서울시 전체를 지나다니는 택시 GPS 데이터를 수집하여 실험을 하였고, 실험 결과 제안기법이 실제 중심 도로를 추출하는데 안정적이고 효율적인 것을 보였다.

Regularization을 이용한 Possibilistic Fuzzy C-means의 확장 (An Extension of Possibilistic Fuzzy C-means using Regularization)

  • 허경용;남궁영환;김성훈
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권1호
    • /
    • pp.43-50
    • /
    • 2010
  • Fuzzy c-means(FCM)와 possibilistic c-means(PCM)는 퍼지 클러스터링 영역에서 대표적인 두 가지 방법으로 많은 패턴 인식 문제들에 성공적으로 활용되어져 왔다. 하지만 이들 방법 역시 잡음 민감성과 중첩 클러스터 문제를 가지고 있다. 이들 문제점을 극복하기 위해, 최근 두 방법을 결합하려는 시도가 있어왔고, possibilistic fuzzy c-means(PFCM)는 FCM과 PCM을 목적 함수 단계에서 통합함으로써 두 방법이 가지는 문제점을 완화시키는 성공적인 결과를 보여주었다. 이 논문에서는 PFCM에 regularization을 도입함으로써 PFCM의 잡음 민감성을 한층 더 줄여줄 수 있는 향상된 PFCM을 소개한다. Regularization은 해공간을 평탄화 함으로써 잡음의 영향을 줄이는 대표적인 방법 중 하나이다. 제안한 방법은 PFCM의 장점과 더불어 regularization에 의해 잡음의 영향을 더욱 줄일 수 있으며, 이는 실험을 통해 확인할 수 있다.

Properties of High- and Low-Redshift Quasars from the extended Baryon Oscillation Spectroscopic Survey

  • Choi, Doohyun;Rossi, Graziano
    • 천문학회보
    • /
    • 제41권1호
    • /
    • pp.72.2-72.2
    • /
    • 2016
  • The SDSS-IV extended Baryon Oscillation Spectroscopic (eBOSS) will provide new photometry and spectroscopy of an unprecedented number of quasars in a novel redshift range, along with some re-observations of SDSS DR12 objects. We present here an observational study of the geometry, spatial distribution, luminosity function, and clustering of a sample of low- and high-z quasars obtained from the first SDSS-IV data release (DR13). In particular, we characterize the amount of overlapping between different data releases, and then focus on the synergy among high- and low-z quasars as tracers of the cosmic web, particularly considering their cross-correlations and cosmological implications.

  • PDF

저전력 RMIMS 무선 터미널을 위한 새로운 움직이는 이동 기지국 시스템 구조(2부:QoS 보장을 위한 다중 MMBS 서비스 구조) (A New Moving Mobile Base Station (MMBS) Scheme for Low Power RMIMS Wireless System(PartII:Multiple MMBS service schemes for RMIS QoS guarantee))

  • 박수열;고윤호;유상조;김성대
    • 한국통신학회논문지
    • /
    • 제24권12B호
    • /
    • pp.2320-2334
    • /
    • 1999
  • 본 논문에서는 최근 들어 본격적인 연구개발이 활성화되고 있는 무선 데이터 통신서비스를 근간으로 한 미세정보 감시 시스템(RMIMS: radio interfaced micro information monitoring system or MICROS: micro information and communication remote object-oriented system)에 대한 QoS(quality of service, ex: packet loss)를 보장하는 새로운 움직이는 다중 기지국(multiple IS-MMBS) 서비스 방법을 제안하였다. MMBS 서비스 지역에서 실시간 트래픽 형태의 RMIMS 터미널 응용서비스가 발생하거나 서비스 지역에 배치되는 RMIMS 터미널 수의 증가 또는 높은 전송대역폭을 요구하는 RMIMS 응용서비스 등으로 인하여 하나의 IS-MMBS 만으로는 기 서비스 중인 RMIMS 터미널 및 신규RMIMS 터미널에 대한 패킷 손실 여부 같은 QoS를 만족하는 서비스가 불가능한 경우가 발생한다. 이러한 경우에 다중 IS-MMBS을 이용하여 RMIMS 터미널의 QoS를 보장하는 MMBS 서비스를 제공할 수 있다. 제안한 다중 IS-MMBS 서비스 모드는 RMIMS 클러스터링 방법과 MMBS 세그먼트(segment) 방법에 따라 터미널 분할방법(terminal segment method), 영역 분할방법(region segment method ), 응용서비스별 분할방법(application based segment method), 트래픽 타입별 분할방법(traffic type based method), 중첩 분할방법(overlapping segment method), 복합 분할방법(hybrid segment method)으로 분류 제안하였다.

  • PDF

중첩 클러스터를 이용한 피드백 문서의 재샘플링 기법 (Resampling Feedback Documents Using Overlapping Clusters)

  • 이경순
    • 정보처리학회논문지B
    • /
    • 제16B권3호
    • /
    • pp.247-256
    • /
    • 2009
  • 대부분의 잠정적 적합피드백기법들은 질의에 대해 검색된 상위검색문서들이 적합하다고 가정하고, 그 문서들을 질의 확장을 위한 피드백 문서로 이용하고 있다. 그러나 초기검색결과에는 상당한 양의 부적합 문서를 포함하고 있는 것이 현실이다. 이 논문에서는 보다 좋은 피드백 문서를 선택하기 위해서 중첩클러스터를 이용한 피드백문서의 재샘플링 기법을 제안한다. 주요 아이디어는 질의 중심적인 초기검색문서집합에 대해서 중첩이 허용된 문서클러스터를 이용하여 문서들 사이의 관계를 반영하여 질의에 핵심역할을 하는 지배적 문서를 찾고, 이 문서들을 반복적으로 피드백 하여 질의가 내포하는 핵심 주제를 강조하는 것이다. 대규모 실험집합인 TREC GOV2와 WT10g에 대한 실험비교에서, 최근 잠정적 적합피드백 기법들 중에서 가장 좋은 성능을 보이고 있는 적합모델보다 재샘플링기법이 우수한 성능향상을 보였다. 제안기법에 대한 검증을 위해서 피드백문서에 포함된 적합문서의 정도를 나타내는 적합밀도를 측정하였다. 재샘플링 기법이 TREC 실험집합에 대해서 적합모델에 비해 높은 적합밀도를 보였고, 이 결과 적합피드백에서 검색성능을 향상시키게 되었다. 이는 제안 기법이 잠정적 적합피드백에서 유효한 방법임을 알 수 있다.

Intrusion Detection System Modeling Based on Learning from Network Traffic Data

  • Midzic, Admir;Avdagic, Zikrija;Omanovic, Samir
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권11호
    • /
    • pp.5568-5587
    • /
    • 2018
  • This research uses artificial intelligence methods for computer network intrusion detection system modeling. Primary classification is done using self-organized maps (SOM) in two levels, while the secondary classification of ambiguous data is done using Sugeno type Fuzzy Inference System (FIS). FIS is created by using Adaptive Neuro-Fuzzy Inference System (ANFIS). The main challenge for this system was to successfully detect attacks that are either unknown or that are represented by very small percentage of samples in training dataset. Improved algorithm for SOMs in second layer and for the FIS creation is developed for this purpose. Number of clusters in the second SOM layer is optimized by using our improved algorithm to minimize amount of ambiguous data forwarded to FIS. FIS is created using ANFIS that was built on ambiguous training dataset clustered by another SOM (which size is determined dynamically). Proposed hybrid model is created and tested using NSL KDD dataset. For our research, NSL KDD is especially interesting in terms of class distribution (overlapping). Objectives of this research were: to successfully detect intrusions represented in data with small percentage of the total traffic during early detection stages, to successfully deal with overlapping data (separate ambiguous data), to maximize detection rate (DR) and minimize false alarm rate (FAR). Proposed hybrid model with test data achieved acceptable DR value 0.8883 and FAR value 0.2415. The objectives were successfully achieved as it is presented (compared with the similar researches on NSL KDD dataset). Proposed model can be used not only in further research related to this domain, but also in other research areas.

Reliability of microarray analysis for studying periodontitis: low consistency in 2 periodontitis cohort data sets from different platforms and an integrative meta-analysis

  • Jeon, Yoon-Seon;Shivakumar, Manu;Kim, Dokyoon;Kim, Chang-Sung;Lee, Jung-Seok
    • Journal of Periodontal and Implant Science
    • /
    • 제51권1호
    • /
    • pp.18-29
    • /
    • 2021
  • Purpose: The aim of this study was to compare the characteristic expression patterns of advanced periodontitis in 2 cohort data sets analyzed using different microarray platforms, and to identify differentially expressed genes (DEGs) through a meta-analysis of both data sets. Methods: Twenty-two patients for cohort 1 and 40 patients for cohort 2 were recruited with the same inclusion criteria. The 2 cohort groups were analyzed using different platforms: Illumina and Agilent. A meta-analysis was performed to increase reliability by removing statistical differences between platforms. An integrative meta-analysis based on an empirical Bayesian methodology (ComBat) was conducted. DEGs for the integrated data sets were identified using the limma package to adjust for age, sex, and platform and compared with the results for cohorts 1 and 2. Clustering and pathway analyses were also performed. Results: This study detected 557 and 246 DEGs in cohorts 1 and 2, respectively, with 146 and 42 significantly enriched gene ontology (GO) terms. Overlapping between cohorts 1 and 2 was present in 59 DEGs and 18 GO terms. However, only 6 genes from the top 30 enriched DEGs overlapped, and there were no overlapping GO terms in the top 30 enriched pathways. The integrative meta-analysis detected 34 DEGs, of which 10 overlapped in all the integrated data sets of cohorts 1 and 2. Conclusions: The characteristic expression pattern differed between periodontitis and the healthy periodontium, but the consistency between the data sets from different cohorts and metadata was too low to suggest specific biomarkers for identifying periodontitis.

생물학적 후각 시스템을 모방한 대규모 가스 센서 어레이에서 코사인 유사도와 퍼지 클러스터링을 이용한 중복도 제거 방법 (The Redundancy Reduction Using Fuzzy C-means Clustering and Cosine Similarity on a Very Large Gas Sensor Array for Mimicking Biological Olfaction)

  • 김정도;김정주;박성대;변형기;;임승주
    • 센서학회지
    • /
    • 제21권1호
    • /
    • pp.59-67
    • /
    • 2012
  • It was reported that the latest sensor technology allow an 65536 conductive polymer sensor array to be made with broad but overlapping selectivity to different families of chemicals emulating the characteristics found in biological olfaction. However, the supernumerary redundancy always accompanies great error and risk as well as an inordinate amount of computation time and local minima in signal processing, e.g. neural networks. In this paper, we propose a new method to reduce the number of sensor for analysis by reducing redundancy between sensors and by removing unstable sensors using the cosine similarity method and to decide on representative sensor using FCM(Fuzzy C-Means) algorithm. The representative sensors can be just used in analyzing. And, we introduce DWT(Discrete Wavelet Transform) for data compression in the time domain as preprocessing. Throughout experimental trials, we have done a comparative analysis between gas sensor data with and without reduced redundancy. The possibility and superiority of the proposed methods are confirmed through experiments.

모바일 기기에서 특징적 추출과 정합을 활용한 파노라마 이미지 스티칭 (Panoramic Image Stitching using Feature Extracting and Matching on Mobile Device)

  • 이용환;김흥준
    • 반도체디스플레이기술학회지
    • /
    • 제15권4호
    • /
    • pp.97-102
    • /
    • 2016
  • Image stitching is a process of combining two or more images with overlapping area to create a panorama of input images, which is considered as an active research area in computer vision, especially in the field of augmented reality with 360 degree images. Image stitching techniques can be categorized into two general approaches: direct and feature based techniques. Direct techniques compare all the pixel intensities of the images with each other, while feature based approaches aim to determine a relationship between the images through distinct features extracted from the images. This paper proposes a novel image stitching method based on feature pixels with approximated clustering filter. When the features are extracted from input images, we calculate a meaning of the minutiae, and apply an effective feature extraction algorithm to improve the processing time. With the evaluation of the results, the proposed method is corresponding accurate and effective, compared to the previous approaches.