• Title/Summary/Keyword: 군집성

Search Result 2,875, Processing Time 0.045 seconds

Comparison of clustering with yeast microarray gene expression data (효모 마이크로어레이 유전자발현 데이터에 대한 군집화 비교)

  • Lee, Kyung-A;Kim, Jae-Hee
    • Journal of the Korean Data and Information Science Society
    • /
    • v.22 no.4
    • /
    • pp.741-753
    • /
    • 2011
  • We accomplish clustering analyses for yeast cell cycle microarray expression data. We compare model-based clustering, K-means, PAM, SOM and hierarchical Ward method with yeast data. As the validity measure for clustering results, connectivity, Dunn Index and silhouette values are computed and compared.

Clustering Validity Assessment Using Relative Criteria for finding Optimal Clusters (최적의 군집을 찾기 위한 상대적 군집 평가 방법)

  • 김영옥;이수원
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.334-336
    • /
    • 2002
  • 군집 분석은 데이터의 속성을 분석하여 서로 유사한 패턴을 가진 데이터를 묶는 방법이다. 군집 분석은 많은 응용 분야에서 쓰이고 있으나, 수행된 군집 분석 결과가 과연 정확한 결과이고 의미 있는 결과인지를 평가하는데 어려움이 있다. 본 논문에서는 군집이 형성된 데이터를 분석하여 군집 분석 결과를 평가하는 상대적 군집 평가 방법을 제안한다. 본 논문에서는 상대적 군집 평가 방법의 인덱스를 정의하고 형성된 군집 분석 결과에 적용해 최적의 군집, 의미 있는 군집을 찾을 수 있음을 보인다. 또한 실험을 통해 제안한 인덱스의 적합성을 보이며, 제안한 인덱스가 기존의 인덱스에 비해 최적의 군집, 의미 있는 군집을더 잘 찾을 수 있음을 보인다.

  • PDF

Application of Gene Algorithm for the development of efficient clustering system (효율적인 군집화 시스템의 개발을 위해 유전자 알고리즘의 적용)

  • Hong, Gil-Dong;Kim, Cheol-Soo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.05a
    • /
    • pp.277-280
    • /
    • 2003
  • 현재 많은 관심의 대상이 되고 있는 데이터 마이닝은 대용량의 데이터베이스로부터 일정한 패턴을 분류하여 지식의 형태로 추출하는 작업이다. 데이터 마이닝의 대표적인 기법인 군집화는 군집내의 유사성을 최대화하고 군집들간의 유사성을 최소화시키도록 데이터 집합을 분할하는 것이다. 데이터 마이닝에서 군집화는 대용량 데이터를 다루기 때문에 원시 데이터에 대한 접근횟수를 줄이고 알고리즘이 다루어야 할 데이터 구조의 크기를 줄이는 군집화 기법이 활발하게 사용된다. 그런데 기존의 군집화 알고리즘은 잡음에 매우 민감하고, local minima에 반응한다. 또한 사전에 군집의 개수를 미리 결정해야 하고, initialization 값에 다라 군집의 성능이 좌우되는 문제점이 있다. 본 연구에서는 유전자 알고리즘을 이용하여 자동으로 군집의 개수를 결정하는 군집화 알고리즘을 제안하고, 여기서 제시하는 적합도 함수의 최적화된 군집을 찾아내어 조금더 효율적인 알고리즘을 만들어 대용량 데이터를 다루는 데이터 마이닝에 적용해 보려한다.

  • PDF

Selecting Examples to Be Labeled for Semi-Supervised Clustering Using Cluster-Based Sampling (군집화 기법을 이용한 준감독 군집화의 훈련예제 선정)

  • 김종성;강재호;류광렬
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.646-648
    • /
    • 2004
  • 기계학습의 군집화(clustering) 기법은 예제들 간의 유사성에 근거하여 주어진 예제들을 무리 짓는 방법이다. 준감독(semi-supervised) 군집화는 카테고리가 부여된(labeled) 소수의 예제들을 적극적으로 활용하여 군집형태가 보다 자연스럽게 형성되도록 유도하는 군집화 방법이다. 준감독 군집화 문제에서 예제에 카테고리를 부여하는 작업은 현실적으로 극히 제한적이거나 카테고리를 부여하는데 소요되는 비용이 상당하므로, 제한된 자원 내에서 군집화에 효용성이 높을 예제들을 선정하여 카테고리를 부여하는 것이 필요하다. 본 논문에서는 기존 연구에서 능동적 학습의 초기 훈련예제 선정을 위해 제안된 군집기반 훈련예제 선정 방법을 준감독 군집화에 적용하여 군집 결과의 질을 향상시키고자 한다. 군집화를 이용한 예제 선정 방법은 유사한 예제들은 동일한 카테고리에 속할 가능성이 높다는 가정하에 전체 예제를 활용하여 선정하고자 하는 예제 수만큼 군집을 생성 한 후. 각 군집의 중심점에 가장 가까운 예제들을 대표 예제로 선정하여 훈련 집합을 구성하는 방법이다 본 논문에서는 문서를 대상으로 하는 준감독 군집화 실험을 통해, 카테고리를 부여할 예제를 임의로 선정한 경우에 비해 군집화를 이용한 훈련 예제들로 준감독 군집화를 수행한 경우가 보다 좋은 군집을 형성함을 확인하였다.

  • PDF

Computer-Aided Detection of Clustered Microcalcifications using Texture Analysis and Neural Network in Digitized X-ray Mammograms (X-선 유방영상에서 텍스처 분석과 신경망을 이용한 군집성 미세석회화의 컴퓨터 보조검출)

  • 김종국;박정미
    • Journal of Biomedical Engineering Research
    • /
    • v.19 no.1
    • /
    • pp.1-8
    • /
    • 1998
  • Clustered microcalcifications on X-ray mammograms are an important sign for early detection of breast cancer. This paper proposes a computer-aided diagnosis method for the detection of clustered microcalcifications and marking their locations on digitized mammograms. The proposed detection method consists of the region of interest (ROI) selection, the film-artifact removal, the surrounding texture analysis method for the detection of clustered microcalcifications, which is based on the second-order histogram in two nested surrounding regions on the current pixel. This paper also describes the effectiveness of the proposed film-artifact removal filter in terms of the classification performance with the receiver operating-characteristics(ROC) analysis. A three-layer backpropagation neural network is employed as a classifier. The appropriate marking for the locations of clustered microcalcifications can be used to alert radiologists to locations of suspicious lesions.

  • PDF

A Methodology to Establish Operational Strategies for Truck Platoonings on Freeway On-ramp Areas (고속도로 유입연결로 구간 화물차 군집운영전략 수립 방안 연구)

  • LEE, Seolyoung;OH, Cheol
    • Journal of Korean Society of Transportation
    • /
    • v.36 no.2
    • /
    • pp.67-85
    • /
    • 2018
  • Vehicle platooning through wireless communication and automated driving technology has become realized. Platooning is a technique in which several vehicles travel at regular intervals while maintaining a minimum safety distance. Truck platooning is of keen interest because it contributes to preventing truck crashes and reducing vehicle emissions, in addition to the increase in truck flow capacity. However, it should be noted that interactions between vehicle platoons and adjacent manually-driven vehicles (MV) significantly give an impact on the performance of traffic flow. In particular, when vehicles entering from on-ramp attempt to merge into the mainstream of freeway, proper interactions by adjusting platoon size and inter-platoon spacing are required to maximize traffic performance. This study developed a methodology for establishing operational strategies for truck platoonings on freeway on-ramp areas. Average speed and conflict rate were used as measure of effectiveness (MOE) to evaluate operational efficiency and safety. Microscopic traffic simulation experiments using VISSIM were conducted to evaluate the effectiveness of various platooning scenarios. A decision making process for selecting better platoon operations to satisfy operations and safety requirements was proposed. It was revealed that a platoon operating scenario with 50m inter-platoon spacing and the platoon consisting of 6 vehicles outperformed other scenarios. The proposed methodology would effectively support the realization of novel traffic management concepts in the era of automated driving environments.

VENTOS-Based Platoon Driving Simulations Considering Variability (가변성을 고려하는 VENTOS 기반 군집 자율주행 시뮬레이션)

  • Kim, Youngjae;Hong, Jang-Eui
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.10 no.2
    • /
    • pp.45-56
    • /
    • 2021
  • In platoon driving, several autonomous vehicles communicate to exchange information with each other and drive in a single cluster. The platooning technology has various advantages such as increasing road traffic, reducing energy consumption and pollutant emission by driving in short distance between vehicles. However, the short distance makes it more difficult to cope with an emergency accident, and accordingly, it is difficult to ensure the safety of platoon driving, which must be secured. In particular, the unexpected situation, i.e., variability that may appear during driving can adversely affect the safety of platoon driving. Because such variability is difficult to predict and reproduce, preparing safety guards to prevent risks arising from variability is a challenging work. In this paper, we studied a simulation method to avoid the risk due to the variability that may occur while platoon driving. In order to simulate safe platoon driving, we develop diverse scenarios considering the variability, design and apply safety guards to handle the variability, and extends the detail functions of VENTOS, an open source platooning simulator. Based on the simulation results, we have confirmed that the risks caused form the variability can be removed, and safe platoon driving is possible. We believe that our simulation approach will contribute to research and development to ensure safety in platoon driving.

The effect of variations to the benthic macroinvertebrates community after river environment improvement in the Osan Stream (오산천 하천환경정비가 저서성 대형무척추동물 군집변화에 미치는 영향)

  • Kim, Jea-Su;Kwon, Yong-Duk;Kim, Seong-Hwan;Kim, Kook-Il
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2006.05a
    • /
    • pp.977-981
    • /
    • 2006
  • 본 연구는 오산천 하천환경정비로 인하여 저서성 대형무척추동물의 군집변화에 미치는 영향을 파악하기 위하여 2002년 6월부터 2005년 11월까지 5개지점을 선정하여 조사를 실시하였다. 조사기간 중 출현한 저서성 대형무척추동물은 총 4문 7강 16목 38과 81종이었으며, 년도별로는 2002년에는 총 55종이 출현하였으나, 2004년에는 36종으로 종수가 급감하였다. ESB에 따른 군집의 생태점수는 2003년도에 45.4에서 2004년도에는 21.7로 낮아졌다가 2005년도에는 31.2로 높아졌다. 이는 하천환경정비공사로 일시적인 교란을 일으켜 저서성 대형무척추동물의 군집변화에 영향을 미친 것으로 사료된다. 종조성의 변화로는 상류부의 경우 환경정비공사 완료 후 생태계안정화와 추이대가 복원되면서 1급수 지표종인 플라나리아(Dugesia japonica)와 옆새우(Gammarus sp.)가 출현하여 다양한 군집을 형성하고 있었다. 하류의 경우는 군집의 종조성이 빈약하지만 공사가 마무리 단계에 들어가면서 수서생물의 서식처가 안정화되고 있는 것으로 사료된다. 이처럼 저서성 대형무척추동물의 서식에 영향을 주는 하상의 물리적 구조와 이와 연관된 유기물 퇴적층과 토사 퇴적층에 대한 관리가 필요하며, 이를 통하여 하도특성에 맞는 안정된 군집구조가 형성될 수 있도록 대체서식처를 하천환경정비계획 수립 시 고려하여야 한다.

  • PDF

Efficient water resource management using cluster and trend analysis for each rainfall station (강우 관측소별 군집 및 경향성 분석을 활용한 효율적인 수자원 관리)

  • Won-joon Wang;Seong Cheol Shin;Yu Jin Kang;Seungmin Lee;Soojun Kim;Hung Soo Kim
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2023.05a
    • /
    • pp.115-115
    • /
    • 2023
  • 최근 기후변화의 영향으로 국내에서 강우량과 유출량의 변동성이 커짐에 따라 효율적으로 수자원을 관리하는 데 어려움을 겪고 있다. 따라서 수자원 관리 측면에서 강우관측소를 대상으로 군집 분석과 경향성 분석을 통해 사전에 강우 시계열 자료의 추세와 특징을 파악하면 용수 공급과 가뭄 및 홍수피해 저감 등에 효과적으로 대처할 수 있다. 본 연구에서는 2000년부터 2019년까지낙동강 유역의 64개 강우관측소를 대상으로 동질성 검정과 수정 Mann-Kendall (MK) 검정을 적용하여 강우 시계열 자료의 월별, 계절별, 연도별 경향성 분석을 수행하였다. 또한, 경향성이 나타나는 관측소별 세부지표(연평균 강우량, 표고 등)를 기준으로 K-means 군집 분석을 수행하여 군집별 강우 특성을 파악하고자 하였다. 분석을 수행한 결과 경향성 분석에선 3월, 4월, 11월, 12월, 봄 및 가을에는 강우량이 증가 추세를 보였고 1월, 5~9월, 여름과 연도별로는 감소 추세가 나타났다. 또한 군집 분석에서는 Silhouette analysis를 기반으로 최적의 군집 개수를 3개로 설정했을 때 군집별 강우 세부지표의 통계값이 관측소별 표고에 비례하는 특징이 나타났다. 연구를 통해 도출된 군집별 강우 특성과 관측소별 경향성 분석결과를 연계하면 강우량의 변동성을 고려한 효율적인 수자원 관리 방안을 마련하는 데 활용할 수 있을 것으로 판단된다.

  • PDF

The implementation of efficient pattern classification system using the gene algorithm (유전자 알고리즘을 이용한 효율적인 패턴 분류 시스템 구현)

  • 이호현;최용호;서원택;조범준
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2002.11b
    • /
    • pp.792-795
    • /
    • 2002
  • 현재 많은 관심의 대상이 되고 있는 데이터 마이닝은 대용량의 데이터베이스로부터 일정한 패턴을 분류하여 지식의 형태로 추출하는 작업이다. 데이터 마이닝의 대표적인 기법인 군집화는 군집내의 유사성을 최대화하고 군집들간의 유사성을 최소화 시키도록 데이터 집합을 분할하는 것이다. 데이터 마이닝에서 군집화는 대용량 데이터를 다루기 때문에 원시 데이터에 대한 접근 횟수를 줄이고 알고리즘이 다루어야 할 데이터 구조의 크기를 줄이는 군집화 기법이 활발하게 사용된다. 그런데 기존의 군집화 알고리즘은 잡음에 매우 민감하고, local minima에 반응한다. 또한 사전에 군집의 개수를 미리 결정해야 하고, initialization 값에 따라 군집의 성능이 좌우되는 문제점이 있다. 본 연구에서는 유전자 알고리즘을 이용하여 자동으로 군집의 개수를 결정하는 LONGEPRO 알고리즘을 제안하고, 여기서 제시하는 적합도 함수의 최적화된 군집을 찾아내여 조금더 효율적인 알고리즘을 만들어 대용량 데이터를 다루는 데이터 마이닝에 적용해 보려 한다.

  • PDF