• Title/Summary/Keyword: Clustering coefficient

검색결과 197건 처리시간 0.029초

퍼지 성능 측정자를 결합한 최적 클러스터 분석방법 (An Optimal Cluster Analysis Method with Fuzzy Performance Measures)

  • 이현숙;오경환
    • 한국지능시스템학회논문지
    • /
    • 제6권3호
    • /
    • pp.81-88
    • /
    • 1996
  • 클러스터링은 주어진 데이타 집합의 패턴을 비슷한 성질을 가지는 그룹으로 나누어 패턴 상호간의 관계를 정립하기 위한 방법론이다. 이러한 클러스터링 기법을 위하여 많은 알고리즘이 개발되었고, 패턴인식과 영상처리 등의 여러 공학영역에 적용되어 왔다. 대부분의 실세계 데이타는 그 경계가 명확하지 않으므로 그 특성을 보다 정확히 반영하기 위하여 퍼지이론이 도입되었다.이와 같은 클러스터 분석 방법은 보다 적절히 으용하기 위하여 클러스터링의 적절성을 평가하기 위한 방법론과 함께 연구되어야 한다. 이를 위하여 각 데이타 패턴이 얼마나 잘 분류되었는지를 수학적으로 계산하기 위한 함수들이 제안되었다. 그러나 클로스터 타당성 문제는 주어지 클러스터링 방법론의 특성, 그 알고리즘에서 사용한 파라메터의 성질, 주어진 입력 데이타 집합의 특성 등 여러 복잡한 상황을 포함하고 있으므로 기존의 연구에서와 같이 하나의 함수를 이용하여 해결하기는 어렵다. 그러므로 본 논문에서는 기존에 연구되어온 타당성 측정 함수를 조사하고 그의 단점을 고찰하여 이를 해결하기 위한 방법으로 4가지성능 측정자를 제안하고 이의 결합에 의하여 형성된 클러스터 타당성의 정도를 구하는 방법론을 제시하고자 한다. 또한 이러한 방법은 퍼지 클러스터링을 위한 학습 알고리즘과 결함하여 클러스터의 수나 데이타의 분포에 대한 정보없이 최적 클러스터를 찾아주는 방법에 응용될 수 있음을 보인다.

  • PDF

RAPD와 URP를 이용한 심비디움 유전자원 유연관계 분석 (Analysis of Genetic Relationship among Cymbidium germplasms Using RAPD and URP)

  • 박부희;김미선;이영란;박필만;이동수;예병우
    • 화훼연구
    • /
    • 제18권3호
    • /
    • pp.201-206
    • /
    • 2010
  • 심비디움속 유전자원 48품종에 대하여 RAPD와 URP를 이용하여 유전적 유연관계를 분석하였다. RAPD분석에는 10mer에 해당하는 random primer (Operon사) 80개를, URP는 20 mer에 해당하는 12종의 상용 primer를 이용하였다. 48 품종의 심비디움에는 34종의 동양 심비디움, 7종의 동서양란 교잡종, 7종의 서양 심비디움이 포함되어 있다. 선별된 41개의 random primer와 6개의 URP primer로부터 각각 407, 56개의 다형성 밴드를 획득하여 총 463개의 마커를 이용하였다. 이들 마커의 크기 범위는 0.4 kb 에서 1.5 kb 에 해당하였다. 유전적 유사도를 바탕으로 UPGMA clustering 프로그램을 이용하여 dendrogram을 작성하였는데 유전자원 48품종은 유사도 0.638 수준에서 총 4그룹으로 구분되었다.

Genetic characteristics of Korean Jeju Black cattle with high density single nucleotide polymorphisms

  • Alam, M. Zahangir;Lee, Yun-Mi;Son, Hyo-Jung;Hanna, Lauren H.;Riley, David G.;Mannen, Hideyuki;Sasazaki, Shinji;Park, Se Pill;Kim, Jong-Joo
    • Animal Bioscience
    • /
    • 제34권5호
    • /
    • pp.789-800
    • /
    • 2021
  • Objective: Conservation and genetic improvement of cattle breeds require information about genetic diversity and population structure of the cattle. In this study, we investigated the genetic diversity and population structure of the three cattle breeds in the Korean peninsula. Methods: Jeju Black, Hanwoo, Holstein cattle in Korea, together with six foreign breeds were examined. Genetic diversity within the cattle breeds was analyzed with minor allele frequency (MAF), observed and expected heterozygosity (HO and HE), inbreeding coefficient (FIS) and past effective population size. Molecular variance and population structure between the nine breeds were analyzed using a model-based clustering method. Genetic distances between breeds were evaluated with Nei's genetic distance and Weir and Cockerham's FST. Results: Our results revealed that Jeju Black cattle had lowest level of heterozygosity (HE = 0.21) among the studied taurine breeds, and an average MAF of 0.16. The level of inbreeding was -0.076 for Jeju Black, while -0.018 to -0.118 for the other breeds. Principle component analysis and neighbor-joining tree showed a clear separation of Jeju Black cattle from other local (Hanwoo and Japanese cattle) and taurine/indicine cattle breeds in evolutionary process, and a distinct pattern of admixture of Jeju Black cattle having no clustering with other studied populations. The FST value between Jeju Black cattle and Hanwoo was 0.106, which was lowest across the pair of breeds ranging from 0.161 to 0.274, indicating some degree of genetic closeness of Jeju Black cattle with Hanwoo. The past effective population size of Jeju Black cattle was very small, i.e. 38 in 13 generation ago, whereas 209 for Hanwoo. Conclusion: This study indicates genetic uniqueness of Jeju Black cattle. However, a small effective population size of Jeju Black cattle indicates the requirement for an implementation of a sustainable breeding policy to increase the population for genetic improvement and future conservation.

팀 프로세스의 작은 세상 구조가 팀 성과에 미치는 영향 (The Effect of Small-World Structure in Team Processes on Team Performance)

  • 서일정
    • 한국콘텐츠학회논문지
    • /
    • 제19권3호
    • /
    • pp.539-547
    • /
    • 2019
  • 본 연구의 목적은 팀 프로세스의 작은 세상 구조가 팀 성과에 미치는 영향을 탐색적으로 살펴보는 것이다. 관련 문헌을 고찰하여 팀 프로세스의 작은 세상 구조와 팀 성과 사이의 관계를 이론적으로 논의하였으며, 축구팀의 패스 데이터를 이용하여 실증적으로 분석하였다. 2014년 브라질 월드컵 경기의 패스 데이터를 수집하여 128개의 패스 네트워크를 구성하고 작은 세상을 나타내는 구조적 특성을 측정하였다. 이 과정에서 작은 세상의 정도를 측정하는 데 폭넓게 사용된 작은세상지수(small-world index)의 단점을 극복할 수 있는 새로운 지수를 개발하였다. 그리고 작은 세상 구조와 성과 사이의 관계를 밝히기 위하여 상관분석과 회귀분석을 실시하였다. 분석 결과에 의하면, 팀 프로세스의 군집성은 팀 성과와 지수함수의 관계가 있고 팀 프로세스의 연결성은 팀 성과와 로그함수의 관계가 있는 것으로 나타났다. 결과적으로 팀 프로세스의 작은 세상 구조는 팀 성과에 긍정적인 영향을 미치는 것으로 나타났다. 이론적 논의와 실증적 분석을 통해, 본 연구는 팀 프로세스의 작은 세상 구조가 팀원 사이의 업무 조정과 협업을 촉진하는데 효과적으로 작용하여 팀 성과에 긍정적인 영향을 미친다는 것을 밝혀내었다.

온라인 소셜 네트워크 생성 모델 (On-Line Social Network Generation Model)

  • 이강원
    • 한국정보통신학회논문지
    • /
    • 제24권7호
    • /
    • pp.914-924
    • /
    • 2020
  • 본 연구에서는 소셜 네트워크를 생성 할 수 있는 인공적인 네트워크 발생 모델을 제안 하였다. 본 연구에서 제안한 발생 모델은 온라인 소셜 네트워크의 특징인 Small-World 성질과 Scale-Free 성질을 단순하게 표현하는 것에서 벗어나 모델의 두 파라메터를 적절히 조절함으로서 사용자가 원하는 다양한 위상 특성치 값들을 나타내 줄 수 있도록 하였다. 이를 위해 Preferential Attachment의 세기를 조정 할 수 있도록 파라메터 K와 군집화 계수를 적절하게 조정 할 수 있도록 파라메터 P를 도입하였다. K가 0에서 10 그리고 P가 0.3에서 0.5 사이의 조합이나 K = 0과 P = 0.9를 이용하면 소셜 네트워크의 위상적 성질을 보유하는 인공적인 네트워크를 생성할 수 있다. 이 조합 하에서는 Small-World 성질과 Scale-Free 성질이 잘 나타난다. 노드차수 분포는 Power-Law를 따른다. 또한 군집화 계수 0.130 ~ 0.238, 평균 최단거리 5.641 ~ 5.985로 나타났다. 또한 네트워크의 크기를 노드 5,000개에서 10,000개로 증가시켜도 소셜 네트워크 성질을 그대로 유지하는 것으로 나타났다.

A streamlined pipeline based on HmmUFOtu for microbial community profiling using 16S rRNA amplicon sequencing

  • Hyeonwoo Kim;Jiwon Kim;Ji Won Cho;Kwang-Sung Ahn;Dong-Il Park;Sangsoo Kim
    • Genomics & Informatics
    • /
    • 제21권3호
    • /
    • pp.40.1-40.11
    • /
    • 2023
  • Microbial community profiling using 16S rRNA amplicon sequencing allows for taxonomic characterization of diverse microorganisms. While amplicon sequence variant (ASV) methods are increasingly favored for their fine-grained resolution of sequence variants, they often discard substantial portions of sequencing reads during quality control, particularly in datasets with large number samples. We present a streamlined pipeline that integrates FastP for read trimming, HmmUFOtu for operational taxonomic units (OTU) clustering, Vsearch for chimera checking, and Kraken2 for taxonomic assignment. To assess the pipeline's performance, we reprocessed two published stool datasets of normal Korean populations: one with 890 and the other with 1,462 independent samples. In the first dataset, HmmUFOtu retained 93.2% of over 104 million read pairs after quality trimming, discarding chimeric or unclassifiable reads, while DADA2, a commonly used ASV method, retained only 44.6% of the reads. Nonetheless, both methods yielded qualitatively similar β-diversity plots. For the second dataset, HmmUFOtu retained 89.2% of read pairs, while DADA2 retained a mere 18.4% of the reads. HmmUFOtu, being a closed-reference clustering method, facilitates merging separately processed datasets, with shared OTUs between the two datasets exhibiting a correlation coefficient of 0.92 in total abundance (log scale). While the first two dimensions of the β-diversity plot exhibited a cohesive mixture of the two datasets, the third dimension revealed the presence of a batch effect. Our comparative evaluation of ASV and OTU methods within this streamlined pipeline provides valuable insights into their performance when processing large-scale microbial 16S rRNA amplicon sequencing data. The strengths of HmmUFOtu and its potential for dataset merging are highlighted.

기술예측을 위한 특허 키워드 네트워크 분석 (Keyword Network Analysis for Technology Forecasting)

  • 최진호;김희수;임남규
    • 지능정보연구
    • /
    • 제17권4호
    • /
    • pp.227-240
    • /
    • 2011
  • 특허의 중요성이 커짐에 따라 특허분석의 중요성 또한 점점 커지고 있다. 특허분석은 네트워크 기반 방법과 키워드 기반 방법으로 나눠지는데 네트워크 기반은 특허 내부에 존재하는 세부 기술정보에 대한 분석이 불가능하다는 단점이 있고 키워드 기반은 기술정보간의 상호관계를 규명하지 못한다는 단점이 있다. 기존에 제시된 네트워크 기반 특허 분석과 키워드 기반 분석의 한계를 극복하기 위해서 두 방법을 혼합한 방법으로서 본 연구에서는 특허 키워드 네트워크 기반 분석 방법론을 제시하였다. 본 연구에서는 LED 분야의 특허들을 대상으로 텍스트 마이닝을 통해 중요한 기술정보를 추출한 다음, 키워드 네트워크를 구축하고, 이를 대상으로 커뮤니티 네트워크 분석을 수행하였다. 분석 결과는 다음과 같다. 첫째, 특허 키워드 네트워크는 매우 낮은 밀도와 매우 높은 클러스터링 지수를 나타내었다. 밀도가 높다는 것은 LED 분야내 특허 키워드 네트워크 내 노드(키워드)들이 산발적으로 연결되어 있다는 것을 의미하며, 클러스터링 지수가 높다는 것은 해당 키워드 네트워크 내 노드, 즉 키워드들이 각각의 커뮤니티로 매우 긴밀하게 연결되어 있음을 나타낸다. 둘째, 특허 키워드 네트워크도 다른 지식네트워크와 마찬가지로 명확한 멱함수 분포를 따른다는 사실을 알 수 있었다. 이는 기존에 활발히 연구, 활용되어 많은 연결고리를 갖고 있는 특허개념(키워드)수록 지속적으로 다른 연구자들에 의해 선택되고 이 키워드를 바탕으로 새로운 키워드들이 연결되어서 이들 키워드간의 조합으로 새로운 기술이 발명된다는 것이다. 셋째, 특허가 개발될 때 특정 분야에 유입된 키워드 중 새로운 링크가 생긴 키워드의 대부분이 기존에 연결되어 있던 커뮤니티 내의 키워드들과 결합되어 새로운 특허 개념을 구성한다는 사실을 발견하였다. 이러한 사실은 단기(4년) 장기(10년) 두 기간 모두 동일하게 나타났다. 나아가 본 연구에서 제시한 방법론을 통해 도출된 특허 키워드 조합 정보를 활용하면 미래에 어떤 개념들이 합쳐져서 새로운 특허 단위로 만들어 질지 가늠해볼 수 있고, 새로운 특허를 개발할 때 참고할 수 있는 유용한 정보로 활용할 수 있다.

한국 아동 집단의 구조 뇌연결지도 (Anatomical Brain Connectivity Map of Korean Children)

  • 엄민희;박범희;박해정
    • Investigative Magnetic Resonance Imaging
    • /
    • 제15권2호
    • /
    • pp.110-122
    • /
    • 2011
  • 목적 : 본 연구의 목적은 확산텐서영상에 기반하여 한국 아동 집단의 해부학적 뇌연결성 지도를 확립하고 뇌신경망의 효율성을 평가하는 기법을 개발하는 것이다. 대상 및 방법 : 건강한 아동 12명에서 얻은 확산텐서영상과 뇌구획영상을 바탕으로 구조 연결 행렬을 구하여 집단의 구조 연결성을 평가하였다. 일표본 t-검정을 시행하여 평균적인 구조 연결성을 파악하였고 이 때 얻은 각 피험자의 백질 다발을 표준공간으로 정규화하여 집단의 해부학적 뇌연결망 지도를 확립했다. 뇌신경망의 군집정도(clustering coefficient), 평균이동거리(characteristic path length), 전체/부분 연결망 효율성(global/local efficiency) 등 연결망 속성을 계산한 후 시각화 하였다. 결과 : 연결망 측면에서 한국 아동 집단의 뇌연결성이 작은세상속성을 가짐을 밝혔다. 또한 해부학적 뇌연결망 지도를 얻었는데 대뇌 반구 내의 연결성이 높게 나타남과 뇌간과 운동/감각 영역간에 많은 신경 연결이 집중되어 있음을 확인하였다. 결론 : 한국 아동 집단의 해부학적 뇌연결망 지도를 작성하는 방법론을 제시하여 뇌를 연결성 측면에서 이해하고 발달 장애와 성인 뇌신경망의 효율성을 평가할 수 있는 기본 도구를 확립하게되었다.

베이지안 추정치가 부여된 유사도 가중치와 연관 사용자 군집을 이용한 선호도 예측 시스템 (Preference Prediction System using Similarity Weight granted Bayesian estimated value and Associative User Clustering)

  • 정경용;최성용;임기욱;이정현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권3_4호
    • /
    • pp.316-325
    • /
    • 2003
  • 기존의 협력적 필터링 기술을 이용한 사용자 선호도 예측 방법에서는 피어슨 상관 계수에 의해 사용자의 유사도를 구하고, 아이템에 대한 사용자의 선호도를 기반으로 이웃 선정 방법을 사용하므로 아이템에 대한 내용을 반영하지 못할 뿐만 아니라 희박성 문제를 해결하지 못하였다. 본 논문에서는 기존의 사용자 선호도 예측 방법의 문제점을 보완하기 위하여 베이지안 추정치가 부여된 유사도 가중치와 연관 사용자 군집을 이용한 선호도 예측 시스템을 제안한다. 제안한 방법에서는 협력적 필터링 시스템에서의 희박성 문제를 해결하기 위하여 Association Rule Hypergraph Partitioning 알고리즘을 사용하여 사용자를 장르별로 군집하며 새로운 사용자는 Naive Bayes 분류자에 의해 이들 장르 중 하나로 분류된다. 또한, 분류된 장르 내에 속한 사용자들과 새로운 사용자의 유사도를 구하기 위해 Naive Bayes 학습을 통해 사용자가 평가한 아이템에 추정치를 달리 부여한다. 추정치가 부여된 선호도를 기존의 피어슨 상관 관계에 적용할 경우 결측치(Missing Value)로 인한 예측의 오류를 적게 하여 예측의 정확도를 높일 수 있다. 제안된 방법의 성능을 평가하기 위해서 기존의 협력적 필터링 기술과 비교 평가하였다. 그 결과 기존의 협력적 필터링 기술의 문제점을 해결하여 예측의 정확도를 높이는데 효과적임을 확인하였다.

토지이용변화에 따른 거시적 습지경관에서의 생태네트워크의 구조 및 기능적 변화 평가 (Evaluation of Structural and Functional Changes of Ecological Networks by Land Use Change in a Wetlandscape)

  • 김빈;박제량
    • Ecology and Resilient Infrastructure
    • /
    • 제7권3호
    • /
    • pp.189-198
    • /
    • 2020
  • 다양한 생태계 서비스를 제공할 수 있는 습지는 지속가능한 수질 개선 및 기후변화로 인한 영향의 완충작용 등 중요한 자연기반해법기술로 간주되어 왔다. 특히 토지이용 변화, 기후 변화 및 수문 변화에 따른 영향 저감을 위한 습지 보전의 중요성은 부각되었으나 경관규모에서의 거시적 자연기반해법기술 가능성의 검토가 미비하였다. 이에 본 연구에서는 생태 네트워크 분석을 통한 공학적 솔루션 제공 가능성을 검토하기 위해 습지경관 가상 서식종의 이동모델을 기반으로 형성된 습지 생태네트워크를 이용하여 토지이용변화에 따른 생태네트워크의 구조적, 기능적 특성 (연결성, 이동 효율성 및 집단화 계수)이 어떻게 변화하는지 분석하였다. 이를 위해 습지 밀도가 다른 네 구역의 토지이용변화를 가정하여 두 가지의 초기 면적조건에 대한 각 구역의 동시다발적 토지이용변화를 통해 생태 네트워크 특성의 변화를 분석하였다. 모든 분석결과에서 습지밀도가 높은 구역이 파괴된 경우 생태네트워크의 평균 연결성과 이동 효율성이 크게 감소하였으며, 특히 허브 (매우 높은 연결성을 지니는 노드)가 포함된 구역의 습지가 제거될 때 급격한 감소가 발생하는 것을 확인하였다. 반면, 집단화 계수는 증가하는 것으로 관찰되었다. 이를 통해 토지이용변화에 따른 생태네트워크에 대한 영향을 평가할 수 있으며 특히 향후 매개중심성 분석을 추가하여 적합한 대체습지를 조성할 수 있는 자연기반의 공학적 솔루션을 제공할 수 있을 것으로 사료된다.