• 제목/요약/키워드: similarity based clustering

검색결과 326건 처리시간 0.02초

SSR마커를 이용한 국내육성 포도 품종의 다양성과 품종 판별 (Genetic Diversity and Identification of Korean Grapevine Cultivars using SSR Markers)

  • 조강희;배경미;노정호;신일섭;김세희;김정희;김대현;황해성
    • 한국육종학회지
    • /
    • 제43권5호
    • /
    • pp.422-429
    • /
    • 2011
  • This study was conducted to investigate the genetic diversity and to develop a technique for cultivar identification using SSR markers in grapevine. Thirty Korean bred and introduced grapevine cultivars were evaluated by 28 SSR markers. A total of 143 alleles were produced ranging from 2 to 8 alleles with an average of 5.1 alleles per locus. Polymorphic information contents (PIC) were ranged from 0.666 (VVIp02) to 0.975 (VVIn33 and VVIn62) with an average of 0.882. UPGMA (unweighted pair-group method arithmetic average) clustering analysis based on genetic distances using 143 alleles classified 30 grapevine cultivars into 7 clusters by similarity index of 0.685. Similarity values among the tested grapevine cultivars ranged from 0.575 to 1.00, and the average similarity value was 0.661. The similarity index was the highest (1.00) between 'Jinok' and 'Campbell Early', and the lowest (0.575) between 'Alden' and 'Narsha'. The genetic relationships among the 30 studied grapevine cultivars were basically consistent with the known pedigree. The three SSR markers sets (VVIn61, VVIt60, and VVIu20) selected from 28 primers were differentiated all grapevine cultivars except for 'Jinok' and 'Campbell Early'. Five cultivars ('Narsha, 'Alden', 'Dutchess', 'Pione', and 'Muscat Hamburg') were identified by VVIn61 at the first step. Then 21 cultivars including 'Hongsodam' by VVIt60 at the second step and 2 cultivars ('Heukbosuck' and 'Suok') by VVIu20 at the third step were identified. These markers could be used as a reliable tool for the identification of Korean grapevine cultivars.

퍼지관계 이론에 의한 집단지성의 도출 (Elicitation of Collective Intelligence by Fuzzy Relational Methodology)

  • 주영도
    • 지능정보연구
    • /
    • 제17권1호
    • /
    • pp.17-35
    • /
    • 2011
  • 집단지성은 개인들의 협업과 경쟁을 통한 공통이해에 기반한 생산으로서 대중의 지혜를 창출하는 개별 지성들의 통합체라고 할 수 있다. 집단지성의 활용은 공개와 공유 그리고 참여의 기본 철학을 갖고 있는 웹 2.0의 주요한 설계원칙으로 자리잡은 후로, 이와 관련된 연구가 다양하게 진행되고 있다. 이 논문은 개인들간의 관계와 상호작용에 대한 인식을 기반으로 집단지성을 밝혀보려는 방법론을 제안한다. 응용대상은 정보검색과 분류 분야이며, 개인지성의 표현과 도출을 위해 개인 컨스트럭트 이론과 지식 그리드 기법에 퍼지관계이론을 적용한다. 개인의 개별적인 지성은 헤세 다이어그램의 형태로 구현된 지성 구조로 표현하여 내재된 지식적인 의미를 분석한다. 논문의 목적인 집단지성의 도출은 개인지성들의 비교를 통해 상호간 공유와 일치를 찾아낼 수 있는 유사성 이론의 도입에 의해 이루어진다. 제안하는 방법론은 퍼지관계 이론 및 퍼지 매칭 알고리즘을 기반으로 실험 데이터로부터 유사성을 측정하고, 개인지성들을 대표할 수 있는 최적의 집단지성을 이끌어내고자 한다.

유사어 벡터 확장을 통한 XML태그의 유사성 검사 (Similarity checking between XML tags through expanding synonym vector)

  • 이정원;이혜수;이기호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권9호
    • /
    • pp.676-683
    • /
    • 2002
  • XML(extensible Markup Language)문서가 웹 문서의 표준으로 자리 매김 할 수 있는 가장 큰 성공요인은 사용자가 문서 타입을 기술할 수 있는 유연성(flexibility)이다. 그러나 XML의 유연성으로 야기되는 문제점은 동일한 의미를 표현하기 위해 XML문서 작성자마다 서로 다른 태그명과 구조를 사용한다는 점이다. 즉 서로 다른 태그 집합, 요소(element), 속성(attribute)에 대한 서로 다른 이름 또는 다른 문서 구조로 인해 다른 태그로 표현된 문서는 서로 다른 부류의 문서로 간주되기 쉽다. 따라서 본 논문은 XML태그에 내재된 의미 정보(semantic information)와 구조 정보(structured information)를 추출하여 의미적으로 최대한 유사한 동의어로 확장하고, XML문서의 확장된 태그간의 의미적 유사도를 비교 분석할 수 있는 개념 기반의 태그 패턴 매처(Tag Pattern Matcher)를 설계 구현하였다. 두 XML문서의 태그간의 의미적 유사도에 가중치를 부여하여 기존의 비구조적인(semi-structured) 문서를 위한 벡터 스페이스 모델(vector space model)을 확장함으로써 두 XML문서가 유사한지를 파악할 수 있다.

한국 음나무(두릅과) 집단의 형태적 분석 (Morphological Analysis on the Kalopanax pictus (Araliaceae) of Korean Populations)

  • Jung, Sang-Duk;Hong, Jung-Hee;Bang, Kyung-Hwan;Huh, Man-Kyu
    • 생명과학회지
    • /
    • 제14권3호
    • /
    • pp.400-405
    • /
    • 2004
  • 한국내 분포하는 음나무(Kalopanox pictus Nakai)의 집단간 분화를 연구하기 위해 형태적 특성을 조사하였다. 23개 형태 형질에 근거하여 지역간 분화는 현저하였다. 아홉 집단에서 138표본으로 유효한 분류학적 단위(OTU)를 표현형 유사도와 형태적 변이를 조사하였으며 주성분 분석을 실시하였다. 첫 세 주성분 요소가 전체 변이의 77.0%에 관련이 있었다. 이 중 첫 번째 주성분 요소가 전체 변이의 52%에 기여하였는데 이에 해당되는 형질은 장상복엽의 장상렬의 수, 그리고 장상렬의 폭이다. 형태적 변이에 근거한 군집분석에서 우리나라 남부와 중부지방의 두 그룹으로 나누어졌다.

Analysis of Expressed Sequence Tags from the Wood-Decaying Fungus Fomitopsis palustris and Identification of Potential Genes Involved in the Decay Process

  • Karim, Nurul;Shibuya, Hajime;Kikuchi, Taisei
    • Journal of Microbiology and Biotechnology
    • /
    • 제21권4호
    • /
    • pp.347-358
    • /
    • 2011
  • Fomitopsis palustris, a brown-rot basidiomycete, causes the most destructive type of decay in wooden structures. In spite of its great economic importance, very little information is available at the molecular level regarding its complex decay process. To address this, we generated over 3,000 expressed sequence tags (ESTs) from a cDNA library constructed from F. palustris. Clustering of 3,095 high-quality ESTs resulted in a set of 1,403 putative unigenes comprising 485 contigs and 918 singlets. Homology searches based on BlastX analysis revealed that 78% of the F. palustris unigenes had a significant match to proteins deposited in the nonredundant databases. A subset of F. palustris unigenes showed similarity to the carbohydrateactive enzymes (CAZymes), including a range of glycosyl hydrolase (GH) family proteins. Some of these CAZyme-encoded genes were previously undescribed for F. palustris but predicted to have potential roles in biodegradation of wood. Among them, we identified and characterized a gene (FpCel45A) encoding the GH family 45 endoglucanase. Moreover, we also provided functional classification of 473 (34%) of F. palustris unigenes using the Gene Ontology hierarchy. The annotated EST data sets and related analysis may be useful in providing an initial insight into the genetic background of F. palustris.

가변 어휘 음성 인식기의 음향모델 개선 및 성능분석 (Acoustic Model Improvement and Performance Evaluation of the Variable Vocabulary Speech Recognition System)

  • 이승훈;김회린
    • 한국음향학회지
    • /
    • 제18권8호
    • /
    • pp.3-8
    • /
    • 1999
  • 문맥독립형 음향모델을 채택하고 있는 기존의 가변어휘 음성인식기는 주변환경에 따른 음소의 변화를 모델링 할 수 없었다. 이러한 문제를 해결하기 위해서는 변이음을 이용한 문맥의존형 음향모델을 사용해야 한다. 본 논문은 가변어휘 음성인식기의 음향모델을 효과적으로 개선하기 위하여 적용한 방법에 대해서 기술하고 있다. 즉, 음향모델의 개선은 엔트로피를 이용한 군집화 기법을 적용하여 변이음의 개수를 변경시키면서 최적의 변이음 모델을 추출하는 방법을 사용하였다. 개선된 모델에 대한 성능은 POW(Phonetically Optimized Words) 3848 DB 및 SNR이 크게 다른 2종류의 PC168 DB를 이용하여 훈련 및 인식 실험을 수행하면서 평가하였다. 결론적으로 변이음의 개수를 낮추면서도 인식 성능의 저하를 가져오지 않는 최적의 변이음 모델을 얻을 수 있었으며 PC168 DB를 이용한 인식실험을 통하여 확인할 수 있었다.

  • PDF

Genetic Relationships among Korean Adlay, Coix lachryma-jobi L., Landraces Based on AFLPs

  • Moon Jung-Hun;Jang Jung Hee;Park Jung Soo;Kim Sung Kee;Lee Kyung-Jun;Lee Sang-Kyu;Kim Kyung-Hee;Lee Byung-Moo
    • 한국작물학회지
    • /
    • 제50권2호
    • /
    • pp.142-146
    • /
    • 2005
  • Thirty-two germplasms of Korean adlay landraces were examined to analyse the genetic relationship through the amplified fragment length polymorphism (AFLP) approach. Total number of AFLP products generated by 12 selective primer combinations was 882. The number of polymorphic fragments by each primer combination greatly varied from 4 to 51 with a mean of 20.3, bands visible on the polyacrylamide gel. A genetic similarity coefficient was used for cluster analysis following UPGMA (unweighted pair grouping method of averages) method. The resulting clusters were represented in the form of a dendrogram. The clustering was not tight in the dendrogram. There was generally no clear grouping of the adlay according to the geographic regions in which germplasms were collected. The present AFLP analysis imply that although Korean adlay displayed a larger amount of AFLP variation within germplasms, the variation was shown independently without reflecting a clinal variation. This study demonstrated that AFLP method can be used to examine the genetic relationships among different germplasms of adlay.

문장구조 유사도와 단어 유사도를 이용한 클러스터링 기반의 통계기계번역 (Integrated Clustering Method based on Syntactic Structure and Word Similarity for Statistical Machine Translation)

  • 김한경;나휘동;이금희;이종혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.44-49
    • /
    • 2009
  • 통계기계번역에서 도메인에 특화된 번역을 시도하여 성능향상을 얻는 방법이 있다. 이를 위하여 문장의 유형이나 장르에 따라 클러스터링을 수행한다. 그러나 기존의 연구 중 문장의 유형 정보와 장르에 따른 정보를 동시에 사용한 경우는 없었다. 본 논문에서는 문장 사이의 문법적 구조 유사성으로 문장을 유형별로 분류하는 새로운 기법을 제시하였고, 단어 유사도 정보로 문서의 장르를 구분하여 기존의 두 기법을 통합하였다. 이렇게 분류된 말뭉치에서 추출한 모델과 전체 말뭉치에서 추출된 모델에서 보간법(interpolation)을 사용하여 통계기계번역의 성능을 향상하였다. 문장구조의 유사성과 단어 유사도 계산을 위하여 각각 커널과 코사인 유사도를 적용하였으며, 두 유사도를 적용하여 말뭉치를 분류하는 과정은 K-Means 알고리즘과 유사한 기계학습 기법을 사용하였다. 이를 일본어-영어의 특허문서에서 실험한 결과 최선의 경우 약 2.5%의 상대적인 성능 향상을 얻었다.

  • PDF

An Intelligent Residual Resource Monitoring Scheme in Cloud Computing Environments

  • Lim, JongBeom;Yu, HeonChang;Gil, Joon-Min
    • Journal of Information Processing Systems
    • /
    • 제14권6호
    • /
    • pp.1480-1493
    • /
    • 2018
  • Recently, computational intelligence has received a lot of attention from researchers due to its potential applications to artificial intelligence. In computer science, computational intelligence refers to a machine's ability to learn how to compete various tasks, such as making observations or carrying out experiments. We adopted a computational intelligence solution to monitoring residual resources in cloud computing environments. The proposed residual resource monitoring scheme periodically monitors the cloud-based host machines, so that the post migration performance of a virtual machine is as consistent with the pre-migration performance as possible. To this end, we use a novel similarity measure to find the best target host to migrate a virtual machine to. The design of the proposed residual resource monitoring scheme helps maintain the quality of service and service level agreement during the migration. We carried out a number of experimental evaluations to demonstrate the effectiveness of the proposed residual resource monitoring scheme. Our results show that the proposed scheme intelligently measures the similarities between virtual machines in cloud computing environments without causing performance degradation, whilst preserving the quality of service and service level agreement.

무감독분류 기법에 의한 부분방전 데이터 분석 (Partial Discharge Data Analysis with Unsupervised Classification)

  • 조경순;홍선학
    • 디지털산업정보학회논문지
    • /
    • 제14권4호
    • /
    • pp.9-16
    • /
    • 2018
  • This study described partial discharge(PD) distribution analysis between the XLPE(Cross-Linked PolyEthylene)and EPDM(Ethylene Propylene Diene Monomer) interface with unsupervised classification. The ${\phi}-q-n$ patterns were analyzed using phase resolved partial discharge(PRPD). K-means cluster analysis forms a cluster based on similarities and distances among scattered individuals, and analyzes the characteristics of the formed clusters, dividing the multivariate data into several groups according to the similarity of each characteristic, Is a statistical analysis that makes it easier to navigate. It was confirmed that the phase angle of the cluster with the maximum discharge charge was concentrated around $0^{\circ}$ and $180^{\circ}$ at 30 kV after the initial phase distribution localized around $90^{\circ}$ and $300^{\circ}$ expanded to the whole phase angle according to the voltage rise. The Euclidean distance between the center of gravity and the discharge charge in the ${\Phi}-q$ cluster increased with increasing applied voltage.