• 제목/요약/키워드: Clusters of orthologous groups of proteins (COG)

검색결과 20건 처리시간 0.026초

Lipase 유전자의 보존적 영역 탐색 (Investigation of Conserved Regions in Lipase Genes)

  • 이동근;김철민;김상진;이상현;이재화
    • 생명과학회지
    • /
    • 제13권5호
    • /
    • pp.723-731
    • /
    • 2003
  • Lipase 유전자들의 보존적 영역을 탐색하기 위해 LED(Lipase Engineering Database)와 COG (Clusters of Orthologous Groups of proteins)를 통하여 각각 132개와 24개의 서열을 얻어 분석하였다. Lipase 유전자의 염기서열은 아주 다양하였고 LED의 각 상동성그룹 (homologous family) 별로 독특한 아미노산 서열이 보존적인 것을 확인 할 수 있었다. COG0657에 속하는 lipase들은 LED의 Moraxella lipase 1 homologous group과 유사한 아미노산 보존적 영역이 있음을 확인하였다. 다양한 반응 조건에 적응하는 혹은 높은 활성을 갖는 새로운 lipase 유전자를 원핵생물에서 탐색하기 위하여 다양한 시도들이 수행되어 왔지만 그들은 모두 배양가능한 미생물에 국한되어 있었다. 배양할 수 없는 세균의 유전자원을 포함하는 메타게놈에 대한 유용성 역시 최근에 널리 인식되고 있다. Lipase 유전자의 다양성으로 보았을 때 메타게놈을 이용한 새로운 lipase 유전자를 찾는 작업도 가능할 것으로 사료되어 lipase유전자 일부를 (222∼713 bp) 증폭시키는 총 10개의 PCR primer를 설계하였으며 그 가능성을 NCBI의 BLAST를 통하여 검증하였다. Lipase 유전자의 염기서열은 아미노산 서열보다 아주 다양하여 비교적 많은 수의 primer set이 필요하였다. 각 primer set의 증폭효율은 각 LED group의 16.7%와 60.0% 사이였고 개별적인 primer set을 이용할 때 보다 3.6배 효율이 높은 것으로 드러났다. Lipase 유전자의 다양성은 설계된 primer set들을 이용하여 새로운 lipase 유전자를 검출할 가능성을 높이는 것으로 사료되었다.

고온성과 초고온성 세균의 보존적 유전자 분석 (Analysis of Conservative Genes in Thermophilic and Hyperthermophilic Bacteria)

  • 이동근;이재화;하배진;하종명;이정현;김상진;이상현
    • KSBB Journal
    • /
    • 제20권5호
    • /
    • pp.387-391
    • /
    • 2005
  • 고온성 및 초고온성 세균과 고세균 13종 모두에서 관찰되는 167종류 총 16,299개의 보존적 유전자들에 대한 분석을 수행하였다. 단백질대사 관련 유전자들이 80개로 전체 보존적 유전자의 $47.9\%$였으며, 중온성 세균을 제외하고 고온성과 초고온성 세균들에서만 관찰되는 공통유전자는 없어 열 안정성은 특정 단백질의 유무에 따라 이루어지지 않는 것을 알 수 있었다. 하지만 초고온성 세균들은 reverse gyrase를 공통적으로 가지고 있어 고온에서의 DNA의 열안전성에 중요한 역할을 하는 것으로 생각되었다. 유전자보유 계통수와 165 rRNA 유전자 계통수의 비교결과 초고온성 진정세균과 고온성 고세균인 Methanobacterium thermoautotrophicum의 분포 양상이 서로 다르게 나타났다. 167개의 공통 유전자가 한 유전체에서 보이는 distance value들의 평균과 분산에서는 초고온성 진정세균, 초고온성 고세균, 고온성 고세균들끼리 유사한 값을 갖는 것으로 나타났다.

Comparative Genome Analysis Reveals Natural Variations in the Genomes of Erwinia pyrifoliae, a Black Shoot Blight Pathogen in Apple and Pear

  • Lee, Gyu Min;Ko, Seyoung;Oh, Eom-Ji;Song, Yu-Rim;Kim, Donghyuk;Oh, Chang-Sik
    • The Plant Pathology Journal
    • /
    • 제36권5호
    • /
    • pp.428-439
    • /
    • 2020
  • Erwinia pyrifoliae is a Gram-negative bacterial plant pathogen that causes black shoot blight in apple and pear. Although earlier studies reported the genome comparison of Erwinia species, E. pyrifoliae strains for such analysis were isolated in 1996. In 2014, the strain E. pyrifoliae EpK1/15 was newly isolated in the apple tree showing black shoot blight in South Korea. This study aimed to better understand the similarities and differences caused by natural variations at the genomic level between newly isolated E. pyrifoliae EpK1/15 and the strain Ep1/96, which were isolated almost 20 years apart. Several comparative genomic analyses were conducted, and Clusters of Orthologous Groups of proteins (COG) database was used to classify functional annotation for each strain. E. pyrifoliae EpK1/15 had similarities with the Ep1/96 strain in stress-related genes, Tn3 transposase of insertion sequences, type III secretion systems, and small RNAs. The most remarkable difference to emerge from this comparison was that although the draft genome of E. pyrifoliae EpK1/15 was almost conserved, Epk1/15 strain had at least three sorts of structural variations in functional annotation according to COG database; chromosome inversion, translocation, and duplication. These results indicate that E. pyrifoliae species has gone natural variations within almost 20 years at the genomic level, and we can trace their similarities and differences with comparative genomic analysis.

유전자보유 계통수를 이용한 Archaea와 Proteobacteria 분류

  • 이동근;이진옥;이재화
    • 한국생물공학회:학술대회논문집
    • /
    • 한국생물공학회 2003년도 생물공학의 동향(XII)
    • /
    • pp.686-689
    • /
    • 2003
  • 염기서열 분석이 완료된 9종의 고세균 (Archaea)과 15종의 단백세균 (Proteobacteria)에 대하여 유전자보유 유무와 16S rRNA에 의한 계통수를 neighbor joining method와 통계적 의미를 갖는 bootstrap method (n=1000)를 이용하여 분석하였다. 보존적 COG와 각 미생물 보유 ortholog수에 대한 비율은 4.60% (Mezorhizobium loti)와 56.57% (Mycoplasma genitalium) 사이로 종에 따라서 공통 유전자의 보유정도가 차이를 보이는 것으로 독특한 유전자를 탐색할 수 있는 가능성을 제시하는 결과로 사료되었다. Archaeabacteria와 Proteobacteria 그리고 Firmicutes모두 유전자보유 계통수와 16S rRNA 계통수가 일치하는 부분과 일치하지 않는 부분으로 나뉘어진다는 것을 알 수 있었다.

  • PDF

암모니아 산화 고세균의 독립성장에 필요한 결손 유전자 예측 (Prediction of Genes Lacking in an Ammonia Oxidizing Archaeon for Independent Growth)

  • 한상수;이진영;이성근;김근중
    • KSBB Journal
    • /
    • 제26권3호
    • /
    • pp.237-242
    • /
    • 2011
  • As a number of archaea are ubiquitously found in non-extreme habitats, elucidation of their functional roles becomes currently an emerging issue. However, most of them are unable to grow in pure culture and so it remains to be established. In order to find genes lacking in the genome of an ammonia-oxidizing archaeon (AOA), we here report on the comparative analyses of an AOA genome with those of experimentally or theoretically established minimal genomes for independent growth. We assessed the genes lacking in AOA using logic of clusters of orthologous groups (COG), remote homology, consensus sequence weight matrix, function-based motif or domain, and then further excluded genes encoding hypothetical orarchaea-specific proteins. The results of these combination analyses revealed 19 candidate genes lacking in the genome of an AOA. Thus, our results provide a possibility of inducing independent growth of AOA when supplemented with product (s) of the lacking gene (s), and also give a chance for finding new proteins with novel sequence or structure space even if the predicted lacking-genes will be found using another algorithms or biochemical studies.

Web-Based Computational System for Protein-Protein Interaction Inference

  • Kim, Ki-Bong
    • Journal of Information Processing Systems
    • /
    • 제8권3호
    • /
    • pp.459-470
    • /
    • 2012
  • Recently, high-throughput technologies such as the two-hybrid system, protein chip, Mass Spectrometry, and the phage display have furnished a lot of data on protein-protein interactions (PPIs), but the data has not been accurate so far and the quantity has also been limited. In this respect, computational techniques for the prediction and validation of PPIs have been developed. However, existing computational methods do not take into account the fact that a PPI is actually originated from the interactions of domains that each protein contains. So, in this work, the information on domain modules of individual proteins has been employed in order to find out the protein interaction relationship. The system developed here, WASPI (Web-based Assistant System for Protein-protein interaction Inference), has been implemented to provide many functional insights into the protein interactions and their domains. To achieve those objectives, several preprocessing steps have been taken. First, the domain module information of interacting proteins was extracted by taking advantage of the InterPro database, which includes protein families, domains, and functional sites. The InterProScan program was used in this preprocess. Second, the homology comparison with the GO (Gene Ontology) and COG (Clusters of Orthologous Groups) with an E-value of $10^{-5}$, $10^{-3}$ respectively, was employed to obtain the information on the function and annotation of each interacting protein of a secondary PPI database in the WASPI. The BLAST program was utilized for the homology comparison.

미생물의 보존적 유전자 탐색 (Investigation of Conserved Genes in Microorganism)

  • 이동근;이재화;이상현;하배진;심두희;박은정;김진욱;이화월;남천석;김남영;이어진;백진욱;하종명
    • 생명과학회지
    • /
    • 제15권2호
    • /
    • pp.261-266
    • /
    • 2005
  • 생명체의 본질적 기능에 중요한 역할을 담당하는 유전자들을 밝히기 위해 미생물 유전체들 사이의 공통적 유전자를 밝히는 COG알고리듬을 이용하였다. 진핵생물 3종을 포함한 66종의 미생물에서 63개의 유전자가 보존적이었으며, 단백질 합성에 관여하는 유전자들이 총 52개로 생명현상에서의 단백질의 중요성을 알 수 있었다. 각 보존적 유전자들의 distance value를 이용하여 종간의 유전자 변이의 정도를 보면, ribosomal protein S12 (COG0048)와 ribosomal protein L14 (COG0093)의 보존성이 가장 높았다. 보존적 유전자들의 평균과 분산으로 유전체 분석을 수행한 결과, 고세균과 진정세균의 각 그룹 등 근연종들이 독자적 그룹을 형성하였다. 하지만 각 그룹내의 속 및 유전체의 수와 유전체 변이의 정도는 비례하지 않는 것을 알 수 있었다.

Gene Content Tree를 이용한 Archaebacteria와 Bacteria 분류 (Classification of Archaebacteria and Bacteria using a Gene Content Tree Approach)

  • 이동근;김수호;이상현;김철민;김상진;이재화
    • KSBB Journal
    • /
    • 제18권1호
    • /
    • pp.39-44
    • /
    • 2003
  • 유전자보유 유무에 따른 계통수와 16S rRNA에 의한 계통수를 염기서열 분석이 완료된 33종의 미생물에 대하여neighbor joining method와 bootstrap method(n=1,000)를 이용하여 상관관계를 분석하였다. 각 분류그룹에서 공통적으로 보존된 COG와 각 미생물이 보유하고 있는 ortholog 수에 대한 비율을 조사한 결과, Mezorhiaobium lot의 4.60% Mycoplasma genitalium의 56.57% 사이에 분포하는 것으로 파악되었다. 이는 미생물 종류에 따라서 공통 유전자의 보유정도가 차이를 보이는 것으로 독특한 유전자를 탐색할 수 있는 가능성을 제시하는 결과로 사료되었다. 그리고 같은 종 내에 서도 20% 이상의 ortholog가 서로 독립적인 것을 알 수 있었다. Archaeabacteria와 Proteobacteria 그리고 Firmicutes모두 유전자보유 계통수와 16S rRNA 계통수가 일치하는 부분과 일치하지 않는 부분으로 나뉘어진다는 것을 알 수 있었다. 이러한 결과는 165 rDNA처림 보존적이지 않은 유전자까지 고려한 결과이거나 horizontal gene transfer에 의한 영향 등으로 사료되었다. COC에 기초한 유전자보유 계통수는 생화학 적 실험과 염기서열에 기초한 분류의 중간자적 입장에서 유용유전자 탐색에 이용될 수 있을 것이다.

Draft Genome Assembly and Annotation for Cutaneotrichosporon dermatis NICC30027, an Oleaginous Yeast Capable of Simultaneous Glucose and Xylose Assimilation

  • Wang, Laiyou;Guo, Shuxian;Zeng, Bo;Wang, Shanshan;Chen, Yan;Cheng, Shuang;Liu, Bingbing;Wang, Chunyan;Wang, Yu;Meng, Qingshan
    • Mycobiology
    • /
    • 제50권1호
    • /
    • pp.66-78
    • /
    • 2022
  • The identification of oleaginous yeast species capable of simultaneously utilizing xylose and glucose as substrates to generate value-added biological products is an area of key economic interest. We have previously demonstrated that the Cutaneotrichosporon dermatis NICC30027 yeast strain is capable of simultaneously assimilating both xylose and glucose, resulting in considerable lipid accumulation. However, as no high-quality genome sequencing data or associated annotations for this strain are available at present, it remains challenging to study the metabolic mechanisms underlying this phenotype. Herein, we report a 39,305,439 bp draft genome assembly for C. dermatis NICC30027 comprised of 37 scaffolds, with 60.15% GC content. Within this genome, we identified 524 tRNAs, 142 sRNAs, 53 miRNAs, 28 snRNAs, and eight rRNA clusters. Moreover, repeat sequences totaling 1,032,129 bp in length were identified (2.63% of the genome), as were 14,238 unigenes that were 1,789.35 bp in length on average (64.82% of the genome). The NCBI non-redundant protein sequences (NR) database was employed to successfully annotate 11,795 of these unigenes, while 3,621 and 11,902 were annotated with the Swiss-Prot and TrEMBL databases, respectively. Unigenes were additionally subjected to pathway enrichment analyses using the Gene Ontology (GO), Kyoto Encyclopedia of Genes and Genomes (KEGG), Cluster of Orthologous Groups of proteins (COG), Clusters of orthologous groups for eukaryotic complete genomes (KOG), and Non-supervised Orthologous Groups (eggNOG) databases. Together, these results provide a foundation for future studies aimed at clarifying the mechanistic basis for the ability of C. dermatis NICC30027 to simultaneously utilize glucose and xylose to synthesize lipids.

미생물 유전체의 in silico분석에 의한 보존적 유전자 탐색 (Investigation of Conserved Gene in Microbial Genomes using in silico Analysis)

  • 강호영;신창진;강병철;박준형;신동훈;최정현;조환규;차재호;이동근
    • 생명과학회지
    • /
    • 제12권5호
    • /
    • pp.610-621
    • /
    • 2002
  • 미생물 유전체(genome)들 사이의 보존된 유전자 (con-served gene)를 밝히는 것은 생명의 본질을 이해하는데 있어 다양한 의미를 갖는다고 할 수 있을 것이다. 본 연구에서는 보존적 유전자를 찾아내고, distance value를 이용하여 구한 보존성의 정도 C(conservation score)를 이용하여 종간의 유전자 변이의 정도를 단백질 관점에서 분석하였다. 분석에 사용된 자료는 COGs 데이티베이스의 총 43종의 미생물 유전체들이며, 이들은 총 n,009개의 유전자들을 포함하는 3,852 개의 ortholog들로 구성되어있었다. 분석 결과 43종의 미생물 유전체에 대하여 총 $\ulcorner$2개의 유전자들이 보존적인 것으로 나타났으며, 이들 중 72.2%인 52종의 유전자가 단백질 합성에 관련되는 것으로 나타났다. 이들 보존적 유전자들에 대하여 보존성의 정도 C를 계산하여 보존성의 순위를 얻었으며, 가장 잘 보존된 유전자는 CTPase-trans-lation elogation factor (COG0050)로 나타났다. 그리고 72개의 보존적 유전자가 나타내는 CU 모두를 이용한 분석결과 고세균(archaea)과 진정세균(bacteria)이 각각 독자적인 그룹을 형성하는 것을 관찰하였다. 본 연구의 결과에서 도출한 72개의 보존적 유전자는 생명체의 본질적 기능에 중요한 역할을 담당하는 것으로 사료되었고, 생명체의 진화 과정에서 이 유전자들이 보존된 이유와 기능적 연계에 대한 생물학적 연구에 기초 자료를 제공할 것으로 판단되어 진다.