• 제목/요약/키워드: Assembly sequence

검색결과 285건 처리시간 0.03초

꼬막(Tegillarca granosa)의 유전적 다양성 분석을 위한 드래프트 게놈분석과 마이크로새틀라이트 마커 발굴 (Genome Survey and Microsatellite Marker Selection of Tegillarca granosa)

  • 김진무;이승재;조은아;최은경;김현진;이정식;박현
    • 한국해양생명과학회지
    • /
    • 제6권1호
    • /
    • pp.38-46
    • /
    • 2021
  • 꼬막 종류 중 하나인 Tegillarca granosa는 해양 이매패류로서 한국, 중국, 일본 등의 중요한 수산 자원 중 하나이다. 꼬막의 염색체 수는 2n=38로 알려져 있지만, 유전체의 크기와 유전 정보에 대해서는 아직 명확하게 알려져 있지 않다. 꼬막의 유전체 크기 예측을 위하여 NGS Illumina HiSeq 플랫폼을 이용하여 얻은 짧은 DNA 서열 정보를 통하여 in silico 분석으로 유전체 크기를 분석하였다. 그 결과 꼬막의 유전체 크기는 770.61 Mb로 예측되었다. 이후 MaSuRCA assembler를 통하여 드래프트 게놈 조립 작업을 수행하고, QDD pipeline을 이용하여 SSR (simple sequence repeats) 분석을 수행하였다. 꼬막의 유전체로부터 43,944개의 SSR을 발굴하였으며, 다이-뉴클레오타이드(di-nucleotide) 69.51%, 트라이-뉴클레오타이드(tri-nucleotide) 16.68%, 테트라-뉴클레오타이드(tetra-nucleotide) 12.96%, 펜타-뉴클레오타이드(penta-nucleotide) 0.82% 그리고 헥사-뉴클레오타이드(hexa-nucleotide) 0.03%로 구성되었다. 이후 꼬막의 유전적 다양성 연구에 활용할 수 있는 100개의 마이크로새틀라이트 마커의 프라이머 세트를 선별하였다. 앞으로 이번 연구를 통해서, 꼬막의 집단유전학적 연구와 유전적 다양성을 규명하는데 도움이 될 것이며, 나아가 동종들 간의 원산지 분류를 알아낼 수 있을 것이다.

Genenation of structural diversity in polyketides by combinatorial biosynthesis of polyketides: Part I. Generation of multiple bioactive macrolides by hybrid modular polyketide synthases in Streptomyces venezuelae, Part II. Production of novel rifamycins by combinatorial biosynthesis

  • Yoon, Yeo-Joon
    • 한국미생물생명공학회:학술대회논문집
    • /
    • 한국미생물생명공학회 2002년도 학술발표대회
    • /
    • pp.18-25
    • /
    • 2002
  • The pikromycin biosynthetic system in Streptomyces venezuleae is unique for its ability to produce two groups of antibiotics that include the 12-membered ring macrolides methymycin and neomethymycin, and the 14-membered ring macrolides narbomycin and pikromycin. The metabolic pathway also contains two post polyketide-modification enzymes, a glycosyltransferase and P450 hydroxylase that have unusually broad substrate specificities. In order to explore further the substrate flexibility of these enzymes a series of hybrid polyketide synthases were constructed and their metabolic products characterized. The plasmid-based replacement of the multifunctional protein subunits of the pikromycin PKS in S. venezuelae by the corresponding subunits from heterologous modular PKSs resulted in recombinant strains that produce both 12- and 14-membered ring macrolactones with predicted structural alterations. In all cases, novel macrolactones were produced and further modified by the DesVII glycosyltransferase and PikC hydroxylase leading to biologically active macrolide structures. These results demonstrate that hybrid PKSs in S. venezuelae can produce a multiplicity of new macrolactones that are modified further by the highly flexible DesVII glycosyltransferase and PikC hydroxylase tailoring enzymes. This work demonstrates the unique capacity of the S. venezuelae pikromycin pathway to expand the toolbox of combinatorial biosynthesis and to accelerate the creation of novel biologically active natural products. The polyketide backbone of rifamycin B is assembled through successive condensation and ${\beta}$-carbonyl processing of the extender units by the modular rifamycin PKS. The eighth module, in the RifD protein, contains nonfunctional DH domain and functional KR domain, which specify the reduction of the ${\beta}$-carbonyl group resulting in the C-21 bydroxyl of rifamycin B. A four amino acid substitution and one amino acid deletion were introduced in the putative NADPH binding motif in the proposed KR domain encoded by rifD. This strategy of mutation was based on the amino acid sequences of the corresponding motif of the KR domain of module 3 in the RifA protein, which is believed dysfunctional, so as to introduce a minimum alteration and retain the reading frame intact, yet ensure loss of function. The resulting strain produces linear polyketides, from tetraketide to octaketide, which are also produced by a rifD disrupted mutant as a consequence of premature termination of polyketide assembly. Much of the structural diversity within the polyketide superfamily of natural products is due to the ability of PKSs to vary the reduction level of every other alternate carbon atom in the backbone. Thus, the ability to introduce heterologous reductive segments such as ketoreductase (KR), dehydratase (DH), and enoylreductase (ER) into modules that naturally lack these activities would increase the power of the combinatorial biosynthetic toolbox. The dehydratase domain of module 7 of the rifamycin PKS, which is predicted to be nonfunctional in view of the sequence of the apparent active site, was replaced with its functional homolog from module 7 of rapamycin-producing polyketide synthase. The resulting mutant strain behaved like a rifC disrupted mutant, i.e., it accumulated the heptaketide intermediate and its precursors. This result points out a major difficulty we have encountered with all the Amycolatopsis mediterranei strain containing hybrid polyketide synthases: all the engineered strains prepared so far accumulate a plethora of products derived from the polyketide chain assembly intermediates as major products instead of just analogs of rifamycin B or its ansamycin precursors.

  • PDF

LBL 법을 이용한 기능성 나노 입자 제조 (Fabrication of functional nanoparticles by layer-by-layer self-assembly method)

  • 김진호;황종희;임태영;김세훈
    • 한국결정성장학회지
    • /
    • 제19권6호
    • /
    • pp.305-310
    • /
    • 2009
  • PMMA 입자의 표면에 양전하를 갖는 전해질 폴리머 PDDA와 음전하를 갖는TALH를 사용하여 $TiO_2$ 박막을 LBL 법에 의해 성공적으로 제조하였다. 수정진동자의 측정을 통해 TALH의 용액의 pH가 감소됨에 따라 TALH의 적층량이 늘어나고 PMMA의 입자 표면에 코팅된 (PDDA/TALH) 박막의 두께가 증가됨을 확인하였다. (PDDA/TALH)n의 순서에 의해 코팅된 PMMA 입자들은 bilayer 수의 변화에 따라 다양한 색 변화를 보여주었다. (PDDA/TALH) 박막의 bilayer 수(n)가 10과 20 일 경우에 $a^*$$b^*$의 값은 막이 코팅되지 않은 PMMA의 값보다 감소하였고 색 변화는 $a^*$, $b^*$ 색도도에서 각각 green과 blue 방향으로 이동하였다. 이후 n의 수가 30, 40으로 증가됨에 따라 $a^*$$b^*$의 값은 증가하였고 색의 변화는 red와 yellow 방향으로 각각 이동하였다. 최종적으로 $(PDDA/TALH)_{50}$ 박막이 코팅된 PMMA 입자들은 박막이 코팅되지 않은 PMMA 입자들과 거의 비슷한 $a^*$$b^*$의 값을 보여주었다.

한국 토종닭의 전장 유전체 복제수변이(CNV) 발굴 (Genome-wide Copy Number Variation in a Korean Native Chicken Breed)

  • 조은석;정원형;최정우;장현준;박미나;김남신;김태헌;이경태
    • 한국가금학회지
    • /
    • 제41권4호
    • /
    • pp.305-311
    • /
    • 2014
  • 복제수변이(Copy number variation, CNV)는 DNA 다양한 구조적 변화의 한 형태이다. 복제수변이는 인간의 질병 및 농업의 생산성에 영향을 미치는 것으로 알려져 있다. 이전 우리나라의 닭의 품종은 유럽에서 유입되어진 품종을 기반으로 구축되어져 있었다. 따라서 농촌진흥청 국립축산과학원에서는 20년 동안 재래품종을 복원하려고 노력하였고, 5품종 12계통으로 복원하였다. 최근 염기서열분석 기술의 발달로, 해상도가 좋은 게놈 전체의 복제수변이를 발굴할 수 있게 되었다. 그러나 한국 재래닭 품종에 대해서는 체계적인 연구가 이루어지지 않고 있다. 본 연구에서는 한국 재래 닭(계통 L)에 대해서 게놈 전체의 염기서열을 분석하고 닭의 참고서열과 비교하여 재래닭에서 확인된 복제수 변이를 보고하였다. 닭의 28개 염색체에서 총 501개의 복제수 변이를 확인하였고, 이를 Gain과 Loss로 나누어서 표시하였다. 또한 우리는 501개의 복제수 변이를 포함하고 있는 유전자의 기능을 분류하였다. 그 결과, 전사 및 유전자 조절에 관련된 유전자들이 많이 분류되었다. 본 연구의 결과는 복제수 변이와 한국 재래닭의 경제형질 간의 연관성을 설명할 수 있는 기초자료로 활용될 것으로 사료된다.

Draft Genome Assembly and Annotation for Cutaneotrichosporon dermatis NICC30027, an Oleaginous Yeast Capable of Simultaneous Glucose and Xylose Assimilation

  • Wang, Laiyou;Guo, Shuxian;Zeng, Bo;Wang, Shanshan;Chen, Yan;Cheng, Shuang;Liu, Bingbing;Wang, Chunyan;Wang, Yu;Meng, Qingshan
    • Mycobiology
    • /
    • 제50권1호
    • /
    • pp.66-78
    • /
    • 2022
  • The identification of oleaginous yeast species capable of simultaneously utilizing xylose and glucose as substrates to generate value-added biological products is an area of key economic interest. We have previously demonstrated that the Cutaneotrichosporon dermatis NICC30027 yeast strain is capable of simultaneously assimilating both xylose and glucose, resulting in considerable lipid accumulation. However, as no high-quality genome sequencing data or associated annotations for this strain are available at present, it remains challenging to study the metabolic mechanisms underlying this phenotype. Herein, we report a 39,305,439 bp draft genome assembly for C. dermatis NICC30027 comprised of 37 scaffolds, with 60.15% GC content. Within this genome, we identified 524 tRNAs, 142 sRNAs, 53 miRNAs, 28 snRNAs, and eight rRNA clusters. Moreover, repeat sequences totaling 1,032,129 bp in length were identified (2.63% of the genome), as were 14,238 unigenes that were 1,789.35 bp in length on average (64.82% of the genome). The NCBI non-redundant protein sequences (NR) database was employed to successfully annotate 11,795 of these unigenes, while 3,621 and 11,902 were annotated with the Swiss-Prot and TrEMBL databases, respectively. Unigenes were additionally subjected to pathway enrichment analyses using the Gene Ontology (GO), Kyoto Encyclopedia of Genes and Genomes (KEGG), Cluster of Orthologous Groups of proteins (COG), Clusters of orthologous groups for eukaryotic complete genomes (KOG), and Non-supervised Orthologous Groups (eggNOG) databases. Together, these results provide a foundation for future studies aimed at clarifying the mechanistic basis for the ability of C. dermatis NICC30027 to simultaneously utilize glucose and xylose to synthesize lipids.

미생물법의학: 차세대염기서열분석 방법에 따른 MLVA 결과 비교 및 이를 활용한 DNA 감식 (Microbial Forensics: Comparison of MLVA Results According to NGS Methods, and Forensic DNA Analysis Using MLVA)

  • 윤형석;이승호;임승현;이대상;구세훈;김정은;정주환;김성주;허경행;송동현
    • 한국군사과학기술학회지
    • /
    • 제27권4호
    • /
    • pp.507-515
    • /
    • 2024
  • Microbial forensics is a scientific discipline for analyzing evidence related to biological crimes by identifying the origin of microorganisms. Multiple locus variable number tandem repeat analysis(MLVA) is one of the microbiological analysis methods used to specify subtypes within a species based on the number of tandem repeat in the genome, and advances in next generation sequencing(NGS) technology have enabled in silico anlysis of full-length whole genome sequences. In this paper, we analyzed unknown samples provided by Robert Koch Institute(RKI) through The United Nations Secretary-General's Mechanism(UNSGM)'s external quality assessment exercise(EQAE) project, which we officially participated in 2023. We confirmed that the 3 unknown samples were B. anthracis through nucleic acid isolation and genetic sequence analysis studies. MLVA results on 32 loci of B. anthracis were analysed by using genome sequences obtained from NGS(NextSeq and MinION) and Sanger sequencing. The MLVA typing using short-reads based NGS platform(NextSeq) showed a high probability of causing assembly error when a size of the tandem repeats was grater than 200 bp, while long-reads based NGS platform(MinION) showed higher accuracy than NextSeq, although insertion and deletion was observed. We also showed hybrid assembly can correct most indel error caused by MinION. Based on the MLVA results, genetic identification was performed compared to the 2,975 published MLVA databases of B. anthracis, and MLVA results of 10 strains were identical with 3 unkonwn samples. As a result of whole genome alignment of the 10 strains and 3 unknown samples, all samples were identified as B. anthracis strain A4564 which is associated with injectional anthrax isolates in heroin users.

한우 cDNA 라이브러리에서 발현된 ESTs의 기능분석 (Functional Analysis of Expressed Sequence Tags from Hanwoo (Korean Cattle) cDNA Libraries)

  • 임다정;변미정;조용민;윤두학;이승환;신윤희;임석기
    • Journal of Animal Science and Technology
    • /
    • 제51권1호
    • /
    • pp.1-8
    • /
    • 2009
  • 본 연구는 한우의 지방, 간, 등심조직에서 유전자 염기서열을 확보하여 생산된 57,598개의 유전자 발현단편 데이터의 기능규명을 실시하였다. 유전자 발현단편 서열은 Assembly 과정을 통하여 unique한 서열인 4,759 contigs와 7,587 singletons을 확보하였으며, 얻어진 전사체를 이용하여 NCBI의 non-redundant 단백질 데이터베이스에 대하여 서열유사성 검색 (BLAST)을 하여 유전자의 기능을 예측할 수 있었다. 또한 기능에 대한 모호성을 확실히 하기 위해 Gene Ontology 용어를 사용하여 한우의 세 조직에서 확보된 서열들의 생물학적 특성을 기술하였다. Gene Ontology 는 모든 기능이 계층적으로 표현되어 있기 때문에, 각 계층에 대하여 유의적인 기능 여부를 확인하기 위하여 통계 분석인 Pearson's chi-square test를 실시하여 통계적으로 유의한 기능들을 산출할 수 있었다. 그 결과, Molecular function, Biological process, Cellular component 각각의 GO category에서 13, 16, 8개의 유의적인 GO terms이 검출되었다. 또한, 한우의 세 조직에 대하여 조직특이적 유전자의 존재여부를 판단하기 위하여 Audic's test를 실시하여 세 조직에서 각각 조직특이적으로 발현되는 유전자들을 검출할 수 있었다. 이러한 생물정보학적 방법들을 사용하여 한우의 세 조직에서 발현된 대량의 서열들에 대한 기능을 예측할 수 있었으며, 통계 검증을 통하여 유의적으로 검출된 유전자들은 추후에 실험적 검증을 실시하여 충분한 정보를 확보할 수 있을 것으로 사료된다.

EST Analysis system for panning gene

  • Hur, Cheol-Goo;Lim, So-Hyung;Goh, Sung-Ho;Shin, Min-Su;Cho, Hwan-Gue
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2000년도 International Symposium on Bioinformatics
    • /
    • pp.21-22
    • /
    • 2000
  • Expressed sequence tags (EFTs) are the partial segments of cDNA produced from 5 or 3 single-pass sequencing of cDNA clones, error-prone and generated in highly redundant sets. Advancement and expansion of Genomics made biologists to generate huge amount of ESTs from variety of organisms-human, microorganisms as well as plants, and the cumulated number of ESTs is over 5.3 million, As the EST data being accumulate more rapidly, it becomes bigger that the needs of the EST analysis tools for extraction of biological meaning from EST data. Among the several needs of EST analyses, the extraction of protein sequence or functional motifs from ESTs are important for the identification of their function in vivo. To accomplish that purpose the precise and accurate identification of the region where the coding sequences (CDSs) is a crucial problem to solve primarily, and it will be helpful to extract and detect of genuine CD5s and protein motifs from EST collections. Although several public tools are available for EST analysis, there is not any one to accomplish the object. Furthermore, they are not targeted to the plant ESTs but human or microorganism. Thus, to correspond the urgent needs of collaborators deals with plant ESTs and to establish the analysis system to be used as general-purpose public software we constructed the pipelined-EST analysis system by integration of public software components. The software we used are as follows - Phred/Cross-match for the quality control and vector screening, NCBI Blast for the similarity searching, ICATools for the EST clustering, Phrap for EST contig assembly, and BLOCKS/Prosite for protein motif searching. The sample data set used for the construction and verification of this system was 1,386 ESTs from human intrathymic T-cells that verified using UniGene and Nr database of NCBI. The approach for the extraction of CDSs from sample data set was carried out by comparison between sample data and protein sequences/motif database, determining matched protein sequences/motifs that agree with our defined parameters, and extracting the regions that shows similarities. In recent future, in addition to these components, it is supposed to be also integrated into our system and served that the software for the peptide mass spectrometry fingerprint analysis, one of the proteomics fields. This pipelined-EST analysis system will extend our knowledge on the plant ESTs and proteins by identification of unknown-genes.

  • PDF

Whole-Genome Resequencing Analysis of Hanwoo and Yanbian Cattle to Identify Genome-Wide SNPs and Signatures of Selection

  • Choi, Jung-Woo;Choi, Bong-Hwan;Lee, Seung-Hwan;Lee, Seung-Soo;Kim, Hyeong-Cheol;Yu, Dayeong;Chung, Won-Hyong;Lee, Kyung-Tai;Chai, Han-Ha;Cho, Yong-Min;Lim, Dajeong
    • Molecules and Cells
    • /
    • 제38권5호
    • /
    • pp.466-473
    • /
    • 2015
  • Over the last 30 years, Hanwoo has been selectively bred to improve economically important traits. Hanwoo is currently the representative Korean native beef cattle breed, and it is believed that it shared an ancestor with a Chinese breed, Yanbian cattle, until the last century. However, these two breeds have experienced different selection pressures during recent decades. Here, we whole-genome sequenced 10 animals each of Hanwoo and Yanbian cattle (20 total) using the Illumina HiSeq 2000 sequencer. A total of approximately 3.12 and 3.07 billion sequence reads were mapped to the bovine reference sequence assembly (UMD 3.1) at an average of approximately 10.71- and 10.53-fold coverage for Hanwoo and Yanbian cattle, respectively. A total of 17,936,399 single nucleotide polymorphisms (SNPs) were yielded, of which 22.3% were found to be novel. By annotating the SNPs, we further retrieved numerous nonsynonymous SNPs that may be associated with traits of interest in cattle. Furthermore, we performed whole-genome screening to detect signatures of selection throughout the genome. We located several promising selective sweeps that are potentially responsible for economically important traits in cattle; the PPP1R12A gene is an example of a gene that potentially affects intramuscular fat content. These discoveries provide valuable genomic information regarding potential genomic markers that could predict traits of interest for breeding programs of these cattle breeds.

컴포넌트 효율성 특성을 고려한 Wright기반의 커넥터 확장 (Extension of Wright-based Connector Considering Efficiency Characteristics of Component)

  • 정화영;송영재
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권12호
    • /
    • pp.1185-1192
    • /
    • 2003
  • 소프트웨어 아키텍처기반의 컴포넌트 조립 및 합성기법에서 기존의 아키텍처 기반 조립기법인 ACME, Wright 등은 커넥터의 Role을 통하여 컴포넌트들 사이의 직접적인 연결구조에 의한 선요구 선처리로 운용된다. 그러나, 커넥터에서 운용되는 선요구 선처리 기법은 각 특성을 달리하는 컴포넌트들의 비동기적인 요구 발생시 효율성이 낮은 컴포넌트가 요청되어 처리가 할당되면 효율성이 높은 컴포넌트의 처리를 위해서는 단순히 순서를 기다려야 하므로 컴포넌트들의 요구처리에 대한 효율적인 처리 및 운용이 어렵다. 따라서, 조립 컴포넌트들의 운용성 향상을 위하여 커넥터에서 각 호출 컴포넌트들의 특성을 고려한 우선순위에 따라 요구에 대한 할당처리가 필요하다. 본 연구에서는 기존의 Wright명세를 기반으로 커넥터부분을 다중 연결구조에서 사용 가능하도록 확장하였으며, 컴포넌트로부터 요청된 서비스처리를 위하여 조립 컴포넌트들의 효율성 요소 중 CPU사용율, 빈요구 처리시간, 메모리 사용율에 대한 가중치를 계산하여 우선순위를 산정하여 운용되도록 설계 및 구현하였다. 이러한 적용결과로 각 효율성 특성을 달리 갖는 샘플 EJB 컴포넌트 20개를 구현하여 시험 및 운용함으로서 기존의 선요구 선처리 기법 대비 481ms의 소요시간 차이를 보이고 있으나 효율성이 높은 컴포넌트의 요구부터 먼저 처리됨으로서 전체 시스템의 효과적인 운용이 가능하였다.