• 제목/요약/키워드: Individual genome

검색결과 202건 처리시간 0.021초

The complete mitochondrial genome of Arabidopsis thaliana (Brassicaceae) isolated in Korea

  • PARK, Jongsun;XI, Hong;KIM, Yongsung
    • 식물분류학회지
    • /
    • 제51권2호
    • /
    • pp.176-180
    • /
    • 2021
  • Arabidopsis thaliana (L.) Heynh. is a small plant species that serves as a model organism of plant biology and genetics. Here, we present the first complete mitochondrial genome of Korean A. thaliana natural isolate (named as 180404IB4), which is 368,875 bp long and contains 58 genes (33 protein-coding genes, 22 tRNAs, and three rRNAs), with a GC ratio of 44.8%. Sixty-four single-nucleotide polymorphisms and 11 insertion and deletion regions (1,089 bp in length) are identified against the Col-0 ecotype, showing one large insertion of 1,069 bp without structural variation. Phylogenetic trees constructed from 30 conserved genes indicate that the 180404IB4 mitochondrial genome is clustered with Col-0 and three East Asian ecotypes.

Beta-Meta: a meta-analysis application considering heterogeneity among genome-wide association studies

  • Gyungbu Kim;Yoonsuk Lee;Jeong Ho Park;Dongmin Kim;Wonseok Lee
    • Genomics & Informatics
    • /
    • 제20권4호
    • /
    • pp.49.1-49.7
    • /
    • 2022
  • Many packages for a meta-analysis of genome-wide association studies (GWAS) have been developed to discover genetic variants. Although variations across studies must be considered, there are not many currently-accessible packages that estimate between-study heterogeneity. Thus, we propose a python based application called Beta-Meta which can easily process a meta-analysis by automatically selecting between a fixed effects and a random effects model based on heterogeneity. Beta-Meta implements flexible input data manipulation to allow multiple meta-analyses of different genotype-phenotype associations in a single process. It provides a step-by-step meta-analysis of GWAS for each association in the following order: heterogeneity test, two different calculations of an effect size and a p-value based on heterogeneity, and the Benjamini-Hochberg p-value adjustment. These methods enable users to validate the results of individual studies with greater statistical power and better estimation precision. We elaborate on these and illustrate them with examples from several studies of infertility-related disorders.

전유전체(Whole gerlome) 서열 분석과 가시화를 위한 워크벤치 개발 (Development of Workbench for Analysis and Visualization of Whole Genome Sequence)

  • 최정현;진희정;김철민;장철훈;조환규
    • 정보처리학회논문지A
    • /
    • 제9A권3호
    • /
    • pp.387-398
    • /
    • 2002
  • 최근 활발한 소단위 게놈 프로젝트의 수행으로 많은 생물체의 유전체 전체 서열이 밝혀짐에 따라서 전유전체(whole genome)를 기본 단위로 하여 개별 유전자나 그에 관련된 기능 연구가 매우 활발히 이루어지고 있다. 전유전체의 염기 서열은 수백만 bp(base pairs)에서 수백억 bp(base pairs) 정도의 대용량 텍스트 데이터이기 때문에 단순한 온라인 문자 일치(on-line string matching) 알고리즘으로 분석하는 것은 매우 비효율적이다. 본 논문에서는 대용량의 유전체 서열을 분석하는데 적합한 자료 구조인 스트링 B-트리를 사용하여 유전체 서열의 분석과 가시화를 위한 워크벤치를 개발한 과정을 소개한다. 본 연구에서 개발한 시스템은 크게 질의문 부분과 가시화 부분으로 나뉘어 진다. 질의문 부분에는 유전체 서열에 특정 서열이 나타나는 부분의 위치와 횟수를 알아보거나 k번 나타나는 서열을 조사하는 것과 같은 기본적인 패턴 검색 부분과 k-mer 분석을 위한 질의어가 다양하게 준비되어 있다. 가시화 부분은 전유전체 서열과 주석(annotation)을 보여주거나, 유전체 분석을 용이하도록 여러 가시화 방법, CGR(Chaos Game Representation), k-mer graph, RWP(Random Walk Plot) 등으로 생물학자들이 쉽게 전체 구조와 특성 파악할 수 있도록 도와준다. 본 논문이 제안하는 분석 시스템은 생물체의 진화적 관계를 밝히고, 염색체 내에 아직 알려지지 않은 새로운 유전자나 기능이 밝혀지지 않은 junk DNA들의 기능 등을 연구하는데 사용할 수 있다.

MediScore: MEDLINE-based Interactive Scoring of Gene and Disease Associations

  • Cho, Hye-Young;Oh, Bermseok;Lee, Jong-Keuk;Kim, Kuchan;Koh, InSong
    • Genomics & Informatics
    • /
    • 제2권3호
    • /
    • pp.131-133
    • /
    • 2004
  • MediScore is an information retrieval system, which helps to search for the set of genes associated with a specific disease or the set of diseases associated with a specific gene. Despite recent improvement of natural language processing (NLP) and other text mining approaches to search for disease associated genes, many false positive results come out due to diversity of exceptional cases as well as ambiguities in gene names. In order to overcome the weak points of current text mining approaches, MediScore introduces statistical normalization based on binomial to normal distribution approximation which corrects inaccurate scores caused by common words not representing genes and interactive rescoring by the user to remove the false positive results. Interactive rescoring includes individual alias scoring for each gene to remove false gene synonyms, referring MEDLINE abstracts, and cross referencing between OMIM and other related information.

Extensive Reorganization of the Chloroplast Genome of Corydalis platycarpa: A Comparative Analysis of their Organization and Evolution with other Corydalis plastomes

  • Grusamy Raman;SeonJoo Park
    • 한국자원식물학회:학술대회논문집
    • /
    • 한국자원식물학회 2023년도 임시총회 및 춘계학술대회
    • /
    • pp.15-15
    • /
    • 2023
  • The chloroplast (cp) is an autonomous plant organelle with an individual genome that codes for essential cellular functions. The architecture and gene content of the cp genome is highly conserved in angiosperms. The plastome of Corydalis belongs to the Papaveraceae family, and the genome is comprised of unusual rearrangements and gene content. Thus far, no extensive comparative studies have been carried out to understand the evolution of Corydalis chloroplast genomes. Therefore, the Corydalis platycarpa cp genome was sequenced, and wide-scale comparative studies were conducted using publicly available twenty Corydalis plastomes. Comparative analyses showed that an extensive genome rearrangement and IR expansion occurred, and these events evolved independently in the Corydalis species. In addition, the protein-coding genes accD and the ndh gene loss events occurred in the common ancestor of the Corydalis and sub-clade of the Corydalis lineage, respectively. The gene ndh lost in the Corydalis-sub clade species is distributed predominantly in the Qinghai-Tibetan plateau (QTP) region. The molecular clock analysis suggests that the divergence time of all the ndh gene lost Corydalis sub-clade species occurred in the 44.31 - 15.71 mya. These results coincide very well with the uplift of the Qinghai-Tibet Plateau in the Oligocene and Miocene periods, and maybe during this period, it probably triggered the radiation of the Corydalis species. To the best of the authors' knowledge, this is the first large-scale comparative study of Corydalis plastomes and their evolution. The present study may provide insights into the plastome architecture and the molecular evolution of Corydalis species.

  • PDF

Regulation of Pharmacogene Expression by microRNA in The Cancer Genome Atlas (TCGA) Research Network

  • Han, Nayoung;Song, Yun-Kyoung;Burckart, Gilbert J.;Ji, Eunhee;Kim, In-Wha;Oh, Jung Mi
    • Biomolecules & Therapeutics
    • /
    • 제25권5호
    • /
    • pp.482-489
    • /
    • 2017
  • Individual differences in drug responses are associated with genetic and epigenetic variability of pharmacogene expression. We aimed to identify the relevant miRNAs which regulate pharmacogenes associated with drug responses. The miRNA and mRNA expression profiles derived from data for normal and solid tumor tissues in The Cancer Genome Atlas (TCGA) Research Network. Predicted miRNAs targeted to pharmacogenes were identified using publicly available databases. A total of 95 pharmacogenes were selected from cholangiocarcinoma and colon adenocarcinoma, as well as kidney renal clear cell, liver hepatocellular, and lung squamous cell carcinomas. Through the integration analyses of miRNA and mRNA, 35 miRNAs were found to negatively correlate with mRNA expression levels of 16 pharmacogenes in normal bile duct, liver, colon, and lung tissues (p<0.05). Additionally, 36 miRNAs were related to differential expression of 32 pharmacogene mRNAs in those normal and tumorigenic tissues (p<0.05). These results indicate that changes in expression levels of miRNAs targeted to pharmacogenes in normal and tumor tissues may play a role in determining individual variations in drug response.

Exploring Cross-function Domain Interaction Map

  • Li, Xiao-Li;Tan, Soon-Heng;Ng, See-Kiong
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2005년도 BIOINFO 2005
    • /
    • pp.431-436
    • /
    • 2005
  • Living cells are sustained not by individual activities but rather by coordinated summative efforts of different biological functional modules. While recent research works have focused largely on finding individual functional modules, this paper attempts to explore the connections or relationships between different cellular functions through cross-function domain interaction maps. Exploring such a domain interaction map can help understand the underlying inter-function communication mechanisms. To construct a cross-function domain interaction map from existing genome-wide protein-protein interaction datasets, we propose a two-step procedure. First, we infer conserved domain-domain interactions from genome-wide protein-protein interactions of yeast, worm and fly. We then build a cross-function domain interaction map that shows the connections of different functions through various conserved domain interactions. The domain interaction maps reveal that conserved domain-domain interactions can be found in most detected cross-functional relationships and a f9w domains play pivotal roles in these relationships. Another important discovery in the paper is that conserved domains correspond to highly connected protein hubs that connect different functional modules together.

  • PDF

우수 마 선택을 위한 최신 전략 (Recent Strategy for Superior Horses)

  • 김정안;김희수
    • 생명과학회지
    • /
    • 제26권7호
    • /
    • pp.855-867
    • /
    • 2016
  • 말은 인류에 의해 상대적으로 일찍 가축화된 종 중 하나로써, 경주능력, 강건성 및 항병성 등과 같은 능력을 위해 인공적으로 선택되었다. 그 결과, 현재 경주마로 많이 쓰이고 있는 서러브레드의 게놈은 운동 능력에 특화된 유전자형을 많이 갖고 있다. 최근 NGS 기술의 도래와 함께 전장게놈을 대상으로 경주마의 우수한 유전형질을 찾는 연구가 유전체학의 관점에서 진행되고 있다. 그 결과 말의 게놈에 대해서도 GWAS (Genome-wide Association study)가 적용되고 있고, 우수 경주능력을 나타내는 유전자 마커가 발굴되고 있다. 아울러, 특정 샘플의 전장 전사체를 NGS 기법으로 분석할 수 있는 RNA-Seq 기법 역시 활용되고 있는데, 이를 통하여 각 개체별, 운동 전후, 한 개체의 조직별 특정 유전자의 발현 양상과 함께 전사체의 서열 등을 확인할 수 있다. DNA 서열의 변화 없이 유전자 발현을 조절하는 강력한 인자로써 DNA methylation이 주목받고 있다. 말의 게놈에 있어서도 운동 특이적 또는 개체 특이적 DNA methylation 패턴을 보여 주었고, 이는 우수 개체 선정을 위한 마커 개발에 좋은 단서를 제공해 줄 것이다. 유전자 발현을 억제하는 miRNA와, 포유동물의 유전체 내 절반 정도를 차지하고 있는 이동성 유전인자는 기능유전체 연구에 있어서 중요한 인자들이다. 이들은 인간의 게놈에서 많이 연구가 되어 왔으나, 말에서의 연구는 현재 미미한 실정이다. 하지만, 현재까지 말에서 되어 있는 위의 두 인자에 대한 연구 현황을 알아보고, 차후 우수 마 선별 연구에 적용될 가능성을 제시하였다. 기능유전체 및 후성유전체 분석 기법이 발전함에 따라 말에서도 본 연구에서 소개된 여러 가지 분석 기법이 적용되고, 우수한 경주마를 선정하는 데 많은 도움을 줄 것으로 기대하고 있다. 이에 현재까지의 우수한 경주마를 선택하기 위한 많은 연구들 및, 말 연구에 대한 앞으로의 발전 가능성에 대해 고찰하고 토의하였다.

맞춤의학 시대의 개인 유전체 서열의 해독과 스마트한 이용 (Individual Genome Sequences and Their Smart Application In Personalized Medicine)

  • 김동민;정해영;김일철;원용관
    • 스마트미디어저널
    • /
    • 제2권4호
    • /
    • pp.34-40
    • /
    • 2013
  • 다양하고 빠른 차세대 유전체 서열 분석기를 사용한 개인 유전체 분석은 생명과학 연구뿐만 아니라 질병의 진단과 치료를 포함하는 의학 분야까지 새로운 지평을 열고 있다. 저렴한 비용으로 읽혀진 개인 유전체 서열은 통합 과정을 거쳐 유전체 이상을 점검할 수 있고, 얻어진 서열 데이터는 유전자 변이성 연구, 유전체 발현 연구, 후성유전학적 연구, 유전체 주석화 등에 이용될 수 있다. 개인 유전체 데이터는 생물학적 연구 결과와 임상 연구 데이터를 연계하여 질환 위험도의 예측과 맞춤 치료에 이용할 수 있게 되었다. 개인 맞춤의학 시대에 전문적 데이터와 일반인 사용자의 간극을 메우기 위해 스마트 미디어 기기와 같은 적극적인 인터페이스의 개발이 시급하다.

  • PDF

Next-Generation Sequencing and Epigenomics Research: A Hammer in Search of Nails

  • Sarda, Shrutii;Hannenhalli, Sridhar
    • Genomics & Informatics
    • /
    • 제12권1호
    • /
    • pp.2-11
    • /
    • 2014
  • After the initial enthusiasm of the human genome project, it became clear that without additional data pertaining to the epigenome, i.e., how the genome is marked at specific developmental periods, in different tissues, as well as across individuals and species-the promise of the genome sequencing project in understanding biology cannot be fulfilled. This realization prompted several large-scale efforts to map the epigenome, most notably the Encyclopedia of DNA Elements (ENCODE) project. While there is essentially a single genome in an individual, there are hundreds of epigenomes, corresponding to various types of epigenomic marks at different developmental times and in multiple tissue types. Unprecedented advances in next-generation sequencing (NGS) technologies, by virtue of low cost and high speeds that continue to improve at a rate beyond what is anticipated by Moore's law for computer hardware technologies, have revolutionized molecular biology and genetics research, and have in turn prompted innovative ways to reduce the problem of measuring cellular events involving DNA or RNA into a sequencing problem. In this article, we provide a brief overview of the epigenome, the various types of epigenomic data afforded by NGS, and some of the novel discoveries yielded by the epigenomics projects. We also provide ample references for the reader to get in-depth information on these topics.