• 제목/요약/키워드: visualization of genome information

검색결과 36건 처리시간 0.022초

계층적 정렬쌍 가시화를 이용한 유전자 클러스터 탐색 알고리즘 (A Gene Clustering Method with Hierarchical Visualization of Alignment Pairs)

  • 진희정;박수현;조환규
    • 정보처리학회논문지A
    • /
    • 제16A권3호
    • /
    • pp.143-152
    • /
    • 2009
  • 최근 생물정보학 분야의 연구는 하나하나의 유전자를 연구하던 예전의 방법에서 유전자들간의 관계를 알아보는 연구들로 변해가고 있다. 이러한 유전자들 간의 연구 중 하나가 유전자 팀(gene team)을 연구하는 것이다. 유전자 팀이란 몇몇 염색체들 사이의 유전자들이 보존되어 있는 것을 말하며, 닫힌 영역 안에 보존되어 있는 유전자들의 집합으로 볼 수 있다. 이들은 진화과정을 거치면서, 유전자 팀 내의 유전자들의 위치나 그 종류가 변한다. 이러한 유전자 팀을 찾기 위해 많은 연구들이 이루어져왔다. 본 논문은 생물정보학 분야에서 많이 사용되는 계층적 클러스터링(hierarchical clustering)방법을 변형하여 전체 유전체(whole genome) 쌍내에서의 의미 있는 영역을 찾고, 영역 내에서 gene team을 찾을 수 있는 방법을 소개한다. 본 연구 방법을 이용하면, 복잡한 구조의 두 유전체 사이의 연관 유전자들이나 유사 영역들의 맵(map)을 단계별로 간략화 하여 나타낼 수 있다.

Prospect of plant molecular cytogenetics in the 21st century

  • Mukai, Yasuhiko
    • 한국생명과학회:학술대회논문집
    • /
    • 한국생명과학회 2003년도 제40회 국제학술심포지움
    • /
    • pp.14-27
    • /
    • 2003
  • The genomes of Arabidopsis and rice have been fully sequenced. Genomic sequencing provides global information about genome structure and organization. A comprehensive research account of our recent studies conducted on genome painting, comparative genomics and genome fusion is provided in order to project the prospects of plant cytogenetic research in post-genomics era. Genome analysis by GISH using genome painting is demonstrated as an excellent means suitable for visualization of a whole genome, since total genomic DNA representing the overall molecular composition of the genome is used as a probe. FISH on extended DNA fibers has been developed for high-resolution FISH and has contributed to determining the copy number and order of genes. We have also mapped a number of genes involving starch synthesis on wheat chromosomes by FISH and compared the position of these genes on linkage map of rice. Macro synteny between wheat and rice can be observed by comparing the location of these genes in spite of the fact that the size of DNA per chromosome differs by 20 fold in two. Moreover, to approach our goal towards making bread and udon noodles from rice flour in future by incorporating bread making and the noodle qualifies in rice, we have been successful in introducing large genomic DNA fragments containing agronomically important genes of wheat into a rice by successive introduction of large insert BAC clones, there by expanding genetic variability in rice. We call this method genome fusion.

  • PDF

전유전체(Whole gerlome) 서열 분석과 가시화를 위한 워크벤치 개발 (Development of Workbench for Analysis and Visualization of Whole Genome Sequence)

  • 최정현;진희정;김철민;장철훈;조환규
    • 정보처리학회논문지A
    • /
    • 제9A권3호
    • /
    • pp.387-398
    • /
    • 2002
  • 최근 활발한 소단위 게놈 프로젝트의 수행으로 많은 생물체의 유전체 전체 서열이 밝혀짐에 따라서 전유전체(whole genome)를 기본 단위로 하여 개별 유전자나 그에 관련된 기능 연구가 매우 활발히 이루어지고 있다. 전유전체의 염기 서열은 수백만 bp(base pairs)에서 수백억 bp(base pairs) 정도의 대용량 텍스트 데이터이기 때문에 단순한 온라인 문자 일치(on-line string matching) 알고리즘으로 분석하는 것은 매우 비효율적이다. 본 논문에서는 대용량의 유전체 서열을 분석하는데 적합한 자료 구조인 스트링 B-트리를 사용하여 유전체 서열의 분석과 가시화를 위한 워크벤치를 개발한 과정을 소개한다. 본 연구에서 개발한 시스템은 크게 질의문 부분과 가시화 부분으로 나뉘어 진다. 질의문 부분에는 유전체 서열에 특정 서열이 나타나는 부분의 위치와 횟수를 알아보거나 k번 나타나는 서열을 조사하는 것과 같은 기본적인 패턴 검색 부분과 k-mer 분석을 위한 질의어가 다양하게 준비되어 있다. 가시화 부분은 전유전체 서열과 주석(annotation)을 보여주거나, 유전체 분석을 용이하도록 여러 가시화 방법, CGR(Chaos Game Representation), k-mer graph, RWP(Random Walk Plot) 등으로 생물학자들이 쉽게 전체 구조와 특성 파악할 수 있도록 도와준다. 본 논문이 제안하는 분석 시스템은 생물체의 진화적 관계를 밝히고, 염색체 내에 아직 알려지지 않은 새로운 유전자나 기능이 밝혀지지 않은 junk DNA들의 기능 등을 연구하는데 사용할 수 있다.

REPEATOME: A Database for Repeat Element Comparative Analysis in Human and Chimpanzee

  • Woo, Tae-Ha;Hong, Tae-Hui;Kim, Sang-Soo;Chung, Won-Hyong;Kang, Hyo-Jin;Kim, Chang-Bae;Seo, Jung-Min
    • Genomics & Informatics
    • /
    • 제5권4호
    • /
    • pp.179-187
    • /
    • 2007
  • An increasing number of primate genomes are being sequenced. A direct comparison of repeat elements in human genes and their corresponding chimpanzee orthologs will not only give information on their evolution, but also shed light on the major evolutionary events that shaped our species. We have developed REPEATOME to enable visualization and subsequent comparisons of human and chimpanzee repeat elements. REPEATOME (http://www.repeatome.org/) provides easy access to a complete repeat element map of the human genome, as well as repeat element-associated information. It provides a convenient and effective way to access the repeat elements within or spanning the functional regions in human and chimpanzee genome sequences. REPEATOME includes information to compare repeat elements and gene structures of human genes and their counterparts in chimpanzee. This database can be accessed using comparative search options such as intersection, union, and difference to find lineage-specific or common repeat elements. REPEATOME allows researchers to perform visualization and comparative analysis of repeat elements in human and chimpanzee.

BioCovi: A Visualization Service for Comparative Genomics Analysis

  • Lee, Jungsul;Park, Daeui;Bhak, Jong
    • Genomics & Informatics
    • /
    • 제3권2호
    • /
    • pp.52-54
    • /
    • 2005
  • Visualization of the homology information is an important method to analyze the evolutionary and functional meanings of genes. With a database containing model genomes of Homo sapiens, Mus muculus, and Rattus norvegicus, we constructed a web­based comparative analysis tool, BioCovi, to visualize the homology information of mammalian sequences on a very large scale. The user interface has several features: it marks regions whose identity is greater than that specified, it shows or hides gaps from the result of global sequence alignment, and it inverts the graph when total identity is higher than the threshold specified.

Insights of window-based mechanism approach to visualize composite biodata point in feature spaces

  • Daoud, Mosaab
    • Genomics & Informatics
    • /
    • 제17권1호
    • /
    • pp.4.1-4.7
    • /
    • 2019
  • In this paper, we propose a window-based mechanism visualization approach as an alternative way to measure the seriousness of the difference among data-insights extracted from a composite biodata point. The approach is based on two components: undirected graph and Mosaab-metric space. The significant application of this approach is to visualize the segmented genome of a virus. We use Influenza and Ebola viruses as examples to demonstrate the robustness of this approach and to conduct comparisons. This approach can provide researchers with deep insights about information structures extracted from a segmented genome as a composite biodata point, and consequently, to capture the segmented genetic variations and diversity (variants) in composite data points.

Development of a Knowledge Base for Korean Pharmacogenomics Research Network

  • Park, Chan Hee;Lee, Su Yeon;Jung, Yong;Park, Yu Rang;Lee, Hye Won;Kim, Ju Han
    • Genomics & Informatics
    • /
    • 제3권3호
    • /
    • pp.68-73
    • /
    • 2005
  • Pharmacogenomics research requires an intelligent integration of large-scale genomic and clinical data with public and private knowledge resources. We developed a web-based knowledge base for KPRN (Korea Pharmacogenomics Research Network, http://kprn.snubi. org/). Four major types of information is integrated; genetic variation, drug information, disease information, and literature annotation. Eighteen Korean pharmacogenomics research groups in collaboration have submitted 859 genotype data sets for 91 disease-related genes. Integrative analysis and visualization of the large collection of data supported by integrated biomedical path­ways and ontology resources are provided with a user-friendly interface and visualization engine empowered by Generic Genome Browser.

특정변화패턴 식별을 위한 염기서열 집단간의 다형성 분석 및 시각화 도구 (A Polymorphism Analysis and Visualization Tool for Specific Variation Pattern Identification in Groups of Nucleotide Sequences)

  • 이일섭;이건명
    • 융합정보논문지
    • /
    • 제8권6호
    • /
    • pp.201-207
    • /
    • 2018
  • 유전체는 생명체가 가지고 있는 모든 유전적 정보를 담고 있다. 특정 종 내에서는 개체별로 고유의 특성이 나타나며, 이 특성은 유전체의 염기서열 분석을 통해 확인할 수 있다. 종내 개체들 사이에 조금씩 다른 염기에 대해 유전적 연관성을 규명 짓고, 더 나아가 질병과의 연관성을 찾는 전장유전체 연관분석 연구가 많이 진행되고 있다. 종 내의 조금씩 발생하는 염기변이를 파악하는 것은 개체의 다형성을 파악하기 위해 중요하다. 이 논문에서는 종 내 여러 개체의 염기서열에서 대립형질 빈도의 특정변화패턴을 쉽게 파악할 수 있는 분석 및 시각화 도구를 제안한다. 그리고 수두 대상포진 바이러스의 계대 배양한 pOka strain 염기서열 데이터를 이용해 실험하여 분석과 시각화의 실용성을 보인다. 본 제안도구를 통해 종 내의 대립형질 빈도의 변화를 탐색하고 유전적 요인을 찾는 연구효율의 증진을 기대할 수 있다.

BaSDAS: a web-based pooled CRISPR-Cas9 knockout screening data analysis system

  • Park, Young-Kyu;Yoon, Byoung-Ha;Park, Seung-Jin;Kim, Byung Kwon;Kim, Seon-Young
    • Genomics & Informatics
    • /
    • 제18권4호
    • /
    • pp.46.1-46.4
    • /
    • 2020
  • We developed the BaSDAS (Barcode-Seq Data Analysis System), a GUI-based pooled knockout screening data analysis system, to facilitate the analysis of pooled knockout screen data easily and effectively by researchers with limited bioinformatics skills. The BaSDAS supports the analysis of various pooled screening libraries, including yeast, human, and mouse libraries, and provides many useful statistical and visualization functions with a user-friendly web interface for convenience. We expect that BaSDAS will be a useful tool for the analysis of genome-wide screening data and will support the development of novel drugs based on functional genomics information.

단백질 상호작용 추론 및 가시화 시스템 (A Visualization and Inference System for Protein-Protein Interaction)

  • 이미경;김기봉
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권12호
    • /
    • pp.1602-1610
    • /
    • 2004
  • 다양한 유전체 프로젝트로 말미암아 엄청난 서열 데이타들이 쏟아지고, 이에 따라 핵산 및 단백질 수준의 서열 데이타 분석이 매우 중요하게 인식되고 있다. 특히 최근에는 단백질이 단순하게 개별적인 기능을 가진 독립적인 요소가 아닌 전체 단백질 상호작용 네트워크 상에서 다른 객체들과 유기적인 관계를 갖으며 나름대로의 중요한 역할을 수행하고 있다는 점에 초점을 맞추어 연구가 진행되고 있다. 특히 단백질 상호작용 관계 분석을 위해서는 실제로 상호작용이 일어나는 도메인 모듈 정보가 아주 중요하게 작용하는데, 본 논문에서는 이러한 점을 고려하여 우리가 개발한 단백질 기능 및 상호작용 분석을 위한 PIVS(Protein-protein interaction Inference and Visualization System)에 대해 소개하고 있다 PIVS는 기존의 단백질 상호작용 데이타베이스들을 합쳐서 통합 데이타베이스를 생성하고, 다양한 전처리 과정으로 통합 데이타베이스 서열의 기능 및 주석 정보를 추출하여 로컬 데이타베이스화 하였다. 그리고 특히 단백질 상호작용 관계 분석을 위해 중요하게 작용하는 도메인 모듈 정보들을 추출하여 로컬 데이터베이스를 구축하였고, 기존의 단백질 상호작용 관계 데이타를 이용하석 도메인 사이의 상호작용 관계 정보도 수집하여 분석하였다. PIVS는 단백질의 종합적인 분석 정보, 즉, 기능 및 주석, 도메인, 상호작용 관계 정보 등을 손쉽고 편리하게 얻고자 하는 사용자에게 매우 유용하게 사용될 수 있을 것이다.