• Title/Summary/Keyword: FASTA

Search Result 19, Processing Time 0.029 seconds

A Genomics Tool for Microbial Genome Comparison Using BLAST/FASTA (BLAST/FASTA를 활용한 미생물 유전체 비교용 도구의 개발)

  • Tae, Hongseok;Lee, Daesang;Park, Wan;Park, Kiejung
    • Korean Journal of Microbiology
    • /
    • v.38 no.4
    • /
    • pp.267-275
    • /
    • 2002
  • We have developed GComp as an analysis tool for microbial genome comparison. This tool exploits BLAST or FASTA as a preprocessing program for local alignments to detect homologous regions, parses the homology search results, and generates tables and files to show homology relationship between two genomes at a glance. The interface for graphical representation of the comparative genomic analysis has been also implemented. Our test cases shows that the program can be useful in practice for intuitive and quantitative comparison of microbial genome sequence pairs as well as self-genome analysis. A few additional features have been devised and designed, which will be added in the further development.

A genomice Tool for Microbial Genome Comparison Using BLAST/FASTA (BLAST/FASTA를 활용한 미생물 유전체 비교용 도구의 개발)

  • Tae Hongseok;Park Kiejung
    • Proceedings of the Microbiological Society of Korea Conference
    • /
    • 2002.10a
    • /
    • pp.185-193
    • /
    • 2002
  • We have developed GComp as an analysis tool for comparative analysis of microbial genomes. Thetool uses BLAST or FASTA as a preprocessing program for local alignments, parses the homology search results, and generates tables and files to show homology relationship between two genomes at a glance. The interface for graphical representation of the comparative genomic analysis has been also implemented. Through analysis of a few pairs of microbial genome sequences, the program has been proved to be practically useful and a few additional features have been devised and designed, which will be added in the further development.

  • PDF

Development of Contig Assembly Program for Nucleotide Sequencing (염기서열 해독작업을 위한 핵산 단편 조립 프로그램의 개발)

  • 이동훈
    • Korean Journal of Microbiology
    • /
    • v.35 no.2
    • /
    • pp.121-127
    • /
    • 1999
  • An effective computer program for assembling fragments in DNA sequencing has been developed. The program, called SeqEditor (Sequence Editor), is usable on the pcrsonal computer systems of MS-Widows which is the mosl popular operating system in Korea. It c'm recd several sequence file formats such as GenBak, FASTA, and ASCII. In the SeqEditor program, a dynamic programming algorihm is applied to compute the maximalscoring overlapping alignment between each pjlr of fragments. A novel feature of the program is that SeqEdilor implemnents interaclive operation with a graphical user interface. The performance lests of the prograln 011 fragmen1 data from 16s and 18s rDNA sequencing pi-ojects produced saiisIactory results. This program may be useful to a person who has work of time with large-scale DNA sequencing projects.

  • PDF

Design of Gene Alignment Program(FastA) Using Carpool and Grouping Schemes (카풀 및 그룹핑 기법을 이용한 유전자 서열 정렬 프로그램(FastA) 설계)

  • 이성준;김재훈;정진원;이원태
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04a
    • /
    • pp.124-126
    • /
    • 2003
  • 생물정보학에서 사용되는 많은 프로그램들은 데이터베이스로 부터 방대한 양의 데이터를 검색하고 처리한다. 이러한 환경에서 사용자의 요청마다 데이터베이스를 검색하는 경우 사용자들의 대기 시간이 길어지고 시스템 용량을 초과한다. 이러한 데이터베이스 액세스의 문제점을 해결하기 위하여 카플 기법과 그룹핑 기법이 제안되었다. 본 논문에서는 카플 기법과 그룹핑 기법을 이용하여 유전자 서열 비교 프로그램인 Fasta를 구현하였고 사용자 응답시간을 측정하여 프로그램의 성능을 높일 수 있음을 확인하였다.

  • PDF

Implementation and Performance Evaluation of Comparing MSMP with RIFLE Algorithm (MSMP 알고리즘과 RIFLE 알고리즘의 구현 및 성능비교 평가)

  • 김동희;원영상;고영웅;김진
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.304-306
    • /
    • 2004
  • 생물정보학에서 서열의 유사성을 예측하는 것은 가장 중요한 문제 중의 하나이다. 염기 서열의 유사성을 검색하는 유용한 검색도구들에는 BLAST와 FASTA 등이 있으며 이러한 도구들은 새로운 유기체에 대한 실제 염기 서열을 필요로 한다. 이 경우 서열을 얻기 위한 sequencing 작업이 필요로 하며 시간적인 면에 있어서 상당한 비용을 요구한다. 본 논문에서는 sequencing 작업을 하지 않고 간단한 실험에서 얻을 수 있는 부분적인 Sequence 정보만을 대상으로 데이터 베이스에서 검색을 할 수 있는 두 개의 RIFLE(Rapid Identification of Microorganisms by Fragment Length Evaluation), MSMP(Maximum Site Matching Problem) 알고리즘을 구현하고 실험을 통해 두 알고리즘을 비교 평가한다. 실험결과 RIFLE 알고리즘이 수행 속도 면에서 빠른 반면 MSMP가 산출한 결과에 비해서 신뢰성이 떨어짐을 확인하였다.

  • PDF

SSR-Primer Generator: A Tool for Finding Simple Sequence Repeats and Designing SSR-Primers

  • Hong, Chang-Pyo;Choi, Su-Ryun;Lim, Yong-Pyo
    • Genomics & Informatics
    • /
    • v.9 no.4
    • /
    • pp.189-193
    • /
    • 2011
  • Simple sequence repeats (SSRs) are ubiquitous short tandem duplications found within eukaryotic genomes. Their length variability and abundance throughout the genome has led them to be widely used as molecular markers for crop-breeding programs, facilitating the use of marker-assisted selection as well as estimation of genetic population structure. Here, we report a software application, "SSR-Primer Generator " for SSR discovery, SSR-primer design, and homology-based search of in silico amplicons from a DNA sequence dataset. On submission of multiple FASTA-format DNA sequences, those analyses are batch processed in a Java runtime environment (JRE) platform, in a pipeline, and the resulting data are visualized in HTML tabular format. This application will be a useful tool for reducing the time and costs associated with the development and application of SSR markers.

Experiment and Performance Evaluation of RIFLE Algorithm (RIFLE 알고리즘에 대한 실험 및 성능평가)

  • Kim Dong-Hoi;Won Young-Sang;Ko Young-woong;Kim Jin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.11a
    • /
    • pp.697-700
    • /
    • 2004
  • 서열의 유사성 검색에 잘 알려진 도구로는 BLAST 와 FASTA 가 있으며 이들 알고리즘은 알려지지 않은 유기체를 sequencing 작업을 통하여 얻어진 염기서열과 유전자 데이터베이스를 대상으로 유사성을 검색한다. 이때 서열의 유사성을 검색하기에 앞서 선행 되어야만 하는 sequencing작업은 시간적인 면에서 상당한 비용을 요구한다. 반면 sequencing 작업을 하기 않고도 간단한 실험에 의해 얻을 수 있는 부분적인 서열정보만을 대상으로 데이터베이스에서 검색 할 수 있는 알고리즘으로 RIFLE가 있다. 본 논문에서는 RIFLE 알고리즘을 구현하고 실험데이터를 생성하여 성능에 대한 분석 평가를 하고자 한다. 성능평가 결과 RIFLE 알고리즘은 시간복잡도 $O(n^2)$으로 빠른 반면 일부 서열에 있어서 실제 유사도에 비해 정확도가 낮게 평가되는 결과가 산출되었다.

  • PDF

A Simple GUI-based Sequencing Format Conversion Tool for the Three NGS Platforms

  • Rhie, A-Rang;Yang, San-Duk;Lee, Kyung-Eun;Thong, Chin Ting;Park, Hyun-Seok
    • Genomics & Informatics
    • /
    • v.8 no.2
    • /
    • pp.97-99
    • /
    • 2010
  • To allow for a quick conversion of the proprietary sequence data from various sequencing platforms, sequence format conversion toolkits are required that can be easily integrated into workflow systems. In this respect, a format conversion tool, as well as quality conversion tool would be the minimum requirements to integrate reads from different platforms. We have developed the Pyrus NGS Sequencing Format Converter, a simple software toolkit which allows to convert three kinds of Next Generation Sequencing reads, into commonly used fasta or fastq formats. The converter modules are all implemented, uniformly, in Java GUI modules that can be integrated in software applications for displaying the data content in the same format.

Analysis of sequence alignment Tools on polymorphic genomes (다염기변이 유전체에 대한 서열 정렬 툴 분석)

  • Kim, Yoo-Sun;Kim, Jong-Hyun;Yeo, Yun-Ku;Kim, Woo-Cheol;Park, Sang-Hyun
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06c
    • /
    • pp.217-221
    • /
    • 2008
  • 생명공학 기술의 발달로 지놈 프로젝트를 통해 인간 초파리 등 여러 종의 유전체 정보가 밝혀 졌다. 그러나 Post-Genome 연구에 있어서 매우 중요한 생물체인 멍게(Ciona intestinalis)와 성게(Strongylocentrotus purpuratus)의 유전체 서열은 현재 공개되어 있으나 염기서열의 연속성(continuity)에는 심각한 문제점이 존재하고 있다. 이들은 염기서열에 변이가 많은 다염기변이 유전체(polymorphic genomes)로 그 특성이 반영되지 않은 전통적인 Whole Genome Shotgun Sequencing(WGSS)방법을 사용였기 때문이다. 이와 같은 다염기변이 유전체 서열 분석은 시스템 생물학이나 비교 유전체학 등의 후발 연구에 기초가 되므로 매우 중요하다. 본 논문에서는 다염기변이 유전체에 대해 알아보고 서열 조립 알고리즘의 기본이 되는 서열 정렬 툴들 중 가장 많이 사용되는 FASTA, BLAST, BLAT에 대해 분석하여 봄으로써 다염기변이 유전체에 적합한 서열 조립 전략 수립을 위해 고려해야 하는 사항들을 논의해 본다.

  • PDF

MiRPI: Portable Software to Identify Conserved miRNAs, Targets and to Calculate Precursor Statistics

  • Vignesh, Dhandapani;Parameswari, Paul;Im, Su-Bin;Kim, Hae-Jin;Lim, Yong-Pyo
    • Genomics & Informatics
    • /
    • v.9 no.1
    • /
    • pp.39-43
    • /
    • 2011
  • MicroRNAs (miRNAs) are recently discovered small RNA molecules usually resulting in translational repression and gene silencing. Despite the fact that specific cloning of small RNA's is a method in practice, computational identification of miRNA's has been a major focus recent days, since is a rapid process following AB initio and sequence alignment methods. Here we developed new software called MiRPI that aims to identify the highly conserved miRNAs without any mismatches from given fasta formatted gene sequences by using non-repeated miRNA dataset of the user's interest. The new window embedded with the software is used to identify the targets for inputted mature miRNAs in the mRNA sequences. Also MiRPI is designed to measure the precursor miRNA statistics, majorly focusing the Adjusted Minimum Folding free Energy (AMFE) and Minimum Folding free Energy Index (MFEI), the most important parameters in miRNA confirmation. MiRPI is developed by PERL (Practical Extraction and Report Language) and Tk (Tool kit widgets) scripting languages. It is user friendly, portable offline software that works in all windows OS, sized to 3 MB.