• Title/Summary/Keyword: 서열검색

Search Result 173, Processing Time 0.025 seconds

System Design for Building Sequence Information Analysis Databases using Ontology (온톨로지를 이용한 서열정보분석 데이터베이스 구축 시스템 설계)

  • Lee, Sun-A;Jun, Joong-nam;Lee, Keon-Myung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11a
    • /
    • pp.385-388
    • /
    • 2002
  • 인터넷과 첨단 기술의 발달로 생물학적 정보에 대한 온라인 데이터베이스들이 급증하고 있으나, 데이터가 방대하고 형식이 다양하여 생물학자들이 정보를 얻는데 많은 어려움이 있다. 본 논문에서는 단백질과 핵산 정보를 제공하는 NCBI에서, 사용자가 질의에 따른 웹 문서로부터 정보를 추출하여 사용자의 특성에 따른 데이터베이스를 구축, 관리하여 주는 시스템을 제안한다. 온톨로지를 이용하여 질의의 모호성을 보완한다. 웹 문서로부터 추출된 데이터를 저장하는 단계에서도 데이터의 특징, 사용빈도에 따라 테이블을 분류하여 관리함으로써 검색과 관리의 효율성을 높인다. 본 논문은 서열정보 분석을 하는 생물학 연구자들에게 데이터베이스를 쉽게 구축하고 서열정보를 분석하기 좋은 인터페이스를 제공하는 것을 목적으로 한다.

  • PDF

Prediction of transcription factor binding sites by extracting common sequences (공통서열 추출을 통한 전사인자 결합부위 예측)

  • 임명은;심정섭;정명근;박선희
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.820-822
    • /
    • 2003
  • 접미사 배열이나 접미사 트리는 대용량의 서열데이터를 효율적으로 검색, 저장할 수 있는 인덱스 자료구조로서 바이오인포매틱스와 같이 대용량 데이터의 처리. 분석이 필요한 분야에 이용될 수 있다. 최근 들어 접미사 배열에 대한 연구가 활발히 진행되어 접미사 배열의 효율적인 저장, 선형시간 생성 및 선형시간 탐색 알고리즘들이 개발되었다. 본 논문에서는 같은 전사인자가 결합할 것으로 예상되는 여러 개의 전사조절부위에 대한 DNA 서열들이 입력으로 주어졌을 때 전사인자가 결합하는 부위를 예측하는 방법을 제시한다. 이를 위해 최근에 제시된 선형시간 접미사 배열 생성 알고리즘을 이용하고 TRANSFAC과 EMBL 등의 DB를 이용하여 실험을 통해 본 논문에서 제시하는 방법의 정확도를 평가한다.

  • PDF

Gene Sequence Analysis and Management System based on web (웹 기반의 유전자 서열 분석 및 관리 시스템)

  • Heo, Jin-Seok;Kim, Hyun-Sik;Ye, Hyung-Seok;Jin, Hoon;Kim, In-Chul
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.166-168
    • /
    • 2002
  • 본 논문에서는 하나의 시스템 안에서 효율적인 유전자 데이터의 관리와 다양한 서열 분석작업이 가능한 왱 기반의 서열 분석 및 관리 시스템인 GWB(Gene Workbench)를 설계하고 구현하였다. GWB는 로컬 데이터베이스 관리뿐만 아니라 GenBank, EMBL, SWISSPROT와 같은 외부 공공 데이터베이스에 대한 접근 기능도 제공하며, 권한을 가진 내부 이용자와 그렇지 못한 외부 이용자들을 구분하여 일부 유용한 기능들은 외부 사용자들도 이용할 수 있도록 설계되었다. 또 GWB는 유전자에 관한 문헌정보 검색과 관련 유전자 탐색 기능 둥 일부 유전자 기능 연구를 지원하는 기능을 제공하고 있다.

  • PDF

Implementation of integrated motif database and Design of meta engine (모티프 자원 통합 데이터베이스 구축 및 메타엔진 설계)

  • Lee, Bum-Ju;Choi, Eun-Sun;Ryu, Keun-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11c
    • /
    • pp.1887-1890
    • /
    • 2002
  • 새롭게 발견되는 단백질의 구조와 기능 예측에 사용되는 모티프는 단백질 원시 데이터가 빠르게 증가함에 따라 그 중요성 역시 나날이 증가하고 있으며 이러한 모티프에 대한 다양한 서열 메소드들과 데이터베이스들이 개발되었다. 그러나, 이러한 모티프 데이터베이스들은 각각 이질적인 데이터 구조를 지니고 독자적으로 개발, 개발되어 왔기 때문에 서로 다른 형태의 검색 결과를 제공한다. 따라서 사용자는 각 데이터베이스에서 사용하는 데이터 구조들에 대한 전반적인 지식을 습득해야 하며 모티프 데이터베이스들 각각에 대해 중복된 반복 검색 작업들을 수행하여야 한다. 따라서 이 논문에서는 이러한 문제 해결을 위해, 각각의 모티프 데이터베이스들에서 제공하는 자원을 분해하고, 합병하는 과정을 거쳐 하나의 통합된 모티프 데이터베이스를 구축하였고, 기존의 데이터베이스에서 지원하지 못했던 단백질 3차 구조정보, 분류 정보의 지원을 가능케 하였고, 각 멤버 데이터베이스 검색 메소드의 장점을 그대로 적용할 수 있는 메타 엔진을 설계하여 사용자 편의적 검색 환경을 제공한다.

  • PDF

Searching Method for New Small RNA in Bacillus subtilis Using Bioinformation (생물정보를 이용하여 바실러스 서브틸리스에서 새로운 Small RNA를 예측하는 방법)

  • Lee, Sang-Soo
    • The Journal of Natural Sciences
    • /
    • v.18 no.1
    • /
    • pp.47-53
    • /
    • 2007
  • In order to find novel sRNA in Bacillus subtilis which would be used to adapt to several conditions, we searched the whole genome of Bacillus subtilis using the following procedure. At first, the locations of recognition sequence of transcription factors such as PerR, OhrR, Fur and Zur were searched in the intergenic region of Bacillus subtilis genome and the locations of rho independent transcription terminator sites were also determined. Based on the information of these locations, the sRNA candidates were chosen by close locations (less than 300 bp) between the recognition site of transcription factors and rho independent transcription terminator site. Than transcription promoter sites were searched in the region of previously identified sRNA candidates and 5 PerR, 1 OhrR, 1 Fur and 1 Zur regulated good sRNA candidates were found.

  • PDF

Unification System for Analysis of DNA Sequence (DNA 서열 분석을 위한 통합 시스템)

  • Song, Young-Ohk;Chang, Duk-Jin
    • The Journal of the Korea Contents Association
    • /
    • v.11 no.3
    • /
    • pp.65-72
    • /
    • 2011
  • We stand at real world that some practical use method of gene information appears in succession by entrance on the stage of advanced techonlogy. As a lot of studies and development are achieved based on analysis of bio data, necessity of a tool that can help correct interpretation of data is required more and more in a lot of targets of bioinformatics to search new relation and information are established. In this paper, we are offered in existing I wish to offer user a more convenient study tool developing system that can supplement shortcomings of various tools for data analysis. So we've designed to offer in united environment that is not environment that is parted ORF driving out, bio information retrieval and work of similarity comparison lamp to work for bio data analysis and offers lacking consecutiveness in existing analysis system.

SNP Analysis Method for Next-generation Sequencing Data (차세대 시퀀싱 데이터를 위한 SNP 분석 방법)

  • Hong, Sang-kyoon;Lee, Deok-hae;Kong, Jin-hwa;Kim, Deok-Keun;Hong, Dong-wan;Yoon, Jee-hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.95-98
    • /
    • 2010
  • 최근 차세대 시퀀싱 기술의 급속한 발전에 따라 서열 정보의 해독이 비교적 쉬워지면서 개인별 맞춤의학의 실현에 대한 기대와 관심이 높아지고 있다. 각 개인의 서열 정보 사이에는 SNP (single nucleotide polymorphism), Indel, CNV (copy number variation) 등의 다양한 유전적 구조 변이가 존재하며, 이러한 서열 정보의 부분적 차이는 각 개인의 유전적 특성 및 질병 감수성 등과 밀접한 관련을 갖는다. 본 연구에서는 차세대 시퀀싱 결과로 산출되는 수많은 짧은 DNA 서열 조각인 리드 데이터를 이용한 SNP 추출 알고리즘을 제안한다. 제안된 알고리즘에서는 레퍼런스 시퀀스의 각 위치에 대한 리드 시퀀스의 매핑 정보를 기반으로 SNP 후보 영역을 추출하며, 품질 정보 등을 활용하여 에러 발생률을 최소화한다. 또한 대규모 시퀀싱 데이터와 SNP 구조 변이 데이터의 효율적인 저장/검색을 지원하는 시각적 분석 도구를 구현하여 제안된 방식의 유용성을 검증한다.

Identification of Metarhizium sp. Isolated from Protaetia brevitarsis seulensis (Kolbe) Using Ribosomal DNA Sequence (흰점박이꽃무지로부터 Metarhizium속 사상균의 분리 및 ribosomal DNA 염기서열에 의한 동정)

  • 최지영;김철학;제연호;최영철;김종길;박규택;김근영
    • Korean journal of applied entomology
    • /
    • v.42 no.1
    • /
    • pp.65-70
    • /
    • 2003
  • For the purpose of the protection of beneficial insects from pathogens and the development of control agent against pests, a strain of Metarhizium sp. was isolated from the infected Protaetia brevitarsis seulensis larvae in Korea. Under the scanning electron microscope, the isolate, Metarhizium sp. KMA-1, showed distinct formation of conidia on the palisade-like masse which were comprised of elongate chains and this shape is a typical feature of Metarhizium species. PCR techniques were used to identify the isolate and the primers used were designed on the basis of two kinds of rRNAs sequences, 28S rRNA and internal transcribed spacer(ITS). The specific PCR products from each primer set were amplified and the DNA sequences were determined for the similarity comparison. Sequence alignment of these fragments using GenBank database resulted in the highest homology similarity between the isolate Metarhizium sp. KMA-1 and M. anisopliae. From these results, the isolate Metarhizium sp. KMA-1 in this study was identified as M. anisopliae.

Diversity Census of Fungi in the Ruminal Microbiome: A meta-analysis (반추위 곰팡이 다양성 조사 : 메타분석)

  • Song, Jaeyong;Jeong, Jin Young;Kim, Minseok
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.18 no.12
    • /
    • pp.466-472
    • /
    • 2017
  • This study was designed to examine the diversity census of fungi in rumen microbiome via meta-analysis of fungal 28S rDNA sequences. Both terms, "rumen" and "ruminal," were searched to retrieve the sequences of rumen fungi. As of September 2016, these sequences (n=165) of ruminal origin were retrieved from the Ribosomal Database Project (RDP; http://rdp.cme.msu.edu), an archive of all 28S rDNA sequences and were assigned to the phyla Ascomycota, Neocallimastigomycota, and Basidiomycota, which accounted for 109, 48, and 8 of the 165 sequences, respectively. Ascomycota sequences were assigned to the genera Pseudonectria, Magnaporthe, Alternaria, Cochliobolus, Cladosporium, and Davidiella, including fungal plant pathogens or mycotoxigenic species. Moreover, Basidiomycota sequences were assigned to the genera Thanatephorus and Cryptococcus, including fungal plant pathogens. Furthermore, Neocallimastigomycota sequences were assigned to the genera Cyllamyces, Neocallimastix, Anaeromyces, Caecomyces, Orpinomyces, and Piromyces, which may degrade the major structural carbohydrates of the ingested plant material. This study provided a collective view of the rumen fungal diversity using a meta-analysis of 28S rDNA sequences. The present results will provide a direction for further studies on ruminal fungi and be applicable to the development of new analytic tools.

Sequencing analysis of the OFC1 gene on the nonsyndromic cleft lip and palate patient in Korean (한국인 비증후군성 구순구개열 환자의 OFC1 유전자의 서열 분석)

  • Kim, Sung-Sik;Son, Woo-Sung
    • The korean journal of orthodontics
    • /
    • v.33 no.3 s.98
    • /
    • pp.185-197
    • /
    • 2003
  • This study was performed to identify the characteristics of the OFC1 gene (locus: chromosome 6p24.3) in Korean patients, which is assumed to be the major gene behind the nonsyndromic cleft lip and palate. The sample consisted of 80 subjects: 40 nonsyndromic cleft lip and palate patients (proband, 20 males and females, mean age 14.2 years); and 40 normal adults (20 males and 20 females, mean age 25.6 years). Using PCR-based assay, the OFC1 gene was amplified, sequenced, and then searched for similar protein structures. Results were as follows: 1. The OFC1 gene contains the microsatellite marker 'CA' repeats. The number of the reference 'CA' repeats was 21 times, and formed as TA(CA)11TA(CA)10. But, in Koreans, the number of tandem 'CA' repeats was varied from 17 to 26 except 18, and 'CA' repeats consisted of TA(CA)n. 2. Nine allelic variants were found. Distribution of the OFC1 allele was similar between the patients and control group. 3. There was a replacement of the base 'T' to 'C' after 11 tandem 'CA' repeats in Koreans compared with Weissenbach's report. However, the difference did not seem to be the ORF prediction results between Koreans and Weissenbach's report. 4. The BLAST search results showed the Telomerase reverse transcriptase (TERT) and the Nucleotide binding protein 2 (NBP2) as similar proteins. The TERT was a protein product by the hTERT gene in the locus 5p15.33 (NCBI Genome Annotation; NT023089) The NBP2 was a protein product by the ABCC3 (ATP-binding cassette, sub-family C) gene in the locus 17q22 (NCBI Genome Annotation; NT010783). 5. In the Pedant-Pro database analysis, the predictable protein structure of the OFC1 gene had at least one transmembrane region and one non-globular region.