• Title/Summary/Keyword: 서열검색

Search Result 173, Processing Time 0.027 seconds

Cloning and Heterologous Expression of Acetyl Xylan Esterase from Aspergillus ficuum

  • Jeong, Hye-Jong;Park, Seung-Mun;Yang, Mun-Sik;Kim, Dae-Hyeok
    • 한국생물공학회:학술대회논문집
    • /
    • 2000.04a
    • /
    • pp.153-156
    • /
    • 2000
  • Xylan, the major hemicellulose component of many plants, occurs naturally in a partially acetylated form and lignin, the most resistant component in plant cell wall degradation, is also attached to ${\beta}-1,4-linked-D-xylose$ backbone through the ester linkage. Esterases are required to release the esterified substituent and acetyl esterases are important in the complete degradation of acetylated polysaccharides, like pectins and xylans. The gene(Axe) encoding acetyl xylan estarase(AXE) was isolated from genomic ${\lambda}$ library from Aspergillus ficuum. Nucleotide sequencing of the Axe gene indicated that the gene was separated with two intervening sequences and the amino acid sequence comparison revealed that it was closely related to that from A. awamori with the 92 % indentity. Heterologous expression of AXE was conducted by using YEp352 and Saccharomyces cerevisae 2805 as a vector and host expression system, respectively. The Axe gene was placed between GAL1 promoter and GAL7 terminator and then this recombinant vector was used to transform S. cerevisiae 2805 strain. Culture filtrate of the transformed yeast was assayed for the presence of AXE activity by spectrophotometry and, comparing with the host strain, four to five times of enzyme activity was detected in culture filtrate of transformed yeast.

  • PDF

Design and Implementation of DBMS-based Protein Identification System (DBMS 기반 단백질 식별 시스템의 설계 및 구현)

  • 이진관;오석준;최은선;류근호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10a
    • /
    • pp.67-69
    • /
    • 2001
  • Human Genome Project의 완성을 전후로 이루어진 생물학적 분석도구의 발달과 서열 데이터베이스의 축적으로 단백질 분석은 괄목할 만한 성장을 하였다. 단백질 분석에 사용되는 가장 중요한 단백질 식별(Identification)을 위한 도구들은 많이 개발되어 왔으나 기존의 도구들은 파일 기반으로 폭발적으로 증가하는 단백질 데이터를 효율적으로 관리하고 심험자들에게 빠르고 정확한 검색결과를 제공하는데 한계를 보여주고 있다. 우리는 SWISS-PROT flatfile을 분석하여 관계형 데이터베이스고 구축하고, 단백질 식별에서 가장 많이 사용하고 있는 ‘질량분석 후 데이터베이스 검색’방법을 사용하는 시스템을 DBMS 기반으로 설계하였으며, 다양한 실험조건과 절차에 의해 얻은 단백질 조각의 질량 값과 이론적인 계산에 의해 얻은 값을 비교하여 실험에 쓰인 단백질 조각과 일치하는 것을 단백질 데이터베이터베이스로부터 검색할 수 있는 도구를 설계하고 구현하였다.

  • PDF

Development of Workbench for Analysis and Visualization of Whole Genome Sequence (전유전체(Whole gerlome) 서열 분석과 가시화를 위한 워크벤치 개발)

  • Choe, Jeong-Hyeon;Jin, Hui-Jeong;Kim, Cheol-Min;Jang, Cheol-Hun;Jo, Hwan-Gyu
    • The KIPS Transactions:PartA
    • /
    • v.9A no.3
    • /
    • pp.387-398
    • /
    • 2002
  • As whole genome sequences of many organisms have been revealed by small-scale genome projects, the intensive research on individual genes and their functions has been performed. However on-memory algorithms are inefficient to analysis of whole genome sequences, since the size of individual whole genome is from several million base pairs to hundreds billion base pairs. In order to effectively manipulate the huge sequence data, it is necessary to use the indexed data structure for external memory. In this paper, we introduce a workbench system for analysis and visualization of whole genome sequence using string B-tree that is suitable for analysis of huge data. This system consists of two parts : analysis query part and visualization part. Query system supports various transactions such as sequence search, k-occurrence, and k-mer analysis. Visualization system helps biological scientist to easily understand whole structure and specificity by many kinds of visualization such as whole genome sequence, annotation, CGR (Chaos Game Representation), k-mer, and RWP (Random Walk Plot). One can find the relations among organisms, predict the genes in a genome, and research on the function of junk DNA using our workbench.

Improvement of protein identification performance by reinterpreting the precursor ion mass tolerance of mass spectrum (질량스펙트럼의 펩타이드 분자량 오차범위 재해석에 의한 단백질 동정의 성능 향상)

  • Gwon, Gyeong-Hun;Kim, Jin-Yeong;Park, Geon-Uk;Lee, Jeong-Hwa;Baek, Yung-Gi;Yu, Jong-Sin
    • Bioinformatics and Biosystems
    • /
    • v.1 no.2
    • /
    • pp.109-114
    • /
    • 2006
  • In proteomics research, proteins are digested into peptides by an enzyme and in mass spectrometer, these peptides break into fragment ions to generate tandem mass spectra. The tandem mass spectral data obtained from the mass spectrometer consists of the molecular weights of the precursor ion and fragment ions. The precursor ion mass of tandem mass spectrum is the first value that is fetched to sort the candidate peptides in the database search. We look far the peptide sequences whose molecular weight matches with precursor ion mass of the mass spectrum. Then, we choose one peptide sequence that shows the best match with fragment ions information. The precursor ion mass of the tandem mass spectrum is compared with that of the digested peptides of protein database within the mass tolerance that is assigned by users according to the mass spectrometer accuracy. In this study, we used reversed sequence database method to analyze the molecular weight distribution of precursor ions of the tandem mass spectra obtained by the FT LTQ mass spectrometer for human plasma sample. By reinterpreting the precursor ion mass distribution, we could compute the experimental accuracy and we suggested a method to improve the protein identification performance.

  • PDF

Polymorphism Analysis of the ND-4 Gene for the Origin Determination of Olive Flounder, Paralichthys olivaceus. (넙치의 원산지 판별을 위한 ND-4유전자의 다양성 분석)

  • 송인선;진덕희;최석정;이석근
    • Journal of Life Science
    • /
    • v.14 no.4
    • /
    • pp.627-635
    • /
    • 2004
  • In order to distinguish the genetic polymorphism among the olive flounder (Paralichthys olivaceus) obtained from East sea of Jumunjin, aquaculture of Tongyoung and Geoje, and East sea of North Korea, the ND-4 and cytochrome b genes of olive flounder were divided into 5 regions. Each region was analyzed by degenerating gel electrophoresis scanning (DGES), and by subsequent DNA sequencing. The DGES disclosed characteristic DNA polymorphisms in ND-4-2 and ND-4-3 regions of olive flounder, which were also confirmed by the DNA sequencing. The olive flounders obtained from the different marine areas showed DNA mutations in ND-4-2 region (G390A, C402T, and A411G; GenBank: AB028664), and also showed frequent DNA mutations in ND-4-3 region (C515G, C537T, C538T, A567G, G714A, C736T, G756A, A759T, T817C, and T829G), white the cytochrome b gene showed no DNA mutation both in the DGES and DNA sequencing. These data suggest that the ND-4-2 and ND-4-3 regions are candidate loci to distinguish the origin of olive flounder, and that the DGES used in this study provided fast and reliable informations for the genetic polymorphism.

Testis-specific transcripts in the chicken

  • Kim, Duk-Kyung
    • Proceedings of the Korea Society of Poultry Science Conference
    • /
    • 2005.11a
    • /
    • pp.53-59
    • /
    • 2005
  • Sequences of candidate chicken testis-specific genes were analyzed in order to develop a resource for functional genomic studies of the testis and male germ cells. Tentative consensus sequences (TCs) containing ESTs expressed in testis libraries only were selected from the TIGR Gallus gallus Gene Index, resulting in a total of 292 TCs. The transcriptional expression of these genes were evaluated in a variety of chicken tissues, including testis and ovary, Of the panel of 292 TCs, 110 were expressed in a testis-specific manner. The correlation between the number of ESTs assembled into each TC and the number of testis-specific TCs was not significant. Annotation of the TCs using the Gene Ontology database terms showed that the proportion of testis-specific TCs that were classified as having catalytic activity (within the Molecular Function branch) was larger than the proportion of total chicken TCs classified in the same way. Our results might facilitate the investigation of testis-specific genes and their functional analysis in the chicken as well as in other avian species.

  • PDF

A Base-Calling Error Detection Program for Use in Microbial Genome Projects (미생물 유전체 프로젝트 수행을 위한 Base-Calling 오류 감지 프로그램 및 알고리즘 개발)

  • Lee, Dae-Sang;Park, Kie-Jung
    • Korean Journal of Microbiology
    • /
    • v.43 no.4
    • /
    • pp.317-320
    • /
    • 2007
  • In this paper, we have developed base-calling error detection program and algorithm which show the list of the genes or sequences that are suspected to contain base-calling errors. Those programs detect dubious bases in a few aspects in the process of microbial genome project. The first module detects base-calling error from the Phrap file by using contig assembly information. The second module analyzes frame shift mutation if it is originated from real mutation or artifact. Finally, in the case that there is control microbial genome annotation information, the third module extracts and shows the candidate base-calling error list by comparative genome analysis method.

A Classification Method for Deformed Words Using Multiple Sequence Alignment (다중서열정렬을 이용한 변형단어집합의 분류 기법)

  • Kim, Sung-Hwan;Cho, Hwan-Gue
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06b
    • /
    • pp.264-266
    • /
    • 2012
  • 인터넷 상에서의 변형 단어들을 처리하는 문제는 정보 검색, 기계 번역, 웹 마이닝, 욕설 및 스팸 필터링과 같은 다양한 분야에서 사용될 수 있다. 특히 단어의 변형 추이를 파악하는 등 데이터 수집 및 분석을 위해서는 주어진 단어가 어떤 변형 단어의 집합으로 이루어진 부류에 포함되는지 여부를 파악해야 할 필요성이 있다. 본 논문에서는 같은 부류에 속한 변형 단어 집합에 대하여 다중 서열 정렬(multiple sequence alignment)을 수행함으로써 해당 집합을 하나의 대표 문자열로 취급하는 변환 기법을 제안하고, 이를 이용해 주어진 단어가 해당 부류에 속하는지 여부를 효과적으로 분류하는 기법을 소개한다. 실험결과 제안 기법의 분류 성능은 민감도 93.4% 수준에서 89.1%의 특이도를 보여 전수 비교를 통한 분류에 비하여 결코 성능은 하락하지 않으면서 분류 속도는 16.5배 향상되었음을 확인할 수 있었다.

Buliding Clustered EST database for In Silico Cloning (전산 클로닝을 위한 Clustered EST 데이터베이스 구축)

  • Lee, Jin-Kwan;Choi, Eun-Sun;Ryu, Keun-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.10a
    • /
    • pp.105-108
    • /
    • 2001
  • cDNA(complementary DNA)를 복제(cloneing)하여 염기 서열화 한 EST(Expressed Sequence Tag) 데이터는 여러 생물체들의 염기서열 정보들과 비교를 통해 유사점을 찾거나 기능적 부위 검색을 통해 유전자 기능을 추정한 수 있어 기능 유전체 연구에 많이 사용되고 있다. EST 데이터를 식물은 특정종(Species)별로, 동물의 경우 종의 조직별로 클러스터링 함으로써 아직 알려지지 않은 종의 유전자를 밝혀낼 수 있음은 물론 유전자의 발현에 따른 단백질의 기능도 알아낼 수 있다. 따라서 이 논문에서는 NCBI에서 flatfile 형태로 제공하는 EST 데이터를 분석하여 관계형 데이터베이스로 모델링하고 구축하였다. 또한 EST 데이터의 효율적인 사용을 위하여 데이터를 특정 종의 조직별로 클러스터링하여 제공하는 시스템을 설계하고 구현하였다.

  • PDF

Comparison of Linear Time Suffix Array Construction Algorithms (선형 시간 접미사 배열 생성 알고리즘들의 비교)

  • 이성림;박근수
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.496-498
    • /
    • 2003
  • 접미사 배열은 긴 문자열에 대해 효율적인 문자열 검색을 가능하게 하는 자료구조이다. 접미사 배열은 문자열의 접미사들의 사전식 정렬순서를 배열로 저장한다. 비슷한 효과를 가진 접미사 트리에 비해서 접미사 배열은 저장 공간을 적게 차지하기 때문에 생명정보과학의 염기 서열 등 큰 크기의 문자열의 처리에 더욱 유리하다. 본 논문에서는 2003년에 발표된 Ko-Aluru, K$\square$rkk$\square$inen-Sanders 및 기존의 Manber-Myers 등 세 개의 접미사 배열 생성 알고리즘들의 염기 서열 입력 자료에 대한 실행 시간 및 기억 장치 사용량을 실험을 통해 비교한다. 특히 Ko-Aluru와 K$\square$rkk$\square$inen-Sanders 알고리즘은 실행 시간 및 저장 공간의 이론적인 복잡도가 O(n)으로 동일하기 때문에 실험을 통해서 계산 복잡도에 숨어있는 상수를 비교한다. 실험 결과 K$\square$rkk$\square$inen-Sanders 알고리즘이 가장 효율적임을 보인다.

  • PDF