The Brassica rapa Tissue-specific EST Database

배추의 조직 특이적 발현유전자 데이터베이스

  • Yu, Hee-Ju (Department of Life Sciences, The Catholic University of Korea) ;
  • Park, Sin-Gi (Department of Agricultural Biotechnology, National Academy of Agricultural Science, Rural Development Administration) ;
  • Oh, Mi-Jin (Department of Agricultural Biotechnology, National Academy of Agricultural Science, Rural Development Administration) ;
  • Hwang, Hyun-Ju (Department of Agricultural Biotechnology, National Academy of Agricultural Science, Rural Development Administration) ;
  • Kim, Nam-Shin (Korean Bioinformation Center, Korea Research Institute of Bioscience and Biotechnology) ;
  • Chung, Hee (Department of Life Sciences, The Catholic University of Korea) ;
  • Sohn, Seong-Han (Department of Agricultural Biotechnology, National Academy of Agricultural Science, Rural Development Administration) ;
  • Park, Beom-Seok (Department of Agricultural Biotechnology, National Academy of Agricultural Science, Rural Development Administration) ;
  • Mun, Jeong-Hwan (Department of Agricultural Biotechnology, National Academy of Agricultural Science, Rural Development Administration)
  • 유희주 (가톨릭대학교 생명과학과) ;
  • 박신기 (국립농업과학원 유전자분석개발과) ;
  • 오미진 (국립농업과학원 유전자분석개발과) ;
  • 황현주 (국립농업과학원 유전자분석개발과) ;
  • 김남신 (한국생명공학연구원 국가생명연구자원정보센터) ;
  • 정희 (가톨릭대학교 생명과학과) ;
  • 손성한 (국립농업과학원 유전자분석개발과) ;
  • 박범석 (국립농업과학원 유전자분석개발과) ;
  • 문정환 (국립농업과학원 유전자분석개발과)
  • Received : 2011.10.14
  • Accepted : 2011.11.04
  • Published : 2011.12.31

Abstract

Brassica rapa is an A genome model species for Brassica crop genetics, genomics, and breeding. With the completion of sequencing the B. rapa genome, functional analysis of the genome is forthcoming issue. The expressed sequence tags are fundamental resources supporting annotation and functional analysis of the genome including identification of tissue-specific genes and promoters. As of July 2011, 147,217 ESTs from 39 cDNA libraries of B. rapa are reported in the public database. However, little information can be retrieved from the sequences due to lack of organized databases. To leverage the sequence information and to maximize the use of publicly-available EST collections, the Brassica rapa tissue-specific EST database (BrTED) is developed. BrTED includes sequence information of 23,962 unigenes assembled by StackPack program. The unigene set is used as a query unit for various analyses such as BLAST against TAIR gene model, functional annotation using MIPS and UniProt, gene ontology analysis, and prediction of tissue-specific unigene sets based on statistics test. The database is composed of two main units, EST sequence processing and information retrieving unit and tissue-specific expression profile analysis unit. Information and data in both units are tightly inter-connected to each other using a web based browsing system. RT-PCR evaluation of 29 selected unigene sets successfully amplified amplicons from the target tissues of B. rapa. BrTED provided here allows the user to identify and analyze the expression of genes of interest and aid efforts to interpret the B. rapa genome through functional genomics. In addition, it can be used as a public resource in providing reference information to study the genus Brassica and other closely related crop crucifer plants.

배추는 배추속 식물의 A genome을 대표하는 모델로서 다양한 배추과 작물의 유전학 및 유전체학과 육종연구의 기반이 되는 중요한 작물이다. 최근 들어 배추 유전체 해독이 완료됨에 따라 유전체의 기능 연구가 보다 활발히 진행될 것으로 기대된다. 유전체 정보로부터 유전자의 구조를 예측하고, 기능을 분석하여 프로모터를 포함한 유용 유전자를 개발하기 위한 필수 재료로 이용되는 것이 다양한 조직 또는 실험 처리로부터 생성된 발현 유전자 데이터이다. 2011년 7월 현재 공공 데이터베이스에는 39개의 cDNA library로부터 분석된 147,217개의 배추 발현유전자가 보고되어 있다. 그러나 이들 발현 유전자들은 체계적으로 분석되거나 데이터베이스 형태로 정리되어 있지 않기 때문에 연구자들이 유전자 서열로부터 유용한 정보를 추출하여 사용하기 어려운 문제점이 있다. 따라서 해독 완료된 배추 유전체와 함께 발현 유전자 정보를 보다 잘 활용하기 위하여 배추의 조직 특이적 발현유전자 데이터베이스인 BrTED를 개발하였다. 데이터베이스는 EST 서열 처리-정보 검색 단위와 조직특이성 발현 특성 분석 단위로 이루어져 있으며, 각 정보들은 상호 연결되어 유기적인 검색 환경을 제공하게 하였다. BrTED는 23,962개의 단일 조합 유전자서열을 포함하고 있으며, 각 서열들의 유전자 주석과 암호화하고 있는 단백질의 기능을 동시에 제공한다. 또한 각 단일 조합 유전자서열들의 조직별 발현 특이성을 통계 분석을 통해 조사하여 연구자의 검색 기준에 따라 제공한다. BrTED의 실효성을 검증하기 위하여 데이터베이스를 통해 조직 특이적 발현 유전자 29개를 선발하고, 이들의 발현 특성을 RT-PCR로 확인한 결과, 선발한 유전자 모두 목표한 조직에서 특이적이거나 강한 발현을 보였다. BrTED는 조직 특이적 발현유전자를 신속하게 선발할 수 있는 공공 데이터베이스로서 배추의 기능 유전체 연구뿐만 아니라 근연 배추속 작물의 유전학과 유전체학 연구에 유용한 공공 연구 자원으로 이용될 수 있을 것이다.

Keywords

References

  1. Altschul, S.F., W. Gish, W. Miller, E.W. Myers, and D.J. Lipman. 1990. Basic local alignment search tool. J. Mol. Biol. 215:403-410.
  2. Audic, S. and J.M. Claverie. 1997. The significance of digital gene expression profiles. Genome Res. 7:986-995.
  3. Carbon, S., A. Ireland, C.J. Mungall, S. Shu, B. Marshall, S. Lewis, AmiGO Hub, and Web Presence Working Group. 2009. AmiGO: online access to ontology and annotation data. Bioinformatics 25:288-289. https://doi.org/10.1093/bioinformatics/btn615
  4. Chung, H., J.H. Mun, S.C. Lee, and H.J. Yu. 2011. Pickprimer: A graphic user interface program for primer design on the gene target region. Kor. J. Hort. Sci. Technol. 29:461-466.
  5. George, R.A. 2001. StackPACK clustering system. Brief. Bioinfomatics 2:388-404. https://doi.org/10.1093/bib/2.4.388
  6. Mun, J.H., S.J. Kwon, T.J. Yang, Y.J. Seol, M. Jin, J.A. Kim, M.H. Lim, J.S. Kim, S. Baek, B.S. Choi, H.J. Yu, D.S. Kim, N. Kim, K.B. Lim, S.I. Lee, J.H. Hahn, Y.P. Lim, I. Bancroft, and B.S. Park. 2009. Genome-wide comparative analysis of the Brassica rapa gene space reveals genome shrinkage and differential loss of duplicated genes after whole genome triplication. Genome Biol. 10:R111. https://doi.org/10.1186/gb-2009-10-10-r111
  7. Mun, J.H., S.J. Kwon, and B.S. Park. 2010. The strategy and current status of Brassica rapa genome project. J. Plant Biotechnol. 37:153-165. https://doi.org/10.5010/JPB.2010.37.2.153
  8. Ruepp, A., A. Zollner, D. Maier, K. Albermann, J. Hani, M. Mokrejs, I. Tetko, U. Güldener, G. Mannhaupt, M. Münsterkötter, and H.W. Mewes. 2004. The FunCat, a functional annotation scheme for systematic classification of proteins from whole genomes. Nucleic Acids Res. 32:5539-5545. https://doi.org/10.1093/nar/gkh894
  9. Scheer, M., A. Grote, A. Chang, I. Schomburg, C. Munaretto, M. Rother, C. Söhngen, M. Stelzer, J. Thiele, and D. Schomburg. 2011. BRENDA, the enzyme information system in 2011. Nucleic Acid Res. 39:670-676l. https://doi.org/10.1093/nar/gkq1089
  10. The Brassica rapa Genome Sequencing Project Consortium. 2011. The genome of the mesopolyploid crop species Brassica rapa. Nat. Genet. 43:1035-1039. https://doi.org/10.1038/ng.919
  11. UniProt Consortium. 2009. The Universal Protein Resource (UniProt) 2009. Nucleic Acids Res. 37:D169-174. https://doi.org/10.1093/nar/gkn664