A Visualization and Inference System for Protein-Protein Interaction

단백질 상호작용 추론 및 가시화 시스템

  • 이미경 (상명대학교 공학기술연구소) ;
  • 김기봉 (상명대학교 생명정보공학과)
  • Published : 2004.12.01

Abstract

As various genome projects have produced enormous amount of biosequence data, functional sequence analysis in terms of tile nucleic acid and protein becomes very significant. In functional genomics and proteomics, the functional analysis of each individual gene and protein remains a big challenge. Contrary to traditional studies, which regard proteins as not components of a whole protein interaction network but individual entities, recent studies have focused on examining functions and roles of each individual gene and protein in view of a whole life system. In this regard, it has been recognized as an appropriate method to analyze protein function on the basis of synthetic information of its interaction and domain modularity. In this context, this paper introduces the PIVS (Protein-protein interaction Inference & Visualization System), which predicts the interaction relationship of input proteins by taking advantage of information on homology degree, domain modules which input sequences contain, and protein interaction relationship. The information on domain modules can increase the accuracy of the function and interaction relationship analysis in terms of the specificity and sensitivity.

다양한 유전체 프로젝트로 말미암아 엄청난 서열 데이타들이 쏟아지고, 이에 따라 핵산 및 단백질 수준의 서열 데이타 분석이 매우 중요하게 인식되고 있다. 특히 최근에는 단백질이 단순하게 개별적인 기능을 가진 독립적인 요소가 아닌 전체 단백질 상호작용 네트워크 상에서 다른 객체들과 유기적인 관계를 갖으며 나름대로의 중요한 역할을 수행하고 있다는 점에 초점을 맞추어 연구가 진행되고 있다. 특히 단백질 상호작용 관계 분석을 위해서는 실제로 상호작용이 일어나는 도메인 모듈 정보가 아주 중요하게 작용하는데, 본 논문에서는 이러한 점을 고려하여 우리가 개발한 단백질 기능 및 상호작용 분석을 위한 PIVS(Protein-protein interaction Inference and Visualization System)에 대해 소개하고 있다 PIVS는 기존의 단백질 상호작용 데이타베이스들을 합쳐서 통합 데이타베이스를 생성하고, 다양한 전처리 과정으로 통합 데이타베이스 서열의 기능 및 주석 정보를 추출하여 로컬 데이타베이스화 하였다. 그리고 특히 단백질 상호작용 관계 분석을 위해 중요하게 작용하는 도메인 모듈 정보들을 추출하여 로컬 데이터베이스를 구축하였고, 기존의 단백질 상호작용 관계 데이타를 이용하석 도메인 사이의 상호작용 관계 정보도 수집하여 분석하였다. PIVS는 단백질의 종합적인 분석 정보, 즉, 기능 및 주석, 도메인, 상호작용 관계 정보 등을 손쉽고 편리하게 얻고자 하는 사용자에게 매우 유용하게 사용될 수 있을 것이다.

Keywords

References

  1. Valencia, A. and Pazos, F., 'Computational methods for the prediction of protein interactions,' Current Opinion in Structural Biology, Vol. 12, pp. 368-373, 2002 https://doi.org/10.1016/S0959-440X(02)00333-0
  2. J. R. Bock and D. A. Gough, Prediction of protein-protein interaction from primary structure, Bioinformatics, 17, 455-460, 2001 https://doi.org/10.1093/bioinformatics/17.5.455
  3. Wojcik, J. and Schachter, V., 'Protein-protein interaction map inference using interacting domain profile pairs,' Bioinformatics, Vol. 17, pp. S296-305, 2001
  4. Oyama, T., Kitano, K., et al., 'Extraction of knowledge on protein-protein interaction by association rule discovery,' Bioinformatics, Vol. 18, No. 5, pp. 705-714, 2002 https://doi.org/10.1093/bioinformatics/18.5.705
  5. Mrowka, R., 'Java applet for visualizing protein-protein interaction,' Bioinformatics, Vol. 17, No. 7, pp. 669-670, 2001 https://doi.org/10.1093/bioinformatics/17.7.669
  6. Kim, W. K., Park, J., and Suh, J. K., 'Large Scale statistical prediction of protein-protein interaction by Potentially Interacting Domain(PID) pair,' Genome Informatics, Vol. 13, pp. 42-50, 2002
  7. Xenarios, L., Salwinsk, L., et al., 'DIP, the Database of Interacting Proteins: a research tool for studying cellular networks of protein interactions,' Nucleic Acids Research, Vol. 30, No. 1, pp. 303-305, 2002 https://doi.org/10.1093/nar/30.1.303
  8. Bader, G.D., Donaldson, L., et al., 'BIND : the Biomolecular Interaction Network Database,' Nucleic Acids Research, Vol. 31, No. 1, pp. 248-250, 2003 https://doi.org/10.1093/nar/gkg056
  9. Breitkreutz, B.J., Stark, C., et al., 'The GRID : The General Repository for Interaction Datasets,' Genome Biology, Vol. 4, R23, 2003
  10. Ng, S.K., Zhang, Z., Tan, S.H., and Lin, K., 'InterDom: a database of putative interacting protein domains for validating predicted protein interactions and complexes,' Nucleic Acids Research, Vol. 31, No. 1, pp. 251-254, 2003 https://doi.org/10.1093/nar/gkg079
  11. Mulder, N.J., Apweiler, R., et al., 'The InterPro Database, 2003 brings increased coverage and new features,' Nucleic Acids Research, Vol. 31, No. 1, pp. 315-318, 2003 https://doi.org/10.1093/nar/gkg046
  12. Tatusov, R.L., Natale, D.A., et al., 'The COG database: new developments in phylogenetic classification of proteins from complete genomes,' Nucleic Acids Research, Vol. 29, pp. 22-28, 2001 https://doi.org/10.1093/nar/29.1.22
  13. Gene Ontology Consortium, 'The Gene Ontology (GO) database and informatics resource,' Nucleic Acids Research, Vol. 32, pp. D258-D261, 2004 https://doi.org/10.1093/nar/gkh036
  14. Altschul, S.F., Gish, W., et al., 'Basic local alignment search tool', J. Mol. Biol., Vol. 215, pp. 403-410, 1990
  15. Zdobnov, E. M. and Apweiler, R., 'InterProScan - an integration platform for the signature- recognition methods in InterPro,' Bioinformatics, Vol. 7, pp. 847-848, 2001 https://doi.org/10.1093/bioinformatics/17.9.847
  16. Visualization of Compiler Graphs - http://rw4.cs.uni-sb.de/users/sander/html/gsvcg1.html