DOI QR코드

DOI QR Code

Fucntional Prediction Method for Proteins by using Modified Chi-square Measure

보완된 카이-제곱 기법을 이용한 단백질 기능 예측 기법

  • 강태호 (충북대학교 전기전자컴퓨터공학부) ;
  • 유재수 (충북대학교 전기전자컴퓨터공학부) ;
  • 김학용 (충북대학교 생명과학부)
  • Published : 2009.05.28

Abstract

Functional prediction of unannotated proteins is one of the most important tasks in yeast genomics. Analysis of a protein-protein interaction network leads to a better understanding of the functions of unannotated proteins. A number of researches have been performed for the functional prediction of unannotated proteins from a protein-protein interaction network. A chi-square method is one of the existing methods for the functional prediction of unannotated proteins from a protein-protein interaction network. But, the method does not consider the topology of network. In this paper, we propose a novel method that is able to predict specific molecular functions for unannotated proteins from a protein-protein interaction network. To do this, we investigated all protein interaction DBs of yeast in the public sites such as MIPS, DIP, and SGD. For the prediction of unannotated proteins, we employed a modified chi-square measure based on neighborhood counting and we assess the prediction accuracy of protein function from a protein-protein interaction network.

유전체 분석에서 중요한 부분 중 하나는 기능이 알려지지 않은 미지 단백질에 대한 기능 예측이다. 단백질-단백질 상호작용 네트워크를 분석하는 것은 미지 단백질에 대한 기능을 보다 쉽게 예측할 수 있게 한다. 단백질-단백질 상호작용 네트워크로부터 미지 단백질의 기능을 예측하기 위한 다양한 연구들이 시도되어 왔다. 카이-제곱(Chi-square) 방식은 단백질-단백질 상호작용 네트워크를 통해 기능을 예측하고자 하는 연구 중 대표적인 방식이다. 하지만 카이-제곱 방식은 네트워크의 토폴로지를 반영하지 않아 네트워크 크기에 따라 예측의 정확성이 떨어지는 문제점이 있다. 따라서 본 논문에서는 카이-제곱 방식을 보완하여 정확성을 높인 새로운 기능 예측 방법을 제안한다 이를 위해 MIPS, DIP 그리고 SGD와 같은 공개된 단백질 상호작용 데이터베이스들로부터 데이터를 수집하여 분석하였다. 그리고 제안된 방식의 우수성을 입증하기 위해 각 데이터베이스들에 대해 카이-제곱방식과 제안하는 보완된 카이-제곱(Modified Chi-square)방식으로 예측해보고 이들의 정확성을 평가하였다.

Keywords

References

  1. J. W. Ryu, "Prediction of Unannotated Proteins from Protein Interaction Network Filtered by Using Localization and Domains in Yeast," JKPS, Vol.51, No.5, 2007.
  2. P. Holme, M. Huss, and H. Jeong, "Subnetwork Hierarchies of Biochemical Pathways," Bioinformatics, Vol.19, No.4, 2003.
  3. X. He and J. Zhang, "Why Do Hubs Tend to Be Essential in Protein Networks?", PLoS Genetics, Vol.2, No.6, 2006.
  4. R. Aragues, A. Sali, J. Bonet, M. A. Marti-Renom, and B. Oliva, "Characterization of Protein Hubs by Inferring Interacting Motifs from Protein Interactions," PLoS Comput. Biol., Vol.3 No.9, 2007.
  5. P. Uetz, "A Comprehensive Analysis of Protein-protein Interactions in Saccharomyces Cerevisiae". Nature Vol. 403, pp. 623-627, 2001. https://doi.org/10.1038/35001009
  6. http://mips.gsf.de/
  7. http://dip.doe-mbi.ucla.edu/
  8. http://www.yeastgenome.org/
  9. T. R. Hazbun and S. fields. "Networking Proteins in Yeast", Proc. Natl. Acad. Sci. USA, 2001.
  10. H. Y. Kim, H. Y. Kang, J. W. Ryu, C. N. Yoon, S. K. Han, "Phase Specific Activated Modules from a Protein Interaction Network of Yeast Cell Cycle," JKPS, Vol.50, No.91, 2007.