A Method of Identifying Disease-related Significant Pathways Using Time-Series Microarray Data

시간열 마이크로어레이 데이터를 이용한 질병 관련 유의한 패스웨이 유전자 집합의 검출

  • Kim, Jae-Young (Graduate School of Electrical Engineering and Computer Science, Kyungpook National University) ;
  • Shin, Mi-Young (College of IT Engineering, Kyungpook National University)
  • 김재영 (경북대학교 전자전기컴퓨터학부) ;
  • 신미영 (경북대학교 IT대학 전자공학부)
  • Received : 2010.04.28
  • Published : 2010.09.25

Abstract

Recently the study of identifying bio-markers for disease diagnosis and prognosis has been actively performed. In particular, lots of attentions have been paid to the finding of pathway gene-sets differentially expressed in disease patients rather than the finding of individual gene markers. In this paper we propose a novel method to identify disease-related pathway gene-sets based on time-series microarray data. For this purpose, we firstly compute individual gene scores by the using maSigPro (microarray Significant Profiles) and then arrange all the genes in the decreasing order of the corresponding gene scores. The rank of each gene in the entire list is used to evaluate the statistical significance of candidate gene-sets with Wilcoxson rank sum test. For the generation of candidate gene-sets, MSigDB (Molecular Signatures Database) pathway information has been employed. The experiment was conducted with prostate cancer time-series microarray data and the results showed the usefulness of the proposed method by correctly identifying 6 out of 7 biological pathways already known as being actually related to prostate cancer.

최근 특정 질병의 진단이나 예후 예측을 위해 마이크로어레이 실험 데이터를 이용한 질병 관련 바이오마커 검출 연구가 활발히 진행되고 있다. 특히 정상인에 비해 질병 환자군에서 특이하게 발현되는 개별 유전자를 바이오 마커로 이용하는 기존의 방식과는 달리 동일한 생물학적 패스웨이에 관여하는 유전자 집합의 변화를 분석하여 특이하게 발현되는 패스웨이 유전자 집합을 바이오 마커로 사용하는 유전자 집합 분석(Gene-set analysis) 연구가 주목받고 있다. 본 논문에서는 다양한 실험 조건 요인을 가지는 시간열 마이크로어레이 실험 데이터를 이용한 유의한 패스웨이 유전자 집합을 검출하는 방법에 대해 제안한다. 시간열 마이크로어레이 데이터을 이용하여 유전자 집합 분석을 수행하기 위해서는 시간에 따른 유전자 발현값의 변화에 따라 개별 유전자의 유의성을 나타내는 스코어를 maSigPro (microarray Significant Profiles)를 이용하여 계산한 후, 이를 기반으로 전체 유전자의 순위를 결정하여 후보 유전자 집합에 대한 유의성 검증을 윌콕슨 순위합 검증을 통해 수행한다. 후보 유전자 집합의 생성을 위해서는 MSigDB (Molecular Signatures Database)의 패스웨이 정보를 이용하였으며, 본 논문에서 제안한 방법의 검증을 위해 공개된 전립선 암 관련 시간열 마이크로어레이 실험 데이터에 적용한 결과 실제로 전립선암과 관련된 것으로 밝혀진 7개의 패스웨이 중 6개의 패스웨이를 정확하게 검출할 수 있었다.

Keywords

References

  1. A. Subramanian, P. Tamayo, V. K. Mootha, S. Mukherjee, B. L. Ebert, M. A. Gillette, A. Paulovich, S. L. Pomeroy, T. R. Golub, E. S. Lander and J. P. Mesirov, "Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles," Proc. Natl Acad Sci USA 102: 15545-50, Sep. 2005. https://doi.org/10.1073/pnas.0506580102
  2. E. Lee, H.Y. Chuang, J.W. Kim, T. Ideker, D. Lee, "Inferring pathway activity toward precise disease classification," PLoS Comput Biol. 4(11):e1000217, Nov. 2008. https://doi.org/10.1371/journal.pcbi.1000217
  3. E. Taskesen, "Sub-typing of model organisms based on gene expression data." Bioinformatics technical University of Delft Research Assignment, 2006.
  4. S.Y. Kim, D.J. Volsky, "PAGE: parametric analysis of gene set enrichment," BMC Bioinformatics, 8;6:144, Jun. 2005.
  5. "Gene Expression Omnibus", Available: http://www.ncbi.nlm.nih.gov/geo/
  6. A. Conesa, M.J. Nueda, A. Ferrer, M. Talon, "maSigPro: a method to identify significantly differential expression profiles in time-course microarray experiments," Bioinformatics, 1;22(9):1096-102, May 2006. https://doi.org/10.1093/bioinformatics/btl056
  7. J.T. Leek, E. Monsen, A.R. Dabney, J.D. Storey, "EDGE: extraction and analysis of differential gene expression," Bioinformatics, 15;22(4):507-8, Feb. 2006. https://doi.org/10.1093/bioinformatics/btk005
  8. C. Angelini, L. Cutillo, D. De Canditiis, M. Mutarelli, M. Pensky, "BATS: a Bayesian user-friendly software for analyzing time series microarray experiments,", BMC Bioinformatics, 6;9:415, Oct. 2008.
  9. Y.C. Tai, T.P. Speed, "On Gene Ranking Using Replicated Microarray Time Course Data," Biometrics, ;65(1):40-51, Mar. 2009. https://doi.org/10.1111/j.1541-0420.2008.01057.x
  10. "MSigDB: Molecular Signatures Database", Available: http://www.broadinstitute.org/gsea/index.jsp
  11. Q. Wang, W. Li, X.S. Liu, J.S. Carroll, O.A. Janne, E.K. Keeton, A.M. Chinnaiyan, K.J. Pienta, M. Brown, "A hierarchical network of transcription factors governs androgen receptor-dependent prostate cancer growth," Molecular Cell, 3;27(3):380-92, Aug. 2007. https://doi.org/10.1016/j.molcel.2007.05.041
  12. Zhang, "Advanced analysis of gene expression microarray data," World Scientific, 2006.
  13. S. Baek , H. Moon, H. Ahn, R.L. Kodell, C.J. Lin, J.J. Chen, "Identifying high-dimensional biomarkers for personalized medicine via variable importance ranking," J Biopharm Stat., 18(5):853-68, 2008. https://doi.org/10.1080/10543400802278023
  14. V. Zuber, K. Strimmer, "Gene ranking and biomarker discovery under correlation," Bioinformatics, 15;25(20):2700-7, Oct. 2009. https://doi.org/10.1093/bioinformatics/btp460
  15. R. Gentleman, V. Carey, W. Huber, R. Irizarry and S. Dudoit, "Bioinformatics and Computational Biology Solutions Using R and Bioconductor," Springer, 2005.
  16. J. Verzani, "Using R for Introductory Statistics," Chapman & Hall/CRC, Boca Raton, FL, 2005.
  17. 송문섭, 박창순, 이정진, "S-LINK를 이용한 비모수통계학," 자유아카데미, 2003.
  18. R.V. Hogg, A.T. Craig, J. Mckean, "Introduction to Mathematical Statistics, 6th Edition," Pearson Education, 2005.
  19. S. Kudsen, "Cancer Diagnostics with DNA Microarrays," John Wiley & Sons, Inc., 2006.
  20. R.A. Weinberg, "The biology of CANCER," Carland Science, 2007.
  21. Kanehisa M., Goto S., Kawashima S., Nakaya A., "The KEGG databases at GenomeNet," Nucleic Acids Res., 30:42-46, 2002. https://doi.org/10.1093/nar/30.1.42
  22. "KEGG (Kyoto Encyclopedia of Genes and Genomes) PATHWAY Database", Available: http://www.genome.ad.jp/kegg/pathway.html
  23. Singh, D., Febbo, P. G., Ross, K., Jackson, D. G., Manola, J., Ladd, C., Tamayo, P., Renshaw, A. A., D'Amico, A. V., Richie, J. P., Lander, E.S., Loda, M., Kantoff, P. W., Golub, T. R., Sellers, W. R., "Gene ex-pression correlates of clinical prostate cancer behavior." Cancer Cell, vol. 1, no. 2, pp.203-209, Mar. 2002. https://doi.org/10.1016/S1535-6108(02)00030-2