DOI QR코드

DOI QR Code

Development of Haplotype Reconstruction System Using Public Resources

공개용 리소스를 활용한 Haplotype 재조합 시스템 개발

  • Kim, Ki-Bong (Department of Medical Biotechnology, Sangmyung University)
  • Published : 2010.02.28

Abstract

Haplotype-based research has become increasingly important in the field of personalized medicine since the haplotype reflects a set of SNPs (Single Nucleotide Polymorphisms) that are genetically associated and inherited together. Currently, the most widely used application softwares available for haplotype reconstruction, based on in silico method, include PL-EM, Haplotyper, PHASE and HAP. PL-EM, Haplotyper and PHASE are command-line application running on LINUX or Unix system and HAP is a web-based client-server application. This paper deals with an integrated haplotype reconstruction system that have been developed with PL-EM and Haplotyper selected from the accuracy test with experimentally verified data on public application softwares. This integrated system is a kind of client-sever one with user friendly web interface and can provide end-users with a high quality of haplotype analysis. SNPs genotype data with a length of 5 derived from 5 people and SNPs genotype data with a length of 13 derived from 15 people were used to test the analysis results of Haplotyper and PL-EM respectively. As a result, this system has been confirmed to provide the systematic and easy-to-understand analysis results that consist of two main parts, i.e. individual haplotype information and haplotype pool information. In this respect, the integration system will be utilized as a useful tool for the discovery of disease related genes and the development of personalized drugs through facilitating the reconstruction of haplotype maps.

Haplotype은 연관성을 띠면서 함께 유전하는 SNP (Single Nucleotide Polymorphism) 집단을 반영하고 있기 때문에 맞춤의학 분야에서 haplotype기반의 연구 중요성이 지속적으로 급증하고 있다. in silico 방법을 바탕으로 Haplotype 재조합을 위해 현재 가장 널리 사용되는 공개용 리소스 응용소프트웨어로는 PL-EM, Haplotyper, PHASE 및 HAP 등이 있다. PL-EM, Haplotyper 및 PHASE 등은 리눅스와 유닉스 시스템에서 구동되는 명령라인 응용 소프트웨어이고, HAP는 클라이언트-서버 환경에서 웹기반으로 구동되는 소프트웨어이다. 본 논문에서는 실험적으로 검증된 데이터들을 이용하여 공개용 리소스 소프트웨어들의 정확성을 검증하고, 그러한 검증결과를 토대로 선별된 Haplotyper와 PL-EM 등으로 개발한 통합 haplotye 재조합 시스템에 대해 소개하고자 한다. 개발된 통합 시스템은 사용자 친화적 웹 인터페이스를 갖는 클라이언트-서버 시스템으로 최종 사용자들에게 양질의 haplotype 분석 결과를 제공할 수 있다. Haplotyper의 경우 5명의 개체로부터 얻은 길이가 5인 SNP 유전자형 데이터를 가지고 결과를 분석하였고, PL-EM의 경우 15명의 개체로부터 얻은 길이가 13인 SNP 유전자형 데이터를 가지고 결과를 분석하였다. 그 결과 본 시스템은 두 부분으로 나누어 개개인의 haplotype 정보와 haplotype 집단 정보를 이해하기 쉽게 체계적으로 제공하는 것을 확인하였다. 이러한 측면에서 본 시스템은 haplotype 지도 작성을 통한 질병 유전자 발굴 및 맞춤의약 개발 연구에 매우 유용한 도구로 사용될 수 있으리라 여겨진다.

Keywords

References

  1. Venter et al. "The Sequence of the Human Genome", Science, 291:1304-1351, 2001. https://doi.org/10.1126/science.1058040
  2. Kwok, P. Y. and Z. Gu. "Single nucleotide polymorphism libraries: why and how are we building them?", Molecular Medicine Today, 5:538-543, 1999. https://doi.org/10.1016/S1357-4310(99)01601-9
  3. Kato, M., Y. Nakamura and T. Tsunodd. "An algorithm for inferring complex haplotypes in a region of copy-number variation", The American Journal of Human Genetics, 83:157-169, 2008. https://doi.org/10.1016/j.ajhg.2008.06.021
  4. Niu, T., Z. S. Qin, X. Xu, and J. S. Liu. "Bayesian haplotype inference for multiple linked Single Nucleotide Polymorphisms", Am. J. Hum. Genet., 70:157-169, 2002. https://doi.org/10.1086/338446
  5. Xing Wang. "HIT: a Haplotype inference Testbed" CAPSL technical report, University of Delaware, 2003.
  6. International HapMap Consortium. "The International HapMap Project", Nature, 18:426(6968):789-96, 2003. https://doi.org/10.1038/nature02168
  7. Tishkoff, S. A., A. J. Pakstis, G. Ruano, and K. K. Kidd, "The accuracy of statistical methods for estimation of haplotype frequencies: an example from the CD4 locus", Am. J. Hum. Genet., 67:518-522, 2000. https://doi.org/10.1086/303000
  8. Tabor, H. K., N. J. Risch, and R. M. Myers. "Candidate-gene approaches for studying complex genetic traits : practical considerations", Nat. Rev. Genet,. 3:391-397, 2002.
  9. Qin, Z. S., T. Niu, and J. S. Liu. "Partition-Ligation-Expectation-Maximization Algorithm for Haplotype Inference with Single Nucleotide Polymorphism.", Am. J. Hum. Genet., 71:1242-1247, 2002. https://doi.org/10.1086/344207
  10. Niu, T., Z. S. Qin, X. Xu, and J. S. Liu. "In silico Haplotype determination of a vast set of Single Nucleotide Polymorphisms", Technical report, Department of Statistics, Harvard University, 2001.
  11. Stephens, M., N. Smith, and P. Donnelly. "A new statistical method for haplotype reconstruction from population data", American Journal of Human Genetics, 68, 978-989, 2001. https://doi.org/10.1086/319501
  12. Halperin, E. and E. Eskin. "Haplotype Reconstruction from Genotype Data using Imperfect Phylogeny", Bioinformatics. 20(12):1842-9, 2004. https://doi.org/10.1093/bioinformatics/bth149
  13. Mark, J., D. John, D. Rioux, S. F. Schaffner, T. J. Hudson and E. S. Lander. "High-resolution haplotype structure in the human genome", Nature Genetics, 29(2):151-158, 2001.
  14. Gabriel et al. "The Structure of Haplotype Blocks in the Human Genome", Science, 296(5576):2225-9. 2002. https://doi.org/10.1126/science.1069424