DOI QR코드

DOI QR Code

마이크로어레이 데이터 공유 시스템

Microarray Data Sharing System

  • 윤지희 (한림대학교 컴퓨터공학과) ;
  • 홍동완 (한림대학교 컴퓨터공학과) ;
  • 이종근 (한림대학교 컴퓨터공학과)
  • 발행 : 2009.08.28

초록

최근, 마이크로어레이 실험 데이터의 품질과 재생산성에 대한 신뢰도가 증가하고 있어 마이크로어레이 데이터의 공유 및 활용에 대한 요구가 급속히 증가하고 있다. 그러나 공개되어 있는 국내, 외 마이크로어레이 데이터는 실험 방식, 플랫폼 등에 따라 서로 다른 데이터 항목과 포맷을 가지므로 데이터의 실제적 접근 및 활용이 어려운 상황이다. 본 논문에서는 실험 플랫폼, 데이터 포맷, 정규화 기법, 분석 방식 등이 서로 다른 기존의 마이크로어레이 데이터를 효율적으로 검색, 공유, 통합할 수 있는 마이크로어레이 데이터 공유 시스템을 제안한다. 제안된 시스템은 웹 서비스 기반 기술을 이용하여 분산된 마이크로어레이 데이터를 통합하며, 각 사이트의 사용자는 UDDI를 통하여 검색한 데이터를 표준 MGED 기반의 공통 데이터 구조로 자동 변환하여 다운 받을 수 있다. 정의된 공통 데이터 구조는 IDF,ADF,SDRF,EDF로 구성되어 다양한 구조의 마이크로어레이를 통합할 수 있는 템플릿 역할을 수행하며, MAGE-ML, MAGE-TAB, XML Schema 문서로 저장할 수 있다. 또한 제안된 시스템의 자동 데이터 제출기, 파일 관리자 등은 마이크로어레이 데이터 공유를 위한 다양한 부가 기능을 제공한다.

Improved reliability of microarray data and its reproducibility lead to recent increment in demand of data sharing and utilization among laboratories, but house-keeping and publicly opened microarray experimental data can hardly be accessed and utilized since they are in heterogeneous formats according to the various experimental methods and microarray platforms. In this paper, we propose a microarray sharing method which can easily retrieve and integrate microarray data from different experiment platforms, data formats, normalization methods, and analysis methods. Our system is based on web-service technology. The biologists of each site are able to search UDDI(Universal Description, Discovery, and Integration) registry, and download microarray data with common data structure of standard format recommended by MGED(Microarray Gene Expression Databases) society. The common data structure defined in this paper consists of IDF(Investigation Design Format), ADF(Array Design Format), SDRF(Sample and Relationship Format), and EDF(Expression Data Format). These components play role as templates to integrate microarray data with various structure and can be stored in standard formats such as MAGE-ML, MAGE-TAB, and XML Schema. In addition, our system provides advanced tools of automatic microarray data submitter and file manager to manipulate local microarray data efficiently.

키워드

참고문헌

  1. M. P. Charles, "Show me the data!," Nature Genet., Vol.29. p.373, 2001. https://doi.org/10.1038/ng1201-373
  2. MAQC Consortium, "MAQC project shows inter and intraplatform reproducibility of gene expression measurements," Nature Biotechnology, Vol.24, No.9, pp.1151-1161, 2006. https://doi.org/10.1038/nbt1239
  3. Barrett, "NCBI GEO: mining millions of expression profiles-database and tools," Nucleic Acids Research, Vol.33, No.1, pp.562-566, 2005.
  4. Brazma, "Arrayexpress: a public database of gene expression data at EBI," Nucleic Acids Research, Vol.31, pp.68-71, 2003. https://doi.org/10.1093/nar/gkg091
  5. C. A. Ball and A. Brazma, "MGED Standards:Work in Progress," OMICS, Vol.10, No.2,pp.138-144, 2006. https://doi.org/10.1089/omi.2006.10.138
  6. Brazma, "Minimum information about a microarray experiment (MIAME)-toward standards for microarray data," Nature Genet.,Vol.29, No.4, pp.365-371, 2001. https://doi.org/10.1038/ng1201-365
  7. Spellman, "Design and implementation of microarray gene expression markup language (MAGE-ML)," Genome Biology, Vol.3, No.9, RESEARCH0046.1-0046.9, 2002. https://doi.org/10.1186/gb-2002-3-9-research0046
  8. Y. Yi, C. Li, C. Miller, and A. L. George Jr.,"Strategy for encoding and comparison of gene expression signatures," Genome Biology, Vol.8, 2007.
  9. D. Field and S. Sansone, "A Special Issue on Data Standards," OMICS: A Journal of Integrative Biology, Vol.10, No.2, pp.84-93, 2006. https://doi.org/10.1089/omi.2006.10.84
  10. Rayner, "A simple spreadsheet- based,MIAME-supportive format for microarray data: MAGE-TAB," BMC Bioinformatics, Vol.7, pp.489-507, 2006. https://doi.org/10.1186/1471-2105-7-489
  11. Gollub, "The Stanford Microarray Database:data access and quality assessment tools," Nucleic Acids Research 2003, Vol.31, pp.94-96, 2003. https://doi.org/10.1093/nar/gkg078
  12. A. Hayes, "The Second International Meeting on Microarray Data Standards, Annotations,Ontologies and Databases," Wiley & Sons, Vol.17, pp.238-240, 2000. https://doi.org/10.1002/1097-0061(20000930)17:3<238::AID-YEA35>3.0.CO;2-X
  13. http://www.mged.org/Workgroups/MIAME/miame_2.0.html
  14. http://www.affymetrix.com/index.affx
  15. http://www.illumina.com/
  16. http://www.agilent.com/
  17. http://www.operon.com/default.aspx
  18. http://cms.gobizkorea.com/fileroot/media/8/8327/media/intro.htm
  19. Krestyaninova, "MolPAGE Data Warehouse," ISMB, Poster I13, 2007.

피인용 문헌

  1. Integrated Model Design of Microarray Data Using miRNA, PPI, Disease Information vol.22, pp.6, 2012, https://doi.org/10.5391/JKIIS.2012.22.6.786