DOI QR코드

DOI QR Code

A Study on Design of Schema Integration based Biological Information Retrieval System

스키마 통합 기반 생명정보 검색시스템(BIRS) 설계에 관한 연구

  • 한건 (한국과학기술정보연구원 지식기반실) ;
  • 이상호 (한국과학기술정보연구원 지식기반실) ;
  • 안부영 (한국과학기술정보연구원 차세대연구환경개발실)
  • Published : 2009.03.30

Abstract

In computer-based virtual lab, a bioscience researcher who wants to obtain bio information first uses a biodiversity-related database to retrieve information on species, ecology and distribution of an organism. The researcher also needs to access gene/protein databases such as GenBank or PDB to find information on the organism's genetic sequence and protein structure. Furthermore, the researcher should search for academic papers containing the information on the organism so that his research is based on comprehensive and accurate information. This series of activities often undermines research efficiency as it takes a lot of time and causes inconvenience on the part of researchers. To solve such inconvenience, we analyzed various methods for integrated search and chosen schema integration. In addition, we analyzed each databases and extracted metadata for designing schema integration. This paper introduces a biological information retrieval system(BIRS) using schema integration and it's interface that will increase research efficiency for bioscience.

컴퓨터로 옮겨 놓은 생물학 실험실에서 생명과학을 연구하는 연구자가 생명정보를 확인하려면 1차적으로 생물다양성 관련 데이터베이스에서 생명체에 관한 종정보, 생태정보, 분포정보를 검색해야 한다. 그리고 그 생명체를 구성하는 유전자 서열정보와 단백질 구조정보를 Genbank, PDB 등의 유전자/단백질 데이터베이스에서 검색해야 한다. 또한 그 생명체에 관한 학술적 내용이 수록된 학술논문까지 별도로 검색해야만 그 생명체에 관한 포괄적이고도 정확한 정보를 획득하여 연구에 활용할 수 있다. 이런 일련의 과정은 연구자에게 불편함과 함께 많은 시간이 소요됨으로 인해 연구의 효율성을 저하시키는 요인이 되고 있다. 이런 불편함을 해결하기 위하여 통합검색하기 위한 여러 방법을 분석하고, 그중 스키마 통합을 선택하였다. 또한 스키마 통합을 위하여 각각의 데이터베이스의 스키마를 분석하고 메타데이터를 추출하여 Mediated 스키마를 설계하였다. 본 논문에서 설계한 생명정보 검색시스템(BIRS, Biological Information Retrieval System)과 인터페이스를 사용하여 생명과학을 연구하는 연구자들의 연구의 효율성을 향상시킬 수 있을 것이다.

Keywords

References

  1. 김대중, 박재홍, 안성수, 박형선. 2007. 매쉬업을 활용한 생물다양성 지리정보서비스. 한국콘텐츠학회 2007 춘계 종합학술대회 논문집, 5(1): 11-14
  2. 김택천, 김석훈, 김진수. 2007. 유비쿼터스 환경을 위한 Web-GIS 기반의 객체 위치 정보 모니터링 시스템. 한국해양정보통신학 회논문지, 11(9): 1755-1763.
  3. 이수정, 용환승. 2004. 웹서비스 기반 바이오 서열정보 데이터베이스 및 통합검색시스템 개발. 한국정보처리학회논문지, 11D (4): 755-764.
  4. 이희전, 용환승. 2003. 웹서비스 기반 유전자 주석정보 통합검색시스템 구축. 한국멀티미디어학회 2003년 추계학술발표대회 논문집(상), 2003: 355-358.
  5. 최요한, 유성준, 김민경, 박현석. 2004. 웹서비스 기반 바이오정보 통합 분석도구. 한국정보과학회 2004 봄 학술발표논문집, 2004: 289-291.
  6. Baker, P. G. Brass, A. Bechhofer, S. 1998. "TAMBIS: Transparent Access to Multiple Bioinformatics Information Sources." Intelligent systems for mole -cular biology, ISMB-98: 25-34.
  7. BRIC-PDB 설명. [cited 2009. 01. 12]. , .
  8. Davidson. S. B, Crabtree. J, Brunk, B. P. 2001. "K2/Kleisli and GUS: Experiments in integrated access to genomic data sources." IBM systems journal, 40(2): 512-531.
  9. E. M. Zdobnov, R. Lopez, R. Apweiler. 2002. "The EBI SRS server-new features." Bioinformatics, 18: 1149-50. https://doi.org/10.1093/bioinformatics/18.8.1149
  10. Garcia-Molina, Hector, Papakonstantinou, Yannis, Quass, Dallan. 1997. "The TSIMMIS Approach to Mediation: Data Models and Languages." Journal of intelligent information systems, 8(2): 117-132. https://doi.org/10.1023/A:1008683107812
  11. Gray. J, Liu, D. T, Nieto-Santisteban, M. 2005. "Scientific Data Management in the Coming Decade." SIGMOD record, 34(4): 34-41. https://doi.org/10.1145/1107499.1107503
  12. Haas, L. M. Schwarz, P. M. Kodali, P. 2001. "DiscoveryLink: A system for integrated access to life sciences data sources." IBM systems journal, 40(2): 489-511. https://doi.org/10.1147/sj.402.0489
  13. J. Leon Zhao. 1997. "Schema coordination in federated database management: a comparison with schema integration." Decision Support Systems, 20(3): 243-257. https://doi.org/10.1016/S0167-9236(97)00005-5
  14. Jian shuai, Peter buck, Paul Sockett, Jeff Aramini, Frank Pollari. 2006. "A GIS-driven integrated real-time surveillance pilot system for national West Nile virus dead bird surveillance in Canada." International Journal of Health Geographics, 5: 1-17. https://doi.org/10.1186/1476-072X-5-1
  15. KISTI 과학기술정보통합서비스 웹사이트. [cited 2009. 01. 12]. .
  16. KISTI 과학기술 학회마을 웹사이트. [cited 2009. 01. 12]. .
  17. KISTI CCBB 웹사이트. [cited 2009. 01. 12]. .
  18. Kristal. [cited 2009. 01. 12]. .
  19. Rahm, Erhard, Bernstein, Philip A. 2001. "A survey of approaches to automatic schema matching." The VLDB journal, 10(4): 334-350. https://doi.org/10.1007/s007780100057
  20. Shuai, Jiangping, Buck, Peter, Sockett, Paul. 2006. "A GIS-driven integrated real-time surveillance pilot system for national West Nile virus dead bird surveillance in Canada." International journal of health geographics, 5: 17. https://doi.org/10.1186/1476-072X-5-17
  21. WIKIPEDIA-Virtual glove. [cited 2008. 08. 04]. .
  22. Zhang, Bing. Kirov, Stefan. Snoddy, Jay. 2005. "WebGestalt: an integrated system for exploring gene sets in various biological contexts." Nucleic acids research, 33: 741-748. https://doi.org/10.1093/nar/gki475

Cited by

  1. A Service Framework for Supporting XML-based National Research and Development Report Contents vol.12, pp.1, 2011, https://doi.org/10.5762/KAIS.2011.12.1.427