System Design for Building Sequence Information Analysis Databases using Information Extraction Techniques

정보추출 기법을 이용한 서열정보분석 데이터베이스 구축 시스템 설계

  • 이선아 (충북대학교 컴퓨터학과, 첨단정보기술연구센터) ;
  • 전중남 (충북대학교 컴퓨터학과, 첨단정보기술연구센터) ;
  • 이건명 (충북대학교 컴퓨터학과, 첨단정보기술연구센터)
  • Published : 2002.10.01

Abstract

인터넷의 확산과 첨단기술의 발달로 생물학 정보에 대한 온라인 데이터베이스 집합이 급속히 증가하고 있으나, 데이터의 양이 방대하고 이질적인 형태로 제공되기 때문에 실제 현장의 생물학 연구자들이 쉽게 이용하는데는 여러 가지 어려움이 있다. 이 논문에서는 단백질과 핵산 정보를 제공하는 대표적인 온라인 데이터베이스인 NCBL에, 질의를 하여 얻어진 데이터를 포함한 웹 문서로부터, 정보를 추출하여 사용자의 목적에 적합한 맞춤형 데이터베이스를 구축하는 시스템을 제안한다. 온톨로지를 이용하여 질의 처리를 하며, 웹 문서에 대한 정보추출 기법과 계층구조에 따른 유형별 저장방식을 통해 데이터베이스를 구축한다. 한편, 데이터 추출을 위해 식별 및 분류 작업을 수행한다. 제안한 시스템은 서열정보를 분석하는 생물학자들에게 관심대상 정보를 추출하여 맞춤형 데이터베이스를 구축함으로써, 손쉽게 서열정보 분석을 지원하도록 하는데 목적이 있다.

Keywords