• 제목/요약/키워드: BSML

검색결과 10건 처리시간 0.026초

BSML 기반의 유전자 데이터베이스와 변환기의 구축 (Development of Bioinformatic Database and Converting Tools based on BSML)

  • 윤애란;이수정;이희전;용환승
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.638-640
    • /
    • 2003
  • 최근 바이오인포매틱스 분야의 발전에 따라 방대한 양의 유전체 데이터에 대한 연구가 진행되고 있으며, 이러한 데이터를 효율적으로 다루기 위해 다양한 형태의 파일과 데이터베이스들이 사용되고 있다. 하지만 표준화의 미비로 인하여 데이터의 관리와 변환에 어려움이 많다. 본 논문에서는 이러한 문제점을 해결하기 위하여 바이오인포매틱스 데이터를 다루기 위한 표준으로 다양한 XML 포맷들 중에서 BSML(Bioinformatic Sequence Markup Language)을 채택하고, Genbank 파일을 변환하여 관계형 데이터베이스에 저장하는 모듈을 개발한다. 또한 관계형 데이터베이스 형태의 유전체 데이터를 BSML 형태로, Genbank 파일 형태를 BSML 형태로 그리고 AGAVE(Architecture for Genomic Annotation)파일 형태를 BSML 형태로 변환하는 변환기롤 개발하고자 한다.

  • PDF

정보 공유를 위한 BSML 기반의 생물학 데이터 변환기 (The Biological Data Converter based on BSML for Sharing Information)

  • 김영억;정광수;정영진;차효성;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.37-39
    • /
    • 2004
  • 현재 생물학 연구실에서 시퀀싱 실험을 통해 생성되거나 또는 공개용 생물 데이터베이스로부터 획득된 유전체 및 단백질 정보는 각각 이질적인 데이터형식을 사용하고 있다. 이 때문에, 생물정보를 분석하여 상호간의 정보를 효율적으로 사용하기 위해서는 공통된 형식의 데이터 표준화작업이 필수적이다. 그리고 이러한 이질적 데이터 형식에 대한 표준화 연구의 미비로 인하여 플랫 파일간의 정보공유에 어려움을 겪고 있다. 따라서, 이 논문에서는 다양한 유전체 및 단백질 정보를 관리.공유하기 위해 이질적인 포맷간의 맵핑 과정을 통하여 BSML(Bioinformatic Sequence Markup Language) 형태로 변환하고, 이를 객체관계형 데이터베이스(Object Relational DataBase)에 저장하는 시스템을 개발하였다. 그리고, 개발된 시스템은 생물정보 데이터의 표준화를 위해 개발된 XML(Extend Markup Language) 기반의 BSML을 이용함으로써 효율적으로 생물학 데이터들 간의 정보를 공유할 수 있으며, 개인 생물학 데이터베이스 구축이나 다양한 생물학적 데이터를 통합 관리하는 시스템에서 유용하게 쓰일 수 있다.

  • PDF

BSML 기반 능동 트리거 규칙을 이용한 염기서열정보관리시스템의 구현 (Implementation of an Information Management System for Nucleotide Sequences based on BSML using Active Trigger Rules)

  • 박성희;정광수;류근호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권1호
    • /
    • pp.24-42
    • /
    • 2005
  • 유전체 서열을 포함하는 생물정보는 지속적으로 변화하며 이질적이고 다양하다는 특성을 갖는다. 이러한 생물 정보의 특성을 반영한 관리시스템이 요구되지만 현재 대부분의 기존 생물정보 데이타베이스는 생물 데이타에 대한 저장소로만 이용된다. 따라서 이 논문에서는 생물학 연구실 수준에서 시퀀싱 실험을 통해 생산되거나 다양한 공개용 데이타베이스로부터 수집된 염기 서열 데이타를 파일 포맷 변환, 편집, 저장 및 검색을 수행하는 서열정보관리 시스템을 제시한다. 이질적인 서열 포맷간의 파일 변환을 위하여 XML기반 BSML을 공통 포맷으로 이용한다. 서열 저장관리에서는 동일한 DNA 조각에 대한 서열 구성의 변경정보를 저장하기 위해 서열 버전을 정의하고 능동 트리거 규칙을 이용하여 변경 정보 검출 및 생성 방법을 보여준다. 트리거 기능을 이용하여 서열의 변경 정보를 자동적으로 데이타베이스에서 저장관리 할 수 있음을 보이고 성능을 평가하였다.

Building an Integrated Protein Data Management System Using the XPath Query Process

  • Cha Hyo Soung;Jung Kwang Su;Jung Young Jin;Ryu Keun Ho
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2004년도 Proceedings of ISRS 2004
    • /
    • pp.99-102
    • /
    • 2004
  • Recently according to developing of bioinformatics techniques, there are a lot of researches about large amount of biological data. And a variety of files and databases are being used to manage these data efficiently. However, because of the deficiency of standardization there are a lot of problems to manage the data and transform one into the other among heterogeneous formats. We are interested in integrating. saving, and managing gene and protein sequence data generated through sequencing. Accordingly, in this paper the goal of our research is to implement the system to manage sequence data and transform a sequence file format into other format. To satisfy these requirements, we adopt BSML (Bioinformatics Sequence Markup Language) as the standard to manage the bioinformatics data. And then we integrate and store the heterogeneous 리at file formats using BSML schema based DTD. And we developed the system to apply the characteristics of object-oriented database and to process XPath query, one of the efficient structural query. that saves and manages XML documents easily.

  • PDF

XPath 질의 처리를 적용한 단백질 데이터 통합 관리시스템 구축 (Building a Integrated Protein Data Management System Using the XPath Query Process)

  • 차효성;정광수;정영진;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.103-105
    • /
    • 2004
  • 최근 바이오 인포매틱스 분야의 발전에 따라 방대한 양의 유전체 데이터에 대한 연구가 진행되고 있으며, 이러한 데이터를 효율적으로 다루기 위해 다양한 형태의 파일과 데이터베이스들이 사용되고 있다. 하지만 표준화의 미비로 인하여 데이터의 관리 및 변환에 어려움이 많다. 따라서 이 논문에서는 시퀀싱을 통해 생성된 유전체 및 단백질 서열 데이터의 통합 저장 관리를 위해 서열 정보의 편집, 저장 및 검색과 서열 파일 포맷 변환을 수행하는 서열 정보관리 시스템의 구현을 목적으로 한다. 이러한 요구사항을 만족시키기 위해 바이오 인포메틱스 데이터를 다루기 위한 표준으로 BSML(Bioinformatic Sequence Markup Language)을 채택하고 이질적 플랫파일들은 DTD를 기반으로 BSML 스키마로 통합 및 저장한다. 그리고 객체 관계 데이터베이스 특성을 적용하여 XML 문서를 보다 쉽게 저장 관리하고 범위 또는 구조적 질의에 효율적인 XPath 질의 처리를 위한 시스템을 개발하였다.

  • PDF

DEVELOPMENT OF XML BASED PERSONALIZED DATAASE MANAGEMENT SYTEM FOR BIOLOGISTS

  • Cho Kyung Hwan;Jung Kwang Su;Kim Sun Shin;Ryu Keun Ho
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2005년도 Proceedings of ISRS 2005
    • /
    • pp.770-773
    • /
    • 2005
  • In most biological laboratory, sequences from sequence machine are stored into file disks as simple files. It will be hard work to store and manage the sequence data with consistency and integrity such as storing redundant files. It is required needed to develop a system which integrated and managed genome data with consistency and integrity for accurate sequence analysis. There fore, in this paper, we not only store gene and protein sequence data through sequencing but also manage them. We also make a integrate schema for transforming the file formats and design database system using it. As integrated schema is designed as a BSML, it is possible to apply a style language of XSL. From this, we can transfer among heterogeneous sequence formats.

  • PDF

XML 기반 과학기술 정보 처리

  • 채진석
    • 지식정보인프라
    • /
    • 통권6호
    • /
    • pp.42-57
    • /
    • 2001
  • XML을 사용하여 수학식을 표현하는데 사용되는 MathML에 대해 설명하고, 화학식을 표현하는데 사용되는 CML, 염기서열등의 분자 생물학적 정보를 표현하는데 사용되는 BSML과 BIOML에 대해 설명하고자 한다.

  • PDF

TRANS FORM / XML Answer

  • Bill Trippe
    • 디지털콘텐츠
    • /
    • 12호통권127호
    • /
    • pp.173-174
    • /
    • 2003
  • XML 개발 업계는 아이디어 부족을 겪고 있지는 않다. 어떤 산업을 지목해 보아라. 그러면 그 산업이 안고 있는 문제를 해결하기 위해 설계된 최소한 한 개의 XML 전략을 지목할 수 있다. 일반적인 것(Trading Networks용 RosettaNe)에서 특정한 것(생물공학 시퀀스 마크업 언어, BSML), 특이한 것(얼굴 애니메이션 마크업 언어, 농담이 아니다)에 이르기까지 아이디어는 광범위하다.

  • PDF

웹 서비스를 이용한 바이오 서열 정보 데이터베이스 및 통합 검색 시스템 개발 (Development of Integrated Retrieval System of the Biology Sequence Database Using Web Service)

  • 이수정;용환승
    • 정보처리학회논문지D
    • /
    • 제11D권4호
    • /
    • pp.755-764
    • /
    • 2004
  • 최근, 바이오 관련 장비, 기술들이 발전함에 따라, 바이오 관린 데이터나 그것을 제공하는 호스트들이 급속하게 증가하고 있나. 또한, 이러한 데이터들은 개발 커뮤니티들의 수만큼, 분산되고 이질적인 면을 가시고 있어서, 바이오 관련 데이터베이스의 통합과 연동기능의 세공이 중요한 문제가 되고 있다. 그러나, 현재까지 진행되고 있는 많은 통합 연구 시스템의 대부분이 링크기반, 데이터웨어하우징 구축 기반으로 하고 있어서, 데이터 스키마나 데이터의 변경시, 실시간 업데이트와 같은 문제점을 보인다. 이러한 비효율적인 면을 개선시키고자, 플랫폼. 스키마의 변화에 구애 받지 않고 서비스를 가능하게 하는 웹 서비스 기술을 이용한 통합 시스템이 제안되고 있다. 본 논문에서도 이러한 흐름에 맞추어, 웹 서비스를 이용한 바이오 서열 데이터의 데이터베이스와, 통합 검색 시스템을 개발하였다 개발된 시스템은 BSML을 포함한 다양한 포맷의 데이터로 서열정보를 제공하며, 또한 외부 데이터베이스의 검색을 병렬로 처리하여, 검색 성능을 향상시키도록 하였다.

Fact constellation 스키마와 트리 기반 XML 모델을 적용한 실험실 레벨의 단백질 데이터 통합 기법 (An Approach for Integrated Modeling of Protein Data using a Fact Constellation Schema and a Tree based XML Model)

  • 박성희;이영화;류근호
    • 정보처리학회논문지D
    • /
    • 제11D권3호
    • /
    • pp.519-532
    • /
    • 2004
  • 유전자 및 단백질간의 복잡한 상호작용에 의해 기능이 결정되는 생명정보 데이터의 특성으로 인하여 생명정보 데이터 분석을 위해서는 이질적인 데이터를 통합적으로 분석할 수 있는 통합시스템이 요구된다. 따라서 이 논문에서는 생물학 실험실 레벨에서 단백질 구조 관련 데이터를 통합할 수 있도록 XML 모델기반에 웨어하우스 미디에이터 통합시스템을 제안한다. 제안 시스템은 fact constellation 모델을 기반하여 이질적인 소스에 대한 통합 모델링을 진행하고 통합 스키마를 XML 스키마로 변환하여 유지한다. 또한 통합 데이터베이스에 포함된 소스 데이터의 변경 및 출처에 대한 추적 관리를 위해 데이터의 점진적 갱신방법과 서열에 대한 버전관리를 이용한다. 실제로 이 시스템을 단백질 구조(PDB), 서열(Swiss-Prot)과 도메인 분류데이터(CATH) 통합에 적용한 통합 모델링 과정을 보여준다.