• 제목/요약/키워드: MIAME

검색결과 4건 처리시간 0.017초

마이크로어레이 실험 및 분석 데이터 처리를 위한 통합 관리 시스템의 설계와 구현 (Design and Implementation of Integrated System for Microarray Data)

  • 이미경;최정현;조환규
    • 한국미생물·생명공학회지
    • /
    • 제31권2호
    • /
    • pp.182-190
    • /
    • 2003
  • 마이크로어레이 기술이 널리 이용됨에 따라 마이크로어레이 이미지 데이터와 이미지 분석 데이터들이 급격히 늘어나고 있다. 그러나 국내에서는 그 데이터들을 효율적으로 관리하기 위한 시스템이 개발되어 공개된 경우가 없다. 그리고 마이크로어레이 실험은 한 실험실에서 분석하고 연구할 수 있는 유전자의 수가 제한되어 있으므로 서로 다른 연구실에서 실험한 연구 결과들을 공유함으로써 실험의 중복을 막을 수 있고 그 연구 결과들을 축척할 수 있다. 본 논문에서는 마이크로어레이 이미지 데이터를 처리 및 관리하기 위한 통합 시스템, WEMA(Web management of MicroArray)를 개발하였다. WEMA는 마이크로어레이 데이터 표준 규정의 제안인 MIAME(Minimal Information About a Microarray Experiment)에서 정의한 데이터 요소를 바탕으로 데이터 스키마를 설계하였으며 마이크로어레이 실험 설계에 따라 체계적으로 데이터를 관리하기 위해서 공동적인 데이터 단위를 정의하였다. WEMA의 주요 기능은 마이크로어레이 이미지 및 분석 데이터의 효율적인 관리, 데이터입출력의 통합 기능, 메타 파일 생성 등이다. 본 WEMA 시스템을 이용해서 실제로 한 식물 분자 생물학 연구실에서 만들어내는 마이크로어레이 이미지 데이터를 처리, 관리한 결과 생물학자들이 마이크로어레이 데이터를 체계적으로 관리, 분석할 수 있었으며 연구자들간의 데이터 교환 및 의사 소통이 원활히 이루어졌다.

Standard-based Integration of Heterogeneous Large-scale DNA Microarray Data for Improving Reusability

  • Jung, Yong;Seo, Hwa-Jeong;Park, Yu-Rang;Kim, Ji-Hun;Bien, Sang Jay;Kim, Ju-Han
    • Genomics & Informatics
    • /
    • 제9권1호
    • /
    • pp.19-27
    • /
    • 2011
  • Gene Expression Omnibus (GEO) has kept the largest amount of gene-expression microarray data that have grown exponentially. Microarray data in GEO have been generated in many different formats and often lack standardized annotation and documentation. It is hard to know if preprocessing has been applied to a dataset or not and in what way. Standard-based integration of heterogeneous data formats and metadata is necessary for comprehensive data query, analysis and mining. We attempted to integrate the heterogeneous microarray data in GEO based on Minimum Information About a Microarray Experiment (MIAME) standard. We unified the data fields of GEO Data table and mapped the attributes of GEO metadata into MIAME elements. We also discriminated non-preprocessed raw datasets from others and processed ones by using a two-step classification method. Most of the procedures were developed as semi-automated algorithms with some degree of text mining techniques. We localized 2,967 Platforms, 4,867 Series and 103,590 Samples with covering 279 organisms, integrated them into a standard-based relational schema and developed a comprehensive query interface to extract. Our tool, GEOQuest is available at http://www.snubi.org/software/GEOQuest/.

Xperanto: A Web-Based Integrated System for DNA Microarray Data Management and Analysis

  • Park, Ji Yeon;Park, Yu Rang;Park, Chan Hee;Kim, Ji Hoon;Kim, Ju Ha
    • Genomics & Informatics
    • /
    • 제3권1호
    • /
    • pp.39-42
    • /
    • 2005
  • DNA microarray is a high-throughput biomedical technology that monitors gene expression for thousands of genes in parallel. The abundance and complexity of the gene expression data have given rise to a requirement for their systematic management and analysis to support many laboratories performing microarray research. On these demands, we developed Xperanto for integrated data management and analysis using user-friendly web-based interface. Xperanto provides an integrated environment for management and analysis by linking the computational tools and rich sources of biological annotation. With the growing needs of data sharing, it is designed to be compliant to MGED (Microarray Gene Expression Data) standards for microarray data annotation and exchange. Xperanto enables a fast and efficient management of vast amounts of data, and serves as a communication channel among multiple researchers within an emerging interdisciplinary field.

구조적 유사성을 이용한 마이크로어레이 데이터의 효율적인 저장을 위한 기법의 설계 및 구현 (Design And Realization For Efficiently Storing Microarray Data Using Structural Similarity)

  • 윤종한;신동규;신동일
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.230-235
    • /
    • 2008
  • 생명정보 대량 획득기술의 하나인 마이크로어레이(microarray)는 DNA와 각종 유적자 연구에 사용되는 도구로서 확립되면서, 생명정보학(bioinformatics)분야의 발전에 크게 기여하였다. 그러나 마이크로어레이는 생명정보학분야의 핵심기술 중 하나로 발전하였음에도 불구하고 마이크로어레이 실험으로 생성되는 데이터는 형태가 다양하고 매우 복잡한 형태를 갖기 때문에 데이터의 공유나 저장에서 많은 어려움을 겪는 것이 사실이다. 따라서 마이크로어레이 실험결과 분석을 위한 최소한의 컨텐츠가 정의되고 표준화 되었다. MIAME 데이터, MAGE-OM/ML과 같은 표준화된 공개 저장소는 전문 생물학 연구단체에게 과거부터 지금까지 주요 관심사가 되어왔다. 하지만 많은 공개저장소의 설립되었지만 마이크로어레이 데이터의 구조적 특징을 고려하여 효과적인 설계를 하지 않은 것이 사실이다. 본 논문은 표준을 따르는 동시에 마이크로어레이 데이터의 구조적 빈발 패턴이 반복되는 계층적 특징을 반영하는 전략을 제안한다. 이를 통하여 복잡한 데이터의 구조를 객체들의 빈발 패턴을 파악하여 그 계층을 줄임으로서 복잡도를 줄일 수 있었다. 이 과정에서 관계형 데이터베이스 기반의 공개저장소의 성능에 영향을 주는 관계 테이블(join-table)의 숫자는 줄어든다. 이에 따라, 성능은 개선된다. 이 전략을 통하여 생성된 테이블의 숫자는 원본 데이터를 단순 매핑시켜 저장하는 방법에 비하여 약 31%줄어든다. 결국 MAGE-ML 데이터의 저장과 로딩 시간은 이 논문에서 제시하는 전략을 적용하지 않은 방법에 비해 60%에서 65%를 줄일 수 있었다.

  • PDF