• 제목/요약/키워드: microarray design

검색결과 45건 처리시간 0.026초

되돌림설계를 이용한 마이크로어레이 실험 자료의 분석 (Statistical Analysis of a Loop Designed Microarray Experiment Data)

  • 이선호
    • 응용통계연구
    • /
    • 제17권3호
    • /
    • pp.419-430
    • /
    • 2004
  • 마이크로어레이 기술은 한번에 수만 개의 유전자를 동시에 분석할 수 있는 고효율, 고가의 새로운 연구 도구로 자리잡았으며 마이크로어레이 실험 자료의 올바른 분석을 위해서는 실험 목적에 맞는 실험계획법의 확립과 통계분석법의 적용이 중요하다 본 논문에서는 마이크로어레이 자료에서 여러 군 사이에서 발현의 차이를 보이는 유전자를 찾을 수 있는 되돌림 설계를 소개하고 ANOVA 모형을 이용하여 분석하는 방법을 제시한다. 연세대학교 암전이 연구센터의 되돌림 설계를 이용한 백혈병 자료를 MA-ANOVA(Wu et. al.(2003))를 이용하여 분석하였다

마이크로어레이 데이터 공유 시스템 (Microarray Data Sharing System)

  • 윤지희;홍동완;이종근
    • 한국콘텐츠학회논문지
    • /
    • 제9권8호
    • /
    • pp.18-31
    • /
    • 2009
  • 최근, 마이크로어레이 실험 데이터의 품질과 재생산성에 대한 신뢰도가 증가하고 있어 마이크로어레이 데이터의 공유 및 활용에 대한 요구가 급속히 증가하고 있다. 그러나 공개되어 있는 국내, 외 마이크로어레이 데이터는 실험 방식, 플랫폼 등에 따라 서로 다른 데이터 항목과 포맷을 가지므로 데이터의 실제적 접근 및 활용이 어려운 상황이다. 본 논문에서는 실험 플랫폼, 데이터 포맷, 정규화 기법, 분석 방식 등이 서로 다른 기존의 마이크로어레이 데이터를 효율적으로 검색, 공유, 통합할 수 있는 마이크로어레이 데이터 공유 시스템을 제안한다. 제안된 시스템은 웹 서비스 기반 기술을 이용하여 분산된 마이크로어레이 데이터를 통합하며, 각 사이트의 사용자는 UDDI를 통하여 검색한 데이터를 표준 MGED 기반의 공통 데이터 구조로 자동 변환하여 다운 받을 수 있다. 정의된 공통 데이터 구조는 IDF,ADF,SDRF,EDF로 구성되어 다양한 구조의 마이크로어레이를 통합할 수 있는 템플릿 역할을 수행하며, MAGE-ML, MAGE-TAB, XML Schema 문서로 저장할 수 있다. 또한 제안된 시스템의 자동 데이터 제출기, 파일 관리자 등은 마이크로어레이 데이터 공유를 위한 다양한 부가 기능을 제공한다.

Balanced Experimental Designs for cDNA Microarray data

  • 최규정
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 한국데이터정보과학회 2006년도 PROCEEDINGS OF JOINT CONFERENCEOF KDISS AND KDAS
    • /
    • pp.121-129
    • /
    • 2006
  • Two color or cDNA microarrays are extensively used to study relative expression levels of thousands of genes simultaneously. 0かy two tissue samples can be hybridized on a single microarray slide. Thus, a microarray slide necessarily forms an incomplete block design with block size two when more than two tissue samples are under study. We also need to control for variability in gene expression values due to the two dyes. Thus, red and green dyes form the second blocking factor in addition to slides. General design problem for these microarray experiments is discussed in this paper. Designs for factorial cDNA microarrays are also discussed.

  • PDF

Network-based Microarray Data Analysis Tool

  • Park, Hee-Chang;Ryu, Ki-Hyun
    • Journal of the Korean Data and Information Science Society
    • /
    • 제17권1호
    • /
    • pp.53-62
    • /
    • 2006
  • DNA microarray data analysis is a new technology to investigate the expression levels of thousands of genes simultaneously. Since DNA microarray data structures are various and complicative, the data are generally stored in databases for approaching to and controlling the data effectively. But we have some difficulties to analyze and control the data when the data are stored in the several database management systems or that the data are stored to the file format. The existing analysis tools for DNA microarray data have many difficult problems by complicated instructions, and dependency on data types and operating system. In this paper, we design and implement network-based analysis tool for obtaining to useful information from DNA microarray data. When we use this tool, we can analyze effectively DNA microarray data without special knowledge and education for data types and analytical methods.

  • PDF

Ranking Candidate Genes for the Biomarker Development in a Cancer Diagnostics

  • Kim, In-Young;Lee, Sun-Ho;Rha, Sun-Young;Kim, Byung-Soo
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2004년도 The 3rd Annual Conference for The Korean Society for Bioinformatics Association of Asian Societies for Bioinformatics 2004 Symposium
    • /
    • pp.272-278
    • /
    • 2004
  • Recently, Pepe et al. (2003) employed the receiver operating characteristic (ROC) approach to rank candidate genes from a microarray experiment that can be used for the biomarker development with the ultimate purpose of the population screening of a cancer, In the cancer microarray experiment based on n patients the researcher often wants to compare the tumor tissue with the normal tissue within the same individual using a common reference RNA. This design is referred to as a reference design or an indirect design. Ideally, this experiment produces n pairs of microarray data, where each pair consists of two sets of microarray data resulting from reference versus normal tissue and reference versus tumor tissue hybridizations. However, for certain individuals either normal tissue or tumor tissue is not large enough for the experimenter to extract enough RNA for conducting the microarray experiment, hence there are missing values either in the normal or tumor tissue data. Practically, we have $n_1$ pairs of complete observations, $n_2$ 'normal only' and $n_3$ 'tumor only' data for the microarray experiment with n patients, where n=$n_1$+$n_2$+$n_3$. We refer to this data set as a mixed data set, as it contains a mix of fully observed and partially observed pair data. This mixed data set was actually observed in the microarray experiment based on human tissues, where human tissues were obtained during the surgical operations of cancer patients. Pepe et al. (2003) provide the rationale of using ROC approach based on two independent samples for ranking candidate gene instead of using t or Mann -Whitney statistics. We first modify ROC approach of ranking genes to a paired data set and further extend it to a mixed data set by taking a weighted average of two ROC values obtained by the paired data set and two independent data sets.

  • PDF

Web-based DNA Microarray Data Analysis Tool

  • Ryu, Ki-Hyun;Park, Hee-Chang
    • Journal of the Korean Data and Information Science Society
    • /
    • 제17권4호
    • /
    • pp.1161-1167
    • /
    • 2006
  • Since microarray data structures are various and complicative, the data are generally stored in databases for approaching to and controlling the data effectively. But we have some difficulties to analyze and control the data when the data are stored in the several database management systems. The existing analysis tools for DNA microarray data have many difficult problems by complicated instructions, and dependency on data types and operating system, and high cost, etc. In this paper, we design and implement the web-based analysis tool for obtaining to useful information from DNA microarray data. When we use this tool, we can analyze effectively DNA microarray data without special knowledge and education for data types and analytical methods.

  • PDF

다중목적함수 진화 알고리즘을 이용한 마이크로어레이 프로브 디자인 (Microarray Probe Design with Multiobjective Evolutionary Algorithm)

  • 이인희;신수용;조영민;양경애;장병탁
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권8호
    • /
    • pp.501-511
    • /
    • 2008
  • 프로브(probe) 디자인은 성공적인 DNA 마이크로어레이(DNA microarray) 실험을 위해서 필수적인 작업이다. 프로브가 만족시켜야 하는 조건은 마이크로어레이 실험의 목적이나 방법에 따라 다양하게 정의될 수 있는데, 대부분의 기존 연구에서는 각각의 조건에 대하여 각자 독립적으로 정해진 한계치(threshold) 값을 넘지 않는 프로브를 탐색하는 방법을 취하고 있다. 그러나, 본 연구에서는 프로브 디자인을 두가지 목적함수를 지닌 다중목적함수 최적화 문제(multiobjective optimization problem)로 정의하고, ${\epsilon}$-다중목적함수 진화 알고리즘(${\epsilon}$-multiobjective evolutionary algorithm)을 이용하여 해결하는 방법을 제시한다. 제시된 방법은 19종류의 고위험군 인유두종 바이러스(Human Papillomavirus) 유전자들에 대한 프로브 디자인과 52종류의 애기장대 칼모듈린 유전자군(Arabidopsis Calmodulin multigene family)에 대한 프로브 디자인에 각각 적용되었다. 제안한 방법론을 사용하여 기존의 공개 프로브 디자인 프로그램인 OligoArray 및 OligoWiz에 비해 목표유전사에 더 적합한 프로브를 찾을 수 있었다.

${\epsilon}$-다중목적 진화연산을 이용한 DNA Microarray Probe 설계 (A Probe Design Method for DNA Microarrays Using ${\epsilon}$-Multiobjetive Evolutionary Algorithms)

  • 조영민;신수용;이인희;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (A)
    • /
    • pp.82-84
    • /
    • 2006
  • 최근의 생물학적인 연구에 DNA microarray가 널리 쓰이고 있기 때문에, 이러한 DNA microarray를 구성하는데 필요한 probe design 작업의 중요성이 점차 커져가고 있다. 이 논문에서는 probe design 문제를 thermodynamic fitness function이 2개인 multi-objective optimization 작업으로 변환한 뒤, ${\epsilon}$-multiobjective evolutionary algorithm을 이용하여 probe set을 찾는다. 또한, probe 탐색공간의 크기를 줄이기 위하여 각 DNA sequence의 primer 영역을 찾는 작업을 진행하며, 사용자가 직접 프로그램을 테스트할 수 있는 웹사이트를 제공한다. 실험 대상으로는 mycoides를 선택하였으며, 이 논문에서 제안된 방법을 사용하여 성공적으로 probe set을 발견할 수 있었다.

  • PDF

Normal Mixture Model with General Linear Regressive Restriction: Applied to Microarray Gene Clustering

  • Kim, Seung-Gu
    • Communications for Statistical Applications and Methods
    • /
    • 제14권1호
    • /
    • pp.205-213
    • /
    • 2007
  • In this paper, the normal mixture model subjected to general linear restriction for component-means based on linear regression is proposed, and its fitting method by EM algorithm and Lagrange multiplier is provided. This model is applied to gene clustering of microarray expression data, which demonstrates it has very good performances for real data set. This model also allows to obtain the clusters that an analyst wants to find out in the fashion that the hypothesis for component-means is represented by the design matrices and the linear restriction matrices.

마이크로어레이 실험 및 분석 데이터 처리를 위한 통합 관리 시스템의 설계와 구현 (Design and Implementation of Integrated System for Microarray Data)

  • 이미경;최정현;조환규
    • 한국미생물·생명공학회지
    • /
    • 제31권2호
    • /
    • pp.182-190
    • /
    • 2003
  • 마이크로어레이 기술이 널리 이용됨에 따라 마이크로어레이 이미지 데이터와 이미지 분석 데이터들이 급격히 늘어나고 있다. 그러나 국내에서는 그 데이터들을 효율적으로 관리하기 위한 시스템이 개발되어 공개된 경우가 없다. 그리고 마이크로어레이 실험은 한 실험실에서 분석하고 연구할 수 있는 유전자의 수가 제한되어 있으므로 서로 다른 연구실에서 실험한 연구 결과들을 공유함으로써 실험의 중복을 막을 수 있고 그 연구 결과들을 축척할 수 있다. 본 논문에서는 마이크로어레이 이미지 데이터를 처리 및 관리하기 위한 통합 시스템, WEMA(Web management of MicroArray)를 개발하였다. WEMA는 마이크로어레이 데이터 표준 규정의 제안인 MIAME(Minimal Information About a Microarray Experiment)에서 정의한 데이터 요소를 바탕으로 데이터 스키마를 설계하였으며 마이크로어레이 실험 설계에 따라 체계적으로 데이터를 관리하기 위해서 공동적인 데이터 단위를 정의하였다. WEMA의 주요 기능은 마이크로어레이 이미지 및 분석 데이터의 효율적인 관리, 데이터입출력의 통합 기능, 메타 파일 생성 등이다. 본 WEMA 시스템을 이용해서 실제로 한 식물 분자 생물학 연구실에서 만들어내는 마이크로어레이 이미지 데이터를 처리, 관리한 결과 생물학자들이 마이크로어레이 데이터를 체계적으로 관리, 분석할 수 있었으며 연구자들간의 데이터 교환 및 의사 소통이 원활히 이루어졌다.