• Title/Summary/Keyword: microarray design

Search Result 45, Processing Time 0.036 seconds

Classification Prediction Error Estimation System of Microarray for a Comparison of Resampling Methods Based on Multi-Layer Perceptron (다층퍼셉트론 기반 리 샘플링 방법 비교를 위한 마이크로어레이 분류 예측 에러 추정 시스템)

  • Park, Su-Young;Jeong, Chai-Yeoung
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.14 no.2
    • /
    • pp.534-539
    • /
    • 2010
  • In genomic studies, thousands of features are collected on relatively few samples. One of the goals of these studies is to build classifiers to predict the outcome of future observations. There are three inherent steps to build classifiers: a significant gene selection, model selection and prediction assessment. In the paper, with a focus on prediction assessment, we normalize microarray data with quantile-normalization methods that adjust quartile of all slide equally and then design a system comparing several methods to estimate 'true' prediction error of a prediction model in the presence of feature selection and compare and analyze a prediction error of them. LOOCV generally performs very well with small MSE and bias, the split sample method and 2-fold CV perform with small sample size very pooly. For computationally burdensome analyses, 10-fold CV may be preferable to LOOCV.

Integrated Model Design of Microarray Data Using miRNA, PPI, Disease Information (miRNA, PPI, 질병 정보를 이용한 마이크로어레이 데이터 통합 모델 설계)

  • Ha, Kyung-Sik;Lim, Jin-Muk;Kim, Hong-Gee
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.22 no.6
    • /
    • pp.786-792
    • /
    • 2012
  • A microarray is a collection of thousands of DNAs or RNAs arranged on a substrate, and it enables one to navigate large amounts of gene expression. However, a researcher uses his designed experimental methods to focus on particular phenotypes from the available mass of data. In this paper, we used MicroRNAs(miRNAs) and Protein-Protein Interation(PPI) databases to enhance and expand meanings in microarray data. Further, the expanded data are linked with the Online Mendelian Inheritance in Man(OMIM), and International Statistical Classification of Diseases and Related Health Problems, $10^{th}$ Revision(ICD-10), in order to extract common genetic relationships between diseases. This approach, we expect, should provide new biological views.

The Design and Implement of Microarry Data Classification Model for Tumor Classification (종양 분류를 위한 마이크로어레이 데이터 분류 모델 설계와 구현)

  • Park, Su-Young;Jung, Chai-Yeoung
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.11 no.10
    • /
    • pp.1924-1929
    • /
    • 2007
  • Nowadays, a lot of related data obtained from these research could be given a new present meaning to accomplish the original purpose of the whole research as a human project. The method of tumor classification based on microarray could contribute to being accurate tumor classification by finding differently expressing gene pattern statistically according to a tumor type. Therefore, the process to select a closely related informative gene with a particular tumor classification to classify tumor using present microarray technology with effect is essential. In this thesis, we used cDNA microarrays of 3840 genes obtained from neuronal differentiation experiment of cortical stem cells on white mouse with cancer, constructed accurate tumor classification model by extracting informative gene list through normalization separately and then did performance estimation by analyzing and comparing each of the experiment results. Result classifying Multi-Perceptron classifier for selected genes using Pearson correlation coefficient represented the accuracy of 95.6%.

Design And Realization For Efficiently Storing Microarray Data Using Structural Similarity (구조적 유사성을 이용한 마이크로어레이 데이터의 효율적인 저장을 위한 기법의 설계 및 구현)

  • Yun, Jong-Han;Shin, Dong-Kyu;Shin, Dong-Il
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06c
    • /
    • pp.230-235
    • /
    • 2008
  • 생명정보 대량 획득기술의 하나인 마이크로어레이(microarray)는 DNA와 각종 유적자 연구에 사용되는 도구로서 확립되면서, 생명정보학(bioinformatics)분야의 발전에 크게 기여하였다. 그러나 마이크로어레이는 생명정보학분야의 핵심기술 중 하나로 발전하였음에도 불구하고 마이크로어레이 실험으로 생성되는 데이터는 형태가 다양하고 매우 복잡한 형태를 갖기 때문에 데이터의 공유나 저장에서 많은 어려움을 겪는 것이 사실이다. 따라서 마이크로어레이 실험결과 분석을 위한 최소한의 컨텐츠가 정의되고 표준화 되었다. MIAME 데이터, MAGE-OM/ML과 같은 표준화된 공개 저장소는 전문 생물학 연구단체에게 과거부터 지금까지 주요 관심사가 되어왔다. 하지만 많은 공개저장소의 설립되었지만 마이크로어레이 데이터의 구조적 특징을 고려하여 효과적인 설계를 하지 않은 것이 사실이다. 본 논문은 표준을 따르는 동시에 마이크로어레이 데이터의 구조적 빈발 패턴이 반복되는 계층적 특징을 반영하는 전략을 제안한다. 이를 통하여 복잡한 데이터의 구조를 객체들의 빈발 패턴을 파악하여 그 계층을 줄임으로서 복잡도를 줄일 수 있었다. 이 과정에서 관계형 데이터베이스 기반의 공개저장소의 성능에 영향을 주는 관계 테이블(join-table)의 숫자는 줄어든다. 이에 따라, 성능은 개선된다. 이 전략을 통하여 생성된 테이블의 숫자는 원본 데이터를 단순 매핑시켜 저장하는 방법에 비하여 약 31%줄어든다. 결국 MAGE-ML 데이터의 저장과 로딩 시간은 이 논문에서 제시하는 전략을 적용하지 않은 방법에 비해 60%에서 65%를 줄일 수 있었다.

  • PDF

IDE Design for Microarray Analysis Based on Accumulative Knowledge (지식축적기반 마이크로어레이 분석 통합개발환경 프로그램 설계)

  • Seok, Min-Seok;Choi, Ji-Hye;Oh, Se-Jong
    • Proceedings of the KAIS Fall Conference
    • /
    • 2010.05b
    • /
    • pp.1201-1204
    • /
    • 2010
  • 최근, 마이크로어레이 실험 데이터의 품질과 재 생산성에 대한 신뢰도가 증가했기 때문에 마이크로어레이 데이터의 공유 및 활용에 대한 요구가 꾸준히 증가하고 있다. 하지만, 개별적으로 진행되는 이 실험에서, 연구자는 각각의 실험계획에 따른 실험을 위해 별도로 실험계획을 하고, 그에 따른 단편적인 결과를 얻을 뿐, 이를 다시 재활용 하는 방안에는 microarray databases를 이용하는 것만이 전부였다. 하지만, 이 방법은 일반 생물학자들이, 다시 데이터베이스를 이용해서 분석하는데 많은 어려움을 가져왔고, 또한 각각의 실험 과정을 이용하는 과정에서도, 통합개발환경을 구축하지 못 한 것에 대해 시간적 손해를 많이 입고 있다. 이에 본 논문에서는 실험계획부터 자료의 표준화 및 시각화, 유의한 유전자 탐색, 군집분석, 분류분석을 할 수 있는 통합개발환경 프로그램에 대해 제시하고, 결론적으로 이 데이터를 효과적으로 재활용 할 수 있는 방안에 대해서 제시하였다. 결론적으로, 이 프로그램은 개별적인 통계 프로그램으로 분석을 할 때에 비해, 편의성이 향상하며, 시간적인 소모를 줄임으로써, 상당히 많은 이득을 얻을 수 있으며, 한번 분석한 데이터를 효율적으로 저장해 놓음으로써, 추후에 제 2,3의 데이터 가공을 통해, 더 많은 정보를 얻어 낼 수 있다.

  • PDF

Preparation of Oligonucleotide Arrays with High-Density DNA Deposition and High Hybridization Efficiency

  • Park, Jeong-Won;Jung, Yong-Won;Jung, Young-Hwan;Seo, Jeong-Sun;Lee, Young-Hoon
    • Bulletin of the Korean Chemical Society
    • /
    • v.25 no.11
    • /
    • pp.1667-1670
    • /
    • 2004
  • In DNA microarray produced by DNA-deposition technology, DNA-immobilization and -hybridization yields on a solid support are most important factors for its accuracy and sensitivity. We have developed a dendrimeric support using silylated aldehyde slides and polyamidoamine (PAMAM) dendrimers. An oligonucleotide array was prepared through a crosslinking between the dendrimeric support and an oligonucleotide. Both DNAimmobilization and -hybridization yields on the solid support increased by the modification with the dendrimers. The increase of the immobilization and hybridization efficiency seems to result from a threedimensional arrangement of the attached oligonucleotide. Therefore, our dendrimeric support may provide a simple and efficient solution to the preparation of DNA microarrays with high-density DNA-deposition and high hybridization efficiency.

Simultaneous Optimization of Gene Selection and Tumor Classification Using Intelligent Genetic Algorithm and Support Vector Machine

  • Huang, Hui-Ling;Ho, Shinn-Ying
    • Proceedings of the Korean Society for Bioinformatics Conference
    • /
    • 2005.09a
    • /
    • pp.57-62
    • /
    • 2005
  • Microarray gene expression profiling technology is one of the most important research topics in clinical diagnosis of disease. Given thousands of genes, only a small number of them show strong correlation with a certain phenotype. To identify such an optimal subset from thousands of genes is intractable, which plays a crucial role when classify multiple-class genes express models from tumor samples. This paper proposes an efficient classifier design method to simultaneously select the most relevant genes using an intelligent genetic algorithm (IGA) and design an accurate classifier using Support Vector Machine (SVM). IGA with an intelligent crossover operation based on orthogonal experimental design can efficiently solve large-scale parameter optimization problems. Therefore, the parameters of SVM as well as the binary parameters for gene selection are all encoded in a chromosome to achieve simultaneous optimization of gene selection and the associated SVM for accurate tumor classification. The effectiveness of the proposed method IGA/SVM is evaluated using four benchmark datasets. It is shown by computer simulation that IGA/SVM performs better than the existing method in terms of classification accuracy.

  • PDF

Quality Measures for Microarray Design and Experiments (마이크로어레이 설계과 실험을 위한 품질평가함수)

  • Kim, Pan-Gyu;Jin, Bee-Jeong;Cho, Hwan-Gue
    • Proceedings of the Korean Society for Bioinformatics Conference
    • /
    • 2003.10a
    • /
    • pp.155-163
    • /
    • 2003
  • 마이크로어레이를 이용한 발현실험이 기하급수적으로 늘어남에 따라 마이크로어레이이미지를 자동으로 처리하는 기술에 대한 요구가 커지고 있고, 이에 대한 연구도 많아지고 있다. 마이크로어레이 이미지를 자동으로 처리하기 위해서는 각 이미지가 가지고 있는 스팟 패턴를 알아보고, 자동화 정도를 측정할 수 있는 품질평가함수가 필요하다. 우리는 본 논문에서 마이크로어레이 이미지 분석의 자동화에 대한 평가를 도와주는 스팟 패턴의 품질평가함수(quality measure)를 정의하고, 각 실험이 얼마나 잘 이루어졌는지를 예측할 수 있는 품질제어평가함수(quality control measure)를 정의한다. 또한 마이크로어레이 실험과 이미지에 대한 품질을 평가하기 위해서 이미지내의 블럭들과 스팟들에 대한 통계량을 이용하고, 스팟들의 발현값에 대한 정확도를 측정하기 위한 품질평가함수들을 정의한다. 이러한 품질평가함수의 측정을 위해서 최대정규정점의 집합(maximal regular point set)과 메타그리드를 이용한다.

  • PDF

The Design and Implement on Tumor Classification Model Based on Microarray (마이크로어레이 기반 종양 분류 모델 설계와 구현)

  • Park, Su-Young;Jung, Chai-Yeoung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2007.11a
    • /
    • pp.713-716
    • /
    • 2007
  • 오늘날 인간 프로젝트와 같은 종합적인 연구의 궁극적 목적을 달성하기 위해서는 이들 연구로부터 획득한 대량의 관련 데이터에 대해 새로운 현실적 의미를 부여할 수 있어야 한다. 따라서 현재의 마이크로어레이 기술을 이용해서 효과적으로 종양을 분류하기 위해서는 특정 종양 분류와 밀접하게 관련이 있는 정보력 있는 유전자를 선택하는 과정이 필수적이다. 본 논문에서는 암에 걸린 흰쥐 외피 기간 세포 분화 실험에서 얻어진 3840 유전자의 마이크로어레이 cDNA를 이용해 데이터의 정규화를 거쳐 유사성 척도 방법으로 정보력 있는 유전자들을 추출한 후, DT, NB, SVM, MLP 알고리즘을 이용하여 클래스 분류 모델을 구축하고, 성능을 비교분석하였다. 피어슨 적률 상관 계수를 이용하여 선택된 50 유전자들을 멀티퍼셉트론 분류기로 분류한 결과 94.8%의 정확도를 보여 가장 최적의 조합을 보였다.

  • PDF

Detection of Neural Fates from Random Differentiation : Application of Support Vector MachineMin

  • Lee, Min-Su;Ahn, Jeong-Hyuck;Park, Woong-Yang
    • Genomics & Informatics
    • /
    • v.5 no.1
    • /
    • pp.1-5
    • /
    • 2007
  • Embryonic stem cells can be differentiated into various types of cells, requiring a tight regulation of transcription. Biomarkers related to each lineage of cells are used to guide the differentiation into neural or any other fates. In previous experiments, we reported the guided differentiation (GD)-specific genes by comparing profiles of random differentiation (RD). Interestingly 68% of differentially expressed genes in GD overlap with that of RD, which makes it difficult for us to separate the lineages by examining several markers. In this paper, we design a prediction model to identify the differentiation into neural fates from any other lineage. From the profiles of 11,376 genes, 203 differentially expressed genes between neural and random differentiation were selected by random variance T-test with 95% confidence and 5% false discovery rate. Based on support vector machine algorithm, we could select 79 marker genes from the 203 informative genes to construct the optimal prediction model. Here we propose a prediction model for the prediction of neural fates from random differentiation which is constructed with a perfect accuracy.