• Title/Summary/Keyword: 마이크로어레이실험

Search Result 100, Processing Time 0.023 seconds

Performance Comparison of Multiclass Classification Methods for cancer Classification (암 분류를 위한 분류기법의 성능비교)

  • Park Yun-Jung;Park Seung-Soo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06b
    • /
    • pp.220-222
    • /
    • 2006
  • 현재 마이크로어레이 기술은 대량의 유전자 발현 데이터 특히 암과 관련한 데이터들을 쏟아내고 있다. 이 데이터를 기반으로 암의 종류에 따른 유전자들의 차별적 발현 양상을 분석하고 발현량의 변화가 두드러지는 유전자들에 기반하여 암을 분별할 수 있는 분류 모델을 구축한 후, 이것을 암을 진단하거나 예측하는데 이용할 수 있다. 본 논문에서는 마이크로어레이 데이터를 사용해 특징추출방법과 분류를 위한 Naive Bayes, k-Nearest Neighborhood, Decision Tree, Support Vector Machine, Neural Network 알고리즘을 이용하여 최적의 조합을 찾고 어떤 알고리즘이 가장 효과적인지 실험을 통해 분석해보고 성능평가 하는 것을 목표로 한다.

  • PDF

Hybrid Gene Selection Method for Cancer Classification (암 분류를 위한 하이브리드 유전자 선택 기법)

  • Piao, Yongjun;Hiep, Vu Quang;Erdenetuya, Namsrai;Piao, Minghao;Ryu, Keun-Ho
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06c
    • /
    • pp.154-156
    • /
    • 2012
  • 암 분류를 위한 마이크로어레이 데이터로부터의 유전자 선택은 최근 각광을 받고 있는 연구분야이다. 마이크로어레이 데이터는 적은 샘플 수에 비해 대규모의 유전자로 구성된다. 그렇기 때문에 분류의 정확도를 높이기 위하여 대상 암과 관련된 유전자만 선택할 수 있는 차원 축소 기법이 필요하다. 따라서 본 논문에서는 Symmetrical Uncertainty와 Support Vector Machine (SVM)을 이용한 하이브리드 속성선택 기법을 제안하였다. 제안한 기법은 실험 결과를 통해 다른 속성 선택 기법보다 좋은 성능을 보여주었다.

Inference of Disease Module using Bayesian Network by Genetic Algorithm (유전자 알고리즘으로 학습한 베이지안 네트워크에 기초한 질병 모듈 추론)

  • Jeong, Da-Ye;Yeu, Yun-ku;Ahn, Jae-Gyoon;Park, Sang-Hyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.1117-1120
    • /
    • 2013
  • 사람의 질병은 여러 요인의 복합적인 작용으로 발생하는데 이 중 유전적인 요인에는 유전자 간의 상호작용을 들 수 있다. 마이크로어레이(Microarray) 데이터로부터 유전자의 활성화 및 억제 관계를 밝히려는 다양한 시도는 계속되어왔다. 그러나 마이크로어레이 자체가 갖는 불안정성과 실험조건 수의 제약이 커다란 장애가 되어 왔다. 이에 생물학적 사전 지식을 포함하는 방법들이 제안되었다. 본 논문에서는 질병과 관련된 유전자 간의 상호작용의 집합을 질병 모듈이라 정의하고 이를 유전자 알고리즘으로 학습한 베이지안 네트워크(Bayesian network)로 추론하는 방법을 제안한다.

Ovarian Cancer Microarray Data Classification System Using Marker Genes Based on Normalization (표준화 기반 표지 유전자를 이용한 난소암 마이크로어레이 데이타 분류 시스템)

  • Park, Su-Young;Jung, Chai-Yeoung
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.15 no.9
    • /
    • pp.2032-2037
    • /
    • 2011
  • Marker genes are defined as genes in which the expression level characterizes a specific experimental condition. Such genes in which the expression levels differ significantly between different groups are highly informative relevant to the studied phenomenon. In this paper, first the system can detect marker genes that are selected by ranking genes according to statistics after normalizing data with methods that are the most widely used among several normalization methods proposed the while, And it compare and analyze a performance of each of normalization methods with mult-perceptron neural network layer. The Result that apply Multi-Layer perceptron algorithm at Microarray data set including eight of marker gene that are selected using ANOVA method after Lowess normalization represent the highest classification accuracy of 99.32% and the lowest prediction error estimate.

Developing a Parametric Method for Testing the Significance of Gene Sets in Microarray Data Analysis (마이크로어레이 자료분석에서 모수적 방법을 이용한 유전자군의 유의성 검정)

  • Lee, Sun-Ho;Lee, Seung-Kyu;Lee, Kwang-Hyun
    • Communications for Statistical Applications and Methods
    • /
    • v.16 no.3
    • /
    • pp.397-408
    • /
    • 2009
  • The development of microarray technology makes possible to analyse many thousands of genes simultaneously. While it is important to test each gene whether it shows changes in expression associated with a phenotype, human diseases are thought to occur through the interactions of multiple genes within a same functional cafe-gory. Recent research interests aims to directly test the behavior of sets of functionally related genes, instead of focusing on single genes. Gene set enrichment analysis(GSEA), significance analysis of microarray to gene-set analysis(SAM-GS) and parametric analysis of gene set enrichment(PAGE) have been applied widely as a tool for gene-set analyses. We describe their problems and propose an alternative method using a parametric analysis by adopting normal score transformation of gene expression values. Performance of the newly derived method is compared with previous methods on three real microarray datasets.

Missing values imputation for time course gene expression data using the pattern consistency index adaptive nearest neighbors (시간경로 유전자 발현자료에서 패턴일치지수와 적응 최근접 이웃을 활용한 결측값 대치법)

  • Shin, Heyseo;Kim, Dongjae
    • The Korean Journal of Applied Statistics
    • /
    • v.33 no.3
    • /
    • pp.269-280
    • /
    • 2020
  • Time course gene expression data is a large amount of data observed over time in microarray experiments. This data can also simultaneously identify the level of gene expression. However, the experiment process is complex, resulting in frequent missing values due to various causes. In this paper, we propose a pattern consistency index adaptive nearest neighbors as a method of missing value imputation. This method combines the adaptive nearest neighbors (ANN) method that reflects local characteristics and the pattern consistency index that considers consistent degree for gene expression between observations over time points. We conducted a Monte Carlo simulation study to evaluate the usefulness of proposed the pattern consistency index adaptive nearest neighbors (PANN) method for two yeast time course data.

The System Of Microarray Data Classification Using Significant Gene Combination Method based on Neural Network. (신경망 기반의 유전자조합을 이용한 마이크로어레이 데이터 분류 시스템)

  • Park, Su-Young;Jung, Chai-Yeoung
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.12 no.7
    • /
    • pp.1243-1248
    • /
    • 2008
  • As development in technology of bioinformatics recently mates it possible to operate micro-level experiments, we can observe the expression pattern of total genome through on chip and analyze the interactions of thousands of genes at the same time. In this thesis, we used CDNA microarrays of 3840 genes obtained from neuronal differentiation experiment of cortical stem cells on white mouse with cancer. It analyzed and compared performance of each of the experiment result using existing DT, NB, SVM and multi-perceptron neural network classifier combined the similar scale combination method after constructing class classification model by extracting significant gene list with a similar scale combination method proposed in this paper through normalization. Result classifying in Multi-Perceptron neural network classifier for selected 200 genes using combination of PC(Pearson correlation coefficient) and ED(Euclidean distance coefficient) represented the accuracy of 98.84%, which show that it improve classification performance than case to experiment using other classifier.

Similarity Analysis between Total RNA and Amplified RNA Using Entropy Measure (엔트로피 척도를 이용한 전체 RNA와 중폭 RNA의 유사성 분석)

  • Park, Chan-Ho;Cho, Sung-Bae;Shin, Ji-Hye;Kim, Sang-Cheol;Seo, Min-Young;Yang, Sang-Hwa;Rha, Sun-Young;Chung, Hyun-Cheol
    • Proceedings of the Korean Society for Bioinformatics Conference
    • /
    • 2003.10a
    • /
    • pp.139-146
    • /
    • 2003
  • 암의 조기 발견 및 예후 예측을 위하여 마이크로어레이 데이터를 이용할 수 있다. 하지만 이를 분석하기 위해서는 40${\mu}g$ 이상의 RNA 샘플이 필요한데, 실제 임상 시료를 사용하는 경우 요구되는 충분한 양을 얻기가 어려운 단점이 있다. 따라서 소량의 RNA 샘플을 채취한 후 PCR 증폭 과정을 통하여 요구되는 양의 샘플을 얻을 수 있는 RNA 증폭 방법이 시도되고 있고, 이를 마이크로어레이 실험에 이용하기 위해서는 증폭 전후의 유사성이 보장되어야 한다. 본 논문에서는 증폭 RNA와 전체 RNA의 유사성을 비교하기 위한 새로운 방법으로 엔트로피 기반의 방법을 제시한다. 아울러 다양한 조건에 따라서 엔트로피값을 측정하여 세포주와 조직에서 엔트로피 값이 어떻게 사용될 수 있는지 체계적인 분석을 하였다.

  • PDF

Microarray 자료의 표준화 방법에 대한 고찰

  • Lee, Eun-Gyeong;Park, Tae-Seong
    • Bioinformatics and Biosystems
    • /
    • v.1 no.1
    • /
    • pp.8-16
    • /
    • 2006
  • DNA microarray 기술은 동시적으로 수천 개의 유전자의 발현상황을 탐색할 수 있다. 이 기술을 통해 얻어진 자료는 분석하기에 앞서 전처리 과정으로 배경보정 (background correction), 표준화 (normalization) 그리고 요약 (summarization)이 필요하다. 표준화란 microarray 실험에서 기술상의 문제로 첨가되는 일정한 잡음을 인식, 제거하기 위해 필요한 기법으로 그 동안 여러 방법들이 제시되어 왔다. 또한 마이크로어레이 자료의 분석을 위한 요약 방법으로도 많은 방법들이 연구되었다. 본 글에서는 표준화 방법들과 요약 방법들의 특성을 분석, 비교하고자 한다.

  • PDF

Synergistic Cytotoxic Effects by Combination Treatment of Genistein and Daidzein in Human Colorectal Cancer Cell (대장암 세포주에서 genistein과 daidzein의 병합처리에 의한 상승적인 세포독성 효과)

  • Son, Seong-Min;Lim, Seung-Hyun;Kim, Hyo-Rim;Kim, Min-Jeong;Kim, Tae-Wan;Lee, Jong-Hwa;Kim, Jong-Sik
    • Journal of Life Science
    • /
    • v.19 no.9
    • /
    • pp.1294-1298
    • /
    • 2009
  • To investigate whether isoflavone genistein and daidzein could affect cancer cell viability, human colorectal HCT116 cells were incubated with genistein or daidzein in a dose-dependent manner. Genistein decreased cancer cell viability in a dose-dependent manner, whereas daidzein did not show dramatic cytotoxic effects. We also found that 71 genes were up-regulated more than 2-fold, whereas 64 genes were down-regulated more than 2-fold with 24 hr of $50{\mu}M$ genistein treatment by our previous microarray data. Among the up-regulated genes, we selected 3 genes (DKK1, ATF3 and NAG-1) and performed RT-PCR to confirm microarray data. The results of RT-PCR were highly correlated with those of the microarray experiment. In addition, we investigated whether a combination treatment of genistein and daidzein could affect cancer cell viability. Surprisingly, the combination treatment did show synergistic cytotoxic effects detected by MTS assay. The results of RT-PCR and real-time PCR indicate that a combination of genistein and daidzein can synergistically induce NAG-1 expression in HCT116 cells. This result implies that NAG-1 induction is highly associated with synergistic cytotoxic effects induced by a combination treatment of genistein and daidzein. Overall, these results may provide a clue in explaining the anti-cancer activity of soy bean in human colorectal cancer.