• Title/Summary/Keyword: 유전자 분석

Search Result 4,618, Processing Time 0.032 seconds

A review of gene selection methods based on machine learning approaches (기계학습 접근법에 기반한 유전자 선택 방법들에 대한 리뷰)

  • Lee, Hajoung;Kim, Jaejik
    • The Korean Journal of Applied Statistics
    • /
    • v.35 no.5
    • /
    • pp.667-684
    • /
    • 2022
  • Gene expression data present the level of mRNA abundance of each gene, and analyses of gene expressions have provided key ideas for understanding the mechanism of diseases and developing new drugs and therapies. Nowadays high-throughput technologies such as DNA microarray and RNA-sequencing enabled the simultaneous measurement of thousands of gene expressions, giving rise to a characteristic of gene expression data known as high dimensionality. Due to the high-dimensionality, learning models to analyze gene expression data are prone to overfitting problems, and to solve this issue, dimension reduction or feature selection techniques are commonly used as a preprocessing step. In particular, we can remove irrelevant and redundant genes and identify important genes using gene selection methods in the preprocessing step. Various gene selection methods have been developed in the context of machine learning so far. In this paper, we intensively review recent works on gene selection methods using machine learning approaches. In addition, the underlying difficulties with current gene selection methods as well as future research directions are discussed.

Large-Scale Bayesian Genetic Network Learning for Pharmacogenomics (Pharmacogenomics를 위한 대규모 베이지안 유전자망 학습)

  • 황규백;장병탁
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.139-141
    • /
    • 2001
  • Pharmacogenomics는 개인의 유전적 성향과 약물에 대한 반응간의 관계에 대해 연구하는 학문이다. 이를 위해 DNA microarray 데이터를 비롯한 대량의 생물학 데이터가 구축되고 있으며 이러한 대규모 데이터를 분석하기 위해서 기계학습과 데이터 마이닝의 여러 기법들이 이용되고 있다. 본 논문에서는 pharmacogenomics를 위한 생물학 데이터의 효율적인 분석 수단으로 베이지안망(Bayesian network)을 제시한다. 배이지안망은 다수의 변수들간의 확률적 관계를 표현하는 확률그래프모델(probabilistic graphical model)로 유전자 발현과 약물 반응 사이의 확률적 의존 관계를 분석하는데 적합하다. NC160 cell lines dataset으로부터 학습된 베이지안 유전자망(Bayesian genetic network)이 나타내는 관계는 생물학적 실험을 통해 검증된 실제 관계들을 다수 포함하며, 이는 배이지안 유전자망 분석을 통해 개략적인 유전자-유전자, 약물-약물, 유전자-약물 관계를 효율적으로 파악할 수 있음을 나타낸다.

  • PDF

A Method for Gene Group Analysis and Its Application (유전자군 분석의 방법론과 응용)

  • Lee, Tae-Won;Delongchamp, Robert R.
    • The Korean Journal of Applied Statistics
    • /
    • v.25 no.2
    • /
    • pp.269-277
    • /
    • 2012
  • In microarray data analysis, recent efforts have focused on the discovery of gene sets from a pathway or functional categories such as Gene Ontology terms(GO terms) rather than on individual gene function for its direct interpretation of genome-wide expression data. We introduce a meta-analysis method that combines $p$-values for changes of each gene in the group. The method measures the significance of overall treatment-induced change in a gene group. An application of the method to a real data demonstrates that it has benefits over other statistical methods such as Fisher's exact test and permutation methods. The method is implemented in a SAS program and it is available on the author's homepage(http://cafe.daum.net/go.analysis).

Program Development of Integrated Expression Profile Analysis System for DNA Chip Data Analysis (DNA칩 데이터 분석을 위한 유전자발연 통합분석 프로그램의 개발)

  • 양영렬;허철구
    • KSBB Journal
    • /
    • v.16 no.4
    • /
    • pp.381-388
    • /
    • 2001
  • A program for integrated gene expression profile analysis such as hierarchical clustering, K-means, fuzzy c-means, self-organizing map(SOM), principal component analysis(PCA), and singular value decomposition(SVD) was made for DNA chip data anlysis by using Matlab. It also contained the normalization method of gene expression input data. The integrated data anlysis program could be effectively used in DNA chip data analysis and help researchers to get more comprehensive analysis view on gene expression data of their own.

  • PDF

undefined (난자와 배아의 유전자 발현 양상을 분석을 위한 효과적인 Real Time RT-PCR 방법)

  • 정유정;신현상;최혜원;최향순;김남형;전진현
    • Proceedings of the KSAR Conference
    • /
    • 2004.06a
    • /
    • pp.205-205
    • /
    • 2004
  • 최근에 개발된 real time RT-PCR 방법은 소량의 시료에서 특정 유전자의 mRNA 발현 양상을 분석하는데 효율적으로 이용되고 있다. 특히, 난자 또는 배아와 같이 성숙과 발생단계에 따라 유전자의 발현 양상이 현저하게 변화되는 경우에는, 각각의 시료에서 발현 양상이 크게 변하지 않는 대조군으로 사용할 수 있는 유전자를 이용한 비교, 분석이 중요하다. 본 연구에서는 생쥐의 난자와 초기 배아를 이용한 real time RT-PCR에서 mRNA의 추출방법과 형광 probe의 사용 유무 그리고 대조군으로 사용되고 있는 유전자들에 대한 검증을 시행하였다. (중략)

  • PDF

Gene Expression Data Analysis Using Bayesian Networks (베이지안망을 이용한 유전자 발현 테이터의 분석)

  • 황규백;장병탁;김영택
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.301-303
    • /
    • 2001
  • 최근 DNA 칩 또는 마이크로어레이 기술의 발전으로 인해 한 세포 내의 수천 개의 유전자의 발현 정도를 동시에 측정할 수 있게 되었다. 이러한 마이크로어레이 데이터를 분석해서 암의 경과나 세포의 주기적 변화 등에 영향을 미치는 유전자들을 알아낼 수 있다. 본 논문에서는 베이지안망을 이용해서 마이크로어레이 데이터를 분석, 백혈병의 경과를 예측한다. 베이지안망은 다수의 변수들간의 확률적 관계를 표현하는 그래프 모델로 각 유전자들간의 확률적 관계를 표현하는 그래프 모델로 각 유전자들간의 확률적 관계를 사람이 알아보기 쉬운 형태로 학습할 수 있다는 장점이 있다. 마이크로어레이 데이터에 대해서 학습된 베이지안망은 백혈병 경과 예측에 대해서 기존의 방법보다 뛰어난 성능을 보였다.

  • PDF

An XML-Based Analysis Tool for Gene Prediction Results (XML기반의 유전자 예측결과 분석도구)

  • Kim Jin-Hong;Byun Sang-Hee;Lee Myung-Joon;Park Yang-Su
    • The KIPS Transactions:PartD
    • /
    • v.12D no.5 s.101
    • /
    • pp.755-764
    • /
    • 2005
  • Recently, as it is considered more important to identify the function of ail unknown genes in living things, many tools for gene prediction have been developed to identify genes in the DNA sequences. Unfortunately, most of those tools use their own schemes to represent their programs results, requiring researchers to make additional efforts to understand the result generated by them So, it is desirable to provide a standardized method of representing predicted gene information, which makes it possible to automatically produce the predicted results for a given set of gene data In this paper, we describe an effective U representation for various predicted gene information, and present an XML-based analysis tool for gene predication results based on this representation. The developed system helps users of gene prediction tools to conveniently analyze the predicted results and to automatically produce the statistical results of the prediction. To show the usefulness of the tool, we applied our programs to the results generated by GenScan and GeneID, which are widely used gene prediction systems.

Expression Patterns of the Differentially Expressed Genes During Growth Stages of Hanwoo(Korean Cattle) (한우 성장단계 특이발현 유전자의 발현양상 분석)

  • Jang, Y.S.;Yoon, D.H.;Kim, T.H.;Cheong, I.C.;Jo, J.K.
    • Journal of Animal Science and Technology
    • /
    • v.44 no.6
    • /
    • pp.677-684
    • /
    • 2002
  • We have investigated the expression patterns of candidates for growth stage specifically expressed genes. The expression patterns of the EPV20, aldolase A, Translationally Controlled Tumor Protein (TCTP) and Adipocyte Differentiation Related Protein (ADRP) were examined by semiquantitative RT-PCR and northern blot analysis in skeletal muscle tissues of Hanwoo, especially in the longissimus dorsi at various growth stages. The EPV20 mRNA was expressed in longissimus dorsi tissue of Hanwoo, but there was no difference of expression levels during growth stages. Though the aldolase A gene was reported to be muscle-specific and regulated at developmental stages, the expression levels of aldolase A mRNA in the longissimus dorsi tissues showed little differences at various growth stages. The expression levels of TCTP which was reported as growth-related protein regulated at translation step were gradually increased during growth of Hanwoo. The expression levels of ADRP mRNA were rapidly increased at 24-month-old longissimus dorsi tissue of Hanwoo, and decreased at 30-month-old. Our data suggest that the ADRP gene show as growth-stage dependent expression and is related to fat deposition within muscular tissue.

A Gene-list Identification Methology on the Initial Stage of Genome Project (유전체 분석 초기 단계에서 유전자 리스트 작정을 위한 방법론)

  • 오정수;안명상;조완섭;권해룡;김영창
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2003.11a
    • /
    • pp.343-346
    • /
    • 2003
  • To predict and analyze genes, many methods and tools are already developed in Bioinformatics field which is being more important in future. And many biologists have now performed the research with them. Although it is possible to identify gene and to analyze its function efficiently without experimental methods, it is still hard work. In this paper, we propose a method that make gene list on the initial stage of Genome project. It is difficult to obtain detailed gene list in the initial stage of Genome project. but proposed system provides gene information as much as possible even in the initial stage.

  • PDF

Epigenomic Control System for Cancer-Related Genes Based on Network (네트워크 기반 암 관련 유전자의 후성유전학적 제어 시스템)

  • Kim, Hak Yong
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2012.05a
    • /
    • pp.169.2-169.2
    • /
    • 2012
  • 암 관련 유전자를 후성유전학적으로 제어하는 방법에는 miRNA, DNA 메틸화, 그리고 히스톤 단백질의 변형에 의해서 가능하다. 그러나 후성유전학적 방법을 통해서 암 관련 유전자를 제어하기 위해서는 첫째, 한 유전자에 여러 miRNA들에 의해서 조절되기 때문에 선택의 문제가 있으며, 둘째, 암 관련 유전자를 제어하는 DNA 메틸화 패턴이 다양하며, 셋째, 히스톤 단백질의 변형 자체가 다양하며 각 유전자에 대한 히스톤 변형의 특이성이 있다. 따라서 후성유전학 기반 하에서 암 관련 유전자를 제어하기 위해서는 시스템 수준에서의 접근이 바람직하다. 본 연구에서는 암 관련 유전자의 네트워크를 구축하고, 이 네트워크를 기반으로 암 유전자를 제어하는 miRNA에 최우선 순위를 부여하는 방법, 암 유전자의 DNA 메틸화 모티프 패턴을 분석하는 방법, 히스톤 변형과 암 관련유전자의 상관관계를 분석하는 방법을 제시하고자 한다.

  • PDF