• Title/Summary/Keyword: 유전자 예측

Search Result 503, Processing Time 0.025 seconds

Knowledge based Genetic Algorithm for the Prediction of Peptides binding to HLA alleles common in Koreans (지식기반 유전자알고리즘을 이용한 한국인 빈발 HLA 대립유전자에 대한 결합 펩타이드 예측)

  • Cho, Yeon-Jin;Oh, Heung-Bum;Kim, Hyeon-Cheol
    • Journal of Internet Computing and Services
    • /
    • v.13 no.4
    • /
    • pp.45-52
    • /
    • 2012
  • T cells induce immune responses and thereby eliminate infected micro-organisms when peptides from the microbial proteins are bound to HLAs in the host cell surfaces, It is known that the more stable the binding of peptide to HLA is, the stronger the T cell response gets to remove more effectively the source of infection. Accordingly, if peptides (HLA binder) which can be bound stably to a certain HLA are found, those peptieds are utilized to the development of peptide vaccine to prevent infectious diseases or even to cancer. However, HLA is highly polymorphic so that HLA has a large number of alleles with some frequencies even in one population. Therefore, it is very inefficient to find the peptides stably bound to a number of HLAs by testing random possible peptides for all the various alleles frequent in the population. In order to solve this problem, computational methods have recently been developed to predict peptides which are stably bound to a certain HLA. These methods could markedly decrease the number of candidate peptides to be examined by biological experiments. Accordingly, this paper not only introduces a method of machine learning to predict peptides binding to an HLA, but also suggests a new prediction model so called 'knowledge-based genetic algorithm' that has never been tried for HLA binding peptide prediction. Although based on genetic algorithm (GA). it showed more enhanced performance than GA by incorporating expert knowledge in the process of the algorithm. Furthermore, it could extract rules predicting the binding peptide of the HLA alleles common in Koreans.

Prediction of promoter by Backpropagation (Backpropagation을 이용한 Promoter 예측 방법)

  • 허미영;김홍기;최진성
    • Proceedings of the IEEK Conference
    • /
    • 2003.07d
    • /
    • pp.1569-1572
    • /
    • 2003
  • 최근 생명공학 분야의 기술이 혁신적으로 발달함에 따라 게놈 프로젝트가 본래 계획보다 2년 앞당겨져 2003 년 4 월 인간 유전자의 완전한 서열을 밝히고 성공적으로 완료됨으로서 관련 연구자들은 인간의 유전자에 대한 대량의 서열 데이터를 얻게 되었다. 그래서 게놈 프로젝트의 다음 단계로서 엄청난 양의서열 정보 분석으로부터 유전자의 기능을 파악하고자 하는 연구들이 이미 세계적으로 활발히 진행되고 있다. 이러한 연구들의 최종적 목표는 질병 치료와 생명연장의 실현이라고 볼 수 있다. 유전자 연구를 위해선 우선 일차적으로 유전자 부위를 파악해야 한다. 유전자는 구조적으로 다시 여러 부분으로 나뉘는데 유전자 발현의 개시에 매우 중요한 요소 중 하나가 바로 프로모터 (Promoter) 이다. 프로모터 내에는 TATA box 가 있는데 이는 프로모터의 핵심 요소이다. 프로모터는 생명체의 종 그리고 RNA 중합효소의 종류에 따라 다르다. 이 논문에서는 다양한 신경망 알고리즘 중의 하나인 Backtpropagation 을 이용하여 밝혀지지 알은 서열에서 인간을 포함하는 원핵생물의 프로모터 서열을 예측할 수 있는 방법을 얻었기에 소개하고자 한다.

  • PDF

A Study on Trajectory Prediction of Flight Target using Genetic Algorithm (유전자 알고리즘을 이용한 비행 표적의 궤적 예측 연구)

  • Lee, Jaeha;Oh, Jun Ho;Lee, Sang Hwa;Park, Kayoung;Park, Jong-Il
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2016.06a
    • /
    • pp.329-331
    • /
    • 2016
  • 일반적으로, 비행 표적의 궤적을 예측하기 위해 회귀분석이 사용되어왔다. 그러나 이 방법은 표적이 매우 다이내믹한 움직임을 보일 경우에는 오차가 크다는 한계가 있다. 이러한 문제를 해결하기 위해 본 논문에서는 다양한 수식을 생산해 내는 유전자 알고리즘을 이용하여 비행 표적의 다음 궤적을 예측해 내는 방법을 제안한다. 유전자 알고리즘을 통해 생산된 예측식을 토대로 비행 표적의 궤적을 3D 형태로 시각화 하였으며, 실제 관측 데이터와 예측된 데이터의 오차를 통해 정확도를 검증하였다.

  • PDF

The gene prediction method considering stages of cancer, obtained by integrating gene expression, genetic interaction data and document (문헌정보와 유전자 발현 및 상호 작용 데이터를 통합, 암의 단계를 고려한 질병 유전자 예측 방법)

  • Kim, Jungrim;Yeu, Yunku;Park, Sanghyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.1113-1116
    • /
    • 2013
  • 유전체에 대한 관심이 크게 증가하면서, 이에 따른 다양한 연구가 이루어졌다. 그 결과 유전체와 관련된 다양한 종류의 데이터가 얻어졌으며, 그것을 해석하고 다른 데이터와 통합하는 것이 중요한 연구과제 중 하나가 되었다. 본 논문은 유전자 상호작용(genetic interaction) 데이터, 유전자 발현 데이터, 문헌으로부터 텍스트마이닝 기술을 통해 얻은 이종(heterogeneous) 데이터를 통합하여 암과 관련이 있는 유전자를 찾는 실험을 수행하였다. 또한, 단순히 질병(disease)-정상(normal)의 대조가 아니라 암의 단계(stage)를 고려한 실험을 수행하였다. 데이터를 통합하지 않거나 암의 단계를 고려하지 않았을 경우에 비하여 제안하는 방법이 더 높은 유전자 예측 성능을 나타냈다.

Prediction model of plasma deposition process using genetic algorithm and generalized regression neural network (유전자 알고리즘과 일반화된 회귀신경망을 이용한 플라즈마 증착공정 예측모델)

  • Lee, Duk-Woo;Kim, Byung-Whan
    • Proceedings of the Korean Institute of Electrical and Electronic Material Engineers Conference
    • /
    • 2004.07b
    • /
    • pp.1117-1120
    • /
    • 2004
  • 경제적인 공정분석과 최적화를 위해서는 컴퓨터를 이용한 플라즈마 예측모델이 요구되고 있다. 본 연구에서는 일반화된 회귀 신경망 (GRNN)을 이용하여 플라즈마 증착공정 모델을 개발한다. GRNN의 예측성능은 패턴층 뉴런의 가우시안 함수를 구성하는 학습인자, 즉 spread에 의존한다. 종래의 모델에서는 모든 가우시안 함수의 spread가 동일한 값에서 최적화되었으며, 이로 인해 모델의 예측성능을 향상시키는 데에는 한계가 있었다. 본 연구에서는 유전자 알고리즘 (GA)를 이용하여 다변수 spread를 최적화하는 기법을 개발하였으며, 그 성능을 PECVD 공정에 의해 증착된 SiN 박막의 증착률에 적용하여 평가하였다. $2^{6-1}$ 부분인자 실험계획법에 의해 수집된 데이터를 이용하여 신경망을 학습하였고, 모델적합성 점검을 위해 별도의 12번의 실험을 수행하였다. 가우시안 함수의 spread는 0.2에서 2.0까지 0.2간격으로 증가시켰으며, 최적화한 GA-GRNN모델의 예측성능은 6.6 ${\AA}/min$이었다. 이는 종래의 방식으로 최적화한 모델의 예측성능 (13.5 ${\AA}/min$)과 비교하여 50.7% 향상된 예측성능이며, 이러한 향상은 제안한 GA-GRNN 모델이 플라즈마 공정 모델의 예측성능을 증진하는데 매우 효과적임을 보여준다.

  • PDF

강우량 추정에서 유전자 알고리즘을 활용한 크리깅 방법의 적용

  • Ryu, Je-Seon;Park, Yeong-Seon;Cha, Gyeong-Jun
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2003.10a
    • /
    • pp.295-300
    • /
    • 2003
  • 공간적으로 영향을 받는 위치에서의 상호 연관성을 고려한 예측모형 중에서 크리깅 (kriging) 방법은 관측된 데이터를 보간(interpolation)하고, 부드럽게 연결(smoothing)하며, 새로운 데이터를 예측(prediction)하는 통계적 모형으로서 많이 활용되고 있다. 크리깅 모형을 적용하기 위해서는 먼저 주어진 두 위치에서의 비연관성을 나타내는 세미베리오그램 (semivariogram)의 3가지 모수(nugget, sill, range)를 추정해야 한다. 본 연구에서는 전역 적 최적화 방법인 유전자 알고리즘(genetic algorithm)을 도입하여 세미베리오그램 모수들을 추정하였고, 이를 통해 강우량(rainfall)에 대한 크리깅 추정량을 산출하고 효과성을 판단하였다.

  • PDF

A Study On the Application Methods of a Support Vector Machine for Gene Promoter Prediction. (유전자 프로모터 예측을 위한 Support Vector Machine의 응용 방법에 대한 연구)

  • Kim, Ki-Bong
    • Journal of Life Science
    • /
    • v.17 no.5 s.85
    • /
    • pp.714-718
    • /
    • 2007
  • The high-throughput sequencing of a lot of genomes has resulted in the relatively rapid accumulation of an enormous amount of genomic sequence data. In this context, the problem posed by the detection of promoters in genomic DNA sequences via computational methods has attracted considerable attention in recent years since exact promoter prediction can give a clue to the elucidation of overall genetic networks. In this study, applications of support vector machine(SVM) to promoter prediction are explored to show a right approaches to discriminate between promoter and non-promoter regions by means of SVM. The results of various experiments show that encoding method, encoding region and learning data constitution can play an important role in the performance of SVM.

A hybrid method to compose an optimal gene set for multi-class classification using mRMR and modified particle swarm optimization (mRMR과 수정된 입자군집화 방법을 이용한 다범주 분류를 위한 최적유전자집단 구성)

  • Lee, Sunho
    • The Korean Journal of Applied Statistics
    • /
    • v.33 no.6
    • /
    • pp.683-696
    • /
    • 2020
  • The aim of this research is to find an optimal gene set that provides highly accurate multi-class classification with a minimum number of genes. A two-stage procedure is proposed: Based on minimum redundancy and maximum relevance (mRMR) framework, several statistics to rank differential expression genes and K-means clustering to reduce redundancy between genes are used for data filtering procedure. And a particle swarm optimization is modified to select a small subset of informative genes. Two well known multi-class microarray data sets, ALL and SRBCT, are analyzed to indicate the effectiveness of this hybrid method.

Predicting Survival of DLBCL Patients in Pathway-Based Microarray Analysis (DLBCL 환자의 대사경로 정보를 이용한 생존예측)

  • Lee, Kwang-Hyun;Lee, Sun-Ho
    • The Korean Journal of Applied Statistics
    • /
    • v.23 no.4
    • /
    • pp.705-713
    • /
    • 2010
  • Predicting survival from microarray data is not easy due to the problem of high dimensionality of data and the existence of censored observations. Also the limitation of individual gene analysis causes the shift of focus to the level of gene sets with functionally related genes. For developing a survival prediction model based on pathway information, the methods for selecting a supergene using principal component analysis and testing its significance for each pathway are discussed. Besides, the performance of gene filtering is compared.

Prediction of highly reliable miRNAs related immune and development based on network (네트워크 기반 면역 및 발생관련 최적 miRNA 예측)

  • Lee, Jihoo;Lee, Hyun Jae;Kim, Hak Yong
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2013.05a
    • /
    • pp.373-374
    • /
    • 2013
  • MicroRNA(miRNA)는 단일가닥 RNA 분자로서 유전자 발현을 제어하는 조절인자이다. miRNA에 의해 조절되는 대부분 유전자는 다수의 miRNA에 의하여 조절되어질 수 있기 때문에 최적 miRNA의 선별은 매우 중요하다. 본 연구에서는 먼저 면역 및 발생관련 유전자 상호작용 네트워크를 구축하였다. 이 네트워크에 miRNA 정보를 추가함으로써 유전자간의 상호작용 뿐만아니라 유전자와 miRNA의 상호작용을 분석할 수 있는 기반을 조성하였다. 복잡한 네트워크를 단순화시켜 기능 모듈과 구조 모듈을 도출하고 이로부터 핵심 유전자를 조절하는 최적 miRNA를 예측하였다.

  • PDF