• Title/Summary/Keyword: 유전자 예측

Search Result 503, Processing Time 0.03 seconds

Cleavage Site Prediction Using the Rule Extracted from Knowledge-Based Genetic Algorithm (지식기반 유전자 알고리즘에서 추출된 규칙을 이용한 Cleavage Site 예측)

  • Cho Yeun-Jin;Kim Hyeoncheol
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.247-249
    • /
    • 2005
  • Cleavage Site 분석 및 예측은 바이러스 증식에 필요한 핵심 단백질인 Protease$(3CL^{pro})$를 예측하게 하고, 예측한 Protease의 활성을 억제함으로써 바이러스 중식을 저지하게 된다. 본 연구에서는 신경망과 결정트리, 유전자 알고리즘을 이용하여 SARS-CoV의 cleavage site를 분석하고, 학습 결과에서 추출된 규칙(Rule)에 의해 cleavage site를 예측한다. 또한 신경망에서 학습된 지식(Knowledge)을 이용하여 유전자 알고리즘의 성능을 향상시키는 지식기반 유전자 알고리즘 (KBGA: Knowledge-Based Genetic Algorithm)을 제안한다.

  • PDF

Classifying Colon Cancer by Integrating Diverse Speciated Evolutionary Neural Networks (다양한 종분화 진화 신경망을 결합한 대장암 분류)

  • 김경중;조성배
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.583-585
    • /
    • 2004
  • 암의 발병을 조기에 예측하고 진단하는 것은 매우 중요하지만 그 과정이 매우 복잡하고 많은 노력이 필요하다. 암이 발생하는 원인은 매우 다양하지만 근본적으로 단백질을 형성하는 유전자에 변화가 오기 때문으로 생각해 볼 수 있다. 유전자 발현 정보로부터 기계적으로 암을 예측하기 위한 과정은 중요한 유전자의 선택, 모델의 학습, 모델을 이용한 예측과정으로 나뉘어 진다. 본 논문에서는 대장암 여부를 유전자 발현 데이터로부터 예측하기 위한 종분화 진화 신경망을 제안한다. 종분화 진화 신경망은 진화 알고리즘을 사용하여 신경망의 구조를 결정하고 종분화 알고리즘을 사용하여 다양한 개체의 생성을 유도한 후 모델의 앙상블을 통해 보다 높은 성능을 내는 방법이다 실험 결과 제안하는 방법이 대장암 예측 cross validation 테스트에서 96.5%의 높은 성능을 보였다.

  • PDF

An XML-Based Analysis Tool for Gene Prediction Results (XML 기반의 유전자 예측결과 분석도구)

  • 변상희;윤형석;안건태;박양수;이명준
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.280-282
    • /
    • 2004
  • 염기서열의 분석이 유전체에 대한 연구를 가능하게 해 줄 수 있다는 것이 밝혀짐에 따라 다양한 생명체에 대한 유전체 염기서열 분석 도구의 개발이 활발히 진행되었다. 이러한 유전자 예측 도구들은 고유의 단순 텍스트 형식으로 결과를 제공하므로 사용자는 결과를 분석하고 통계정보를 산출하는데 많은 노력이 필요하다. 본 논문에서는 유전자 예측결과를 보다 효율적으로 표현하고 분석하기 위한 XML 기반의 분석도구를 개발하였다. 개발된 시스템은 유전자 예측결과를 효과적으로 표현하는 GenStructML, 이 정보를 분석한 GenPredML과 PredAccuracyML로 구성되어 있다. GenPredML과 PredAccuracyML은 GenStructML에 대하여 뉴클레오티드 수준(nucleotide level), 엑손 수준(exon level) 그리고 신호 수준(signal level)에서의 예측 정확도(Accuracy)를 계산하고 Genbank의 정보와 비교하여 통계정보를 산출함으로써 보다 자세한 정보를 제공한다.

  • PDF

Gene Expression Data Analysis Using Bayesian Networks (베이지안망을 이용한 유전자 발현 테이터의 분석)

  • 황규백;장병탁;김영택
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.301-303
    • /
    • 2001
  • 최근 DNA 칩 또는 마이크로어레이 기술의 발전으로 인해 한 세포 내의 수천 개의 유전자의 발현 정도를 동시에 측정할 수 있게 되었다. 이러한 마이크로어레이 데이터를 분석해서 암의 경과나 세포의 주기적 변화 등에 영향을 미치는 유전자들을 알아낼 수 있다. 본 논문에서는 베이지안망을 이용해서 마이크로어레이 데이터를 분석, 백혈병의 경과를 예측한다. 베이지안망은 다수의 변수들간의 확률적 관계를 표현하는 그래프 모델로 각 유전자들간의 확률적 관계를 표현하는 그래프 모델로 각 유전자들간의 확률적 관계를 사람이 알아보기 쉬운 형태로 학습할 수 있다는 장점이 있다. 마이크로어레이 데이터에 대해서 학습된 베이지안망은 백혈병 경과 예측에 대해서 기존의 방법보다 뛰어난 성능을 보였다.

  • PDF

Research for clustering algorithm for the functional classification of genes (유전자의 기능분류를 위한 클러스터링 알고리즘 연구)

  • Han, Seok-Hyeon;Yi, Gangman
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.10a
    • /
    • pp.1149-1151
    • /
    • 2015
  • 차세대 유전정보 분석기 시퀀서의 개발은 양질의 시퀀싱 데이터를 증가시켰다. 수많은 유전정보는 유전자 분석의 새로운 연구 방향을 제시하였다. 본 논문은 유전자 분석 중에서 기존의 유전정보를 활용하여 유전자의 기능예측을 하고자 한다. 클러스터링 알고리즘의 정확도를 높이기 위해서 본 논문에서는 데이터 유사성 조절이 가능한 클러스터링 알고리즘을 적용하였다. 그 결과 데이터 유사성 조절을 할 경우에 그렇지 않을 경우보다 유전자 기능 예측의 정확도가 높아졌다. 따라서 제안된 데이터 유사성 조절 기법은 유전자 기능을 예측하는 방법에 정확도를 높일 수 있을 것으로 기대된다.

Identification of Heterogeneous Prognostic Genes and Prediction of Cancer Outcome using PageRank (페이지랭크를 이용한 암환자의 이질적인 예후 유전자 식별 및 예후 예측)

  • Choi, Jonghwan;Ahn, Jaegyoon
    • Journal of KIISE
    • /
    • v.45 no.1
    • /
    • pp.61-68
    • /
    • 2018
  • The identification of genes that contribute to the prediction of prognosis in patients with cancer is one of the challenges in providing appropriate therapies. To find the prognostic genes, several classification models using gene expression data have been proposed. However, the prediction accuracy of cancer prognosis is limited due to the heterogeneity of cancer. In this paper, we integrate microarray data with biological network data using a modified PageRank algorithm to identify prognostic genes. We also predict the prognosis of patients with 6 cancer types (including breast carcinoma) using the K-Nearest Neighbor algorithm. Before we apply the modified PageRank, we separate samples by K-Means clustering to address the heterogeneity of cancer. The proposed algorithm showed better performance than traditional algorithms for prognosis. We were also able to identify cluster-specific biological processes using GO enrichment analysis.

Forecasting of the water quality in Youngsan river using by GA and T-S Fuzzy system (GA와 T-S 퍼지시스템에 의한 영산강 수질 예측)

  • Park, Sung Chun;Oh, Chang Ryol;Kim, San Won
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2004.05b
    • /
    • pp.1381-1384
    • /
    • 2004
  • 대상 지점의 수질 예측은 단순한 모델로 설명하는데 쉽지 않을 뿐만 아니라 많은 오차를 내포하고 있다. 그러나 최근, 신경회로망, 퍼지 논리, 전문가 시스템 및 유전자 알고리즘과 같은 인공지능이 대두되면서 복잡한 비선형 과정들을 나타낼 수 있게 되었다. 나아가 진정한 인공 지능을 실현하기 위해서는 신경회로망, 퍼지 논리, 전문가 시스템 및 유전자 알고리즘을 보다 효과적으로 이용하고 통합해야 가능할 것으로 기대된다. 본 연구에서는 유전자 알고리즘(Genetic Algorithm)을 T-S 퍼지시스템(Takagj-Sugeno Fuzzy system)의 삼각형 멤버쉽 함수 형태와 규칙 베이스를 최적화하기 위한 도구로 사용하였으면, 예측은 T-S 퍼지 시스템을 이용하여 실시하였다. 대상지점은 영산강 유역의 나주지점을 선정하여 유량자료 및 수질자료를 이용하여 GA와 T-S 퍼지 시스템의 결합에 의해 수질 예측을 실시할 결과 돌연변이율$(P_m)$ $0.05\~0.1$에서 우수한 결과를 얻을 수 있었다.

  • PDF

Forecasting of Electricity Demand for Fishing Industry Based on Genetic Algorithm approach (유전자 알고리즘에 기반한 수산업 전력 수요 예측에 관한 연구)

  • Kim, Heung-Soe;Lee, Sung-Geun
    • Journal of the Korea Convergence Society
    • /
    • v.8 no.1
    • /
    • pp.19-23
    • /
    • 2017
  • Energy is a vital resource for the economic growth and the social development for any country. As the industry becomes more sophisticated and the economy more grows, the electricity demand is increasing. So forecasting electricity demand is an important for electricity suppliers. Forecasting electricity demand makes it possible to distribute electricity demand. As the market for Negawatt market began to grow in Korea from 2014, the prediction of electricity consumption demand becomes more important. Moreover, power consumption forecasting provides a way for demand management to be directly or indirectly participated by consumers in the electricity market. We use Genetic Algorithms to predict the energy demand of the fishing industry in Jeju Island by using GDP, per capita gross national income, value add, and domestic electricity consumption from 1999 to 2011. Genetic Algorithm is useful for finding optimal solutions in various fields. In this paper, genetic algorithm finds optimal parameters. The objective is to find the optimal value of the coefficients used to predict the electricity demand and to minimize the error rate between the predicted value and the actual power consumption values.

MicroRNA Target Prediction using a Support Vector Machine and Position based Features (SVM과 위치 기반의 자질을 이용한 MicroRNA 목표 유전자 예측)

  • Kim Sung-Kyu;Zhang Byoung-Tak
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.286-288
    • /
    • 2005
  • MicroRNA (miRNA)는 작은 크기의 RNA분자로서 동식물의 유전자 발현 과점을 직접적으로 조절하는 인자로 알려져 있다. MiRNA는 보통 목표 유전자의 3'-UTR 영역에 상보성을 갖고 결합함으로써 작용하며 특히 miRNA의 5'부분의 8 nt 정도가 seed로서 중요하다고 알려져 있다. 반면 최근의 연구에 따르면 seed 부분의 서열의 조성 및 양상이 변화함에 따라 특이도가 결정됨을 알 수 있지만 기존의 컴퓨터를 이용한 miRNA 목표 유전자 예측 방법들은 이러한 정보를 활용하지 못한다. 본 논문에서는 열역학적인 수치와 서열의 조성뿐 아니라 miRNA:mRNA pair의 위치에 기반한 정보들을 학습에 자질로서 포함하여 목표 유전자를 예측한다. 그 결과는 위치 기반 자질이 학습 성능 향상에 중요하게 기여함을 보여준다.

  • PDF

Designing Neural Network Using Genetic Algorithm (유전자 알고리즘을 이용한 신경망 설계)

  • Park, Jeong-Sun
    • The Transactions of the Korea Information Processing Society
    • /
    • v.4 no.9
    • /
    • pp.2309-2314
    • /
    • 1997
  • The study introduces a neural network to predict the bankruptcy of insurance companies. As a method to optimize the network, a genetic algorithm suggests optimal structure and network parameters. The neural network designed by genetic algorithm is compared with discriminant analysis, logistic regression, ID3, and CART. The robust neural network model shows the best performance among those models compared.

  • PDF