• Title/Summary/Keyword: 유전자 예측

Search Result 503, Processing Time 0.031 seconds

An XML-Based Analysis Tool for Gene Prediction Results (XML기반의 유전자 예측결과 분석도구)

  • Kim Jin-Hong;Byun Sang-Hee;Lee Myung-Joon;Park Yang-Su
    • The KIPS Transactions:PartD
    • /
    • v.12D no.5 s.101
    • /
    • pp.755-764
    • /
    • 2005
  • Recently, as it is considered more important to identify the function of ail unknown genes in living things, many tools for gene prediction have been developed to identify genes in the DNA sequences. Unfortunately, most of those tools use their own schemes to represent their programs results, requiring researchers to make additional efforts to understand the result generated by them So, it is desirable to provide a standardized method of representing predicted gene information, which makes it possible to automatically produce the predicted results for a given set of gene data In this paper, we describe an effective U representation for various predicted gene information, and present an XML-based analysis tool for gene predication results based on this representation. The developed system helps users of gene prediction tools to conveniently analyze the predicted results and to automatically produce the statistical results of the prediction. To show the usefulness of the tool, we applied our programs to the results generated by GenScan and GeneID, which are widely used gene prediction systems.

Pathway Reconstruction System using Orthlogs Database (Ortholog 데이터베이스를 이용한 생물 경로 재구축 시스템)

  • Jung, Tae-Sung;Oh, Jeong-Su;Cho, Wan-Sup
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.280-282
    • /
    • 2005
  • 현재 국내외 적으로 많은 대사경로 재구축을 위한 소프트웨어들이 개발 보급되고 있다. 그러나 기존의 소프트웨어들은 유전자 서열의 주해 작업이 끝난 게놈에 대해서만 가능하다. 따라서 대사경로를 예측하고자 할 경우는 주해 작업이 선행되어야 하는 어려움이 있었다. 본 논문에서는 주해 작업이 완료되지 않은 유전자 서열로부터 유전자의 기능 예측뿐만 아니라 대사경로를 예측할 수 있는 시스템을 제안한다. 제안된 시스템은 Orthologous 데이터베이스를 활용하여 새롭게 밝혀진 유전자 서열을 대상으로 비교적 정확성이 높은 대사경로를 예측하는 기능을 제공한다. 이 방법을 통해 주해 작업이 완료되지 않은 유전자 서열을 이용하여 서열 내에 포함된 유전자의 기능을 예측할 뿐만 아니라 예측된 유전자 정보를 이용하여 대사 경로를 예측할 수 있다.

  • PDF

Study on Water Stage Prediction using Neuro-Fuzzy with Genetic Algorithm (Neuro-Fuzzy와 유전자알고리즘을 이용한 수위 예측에 관한 연구)

  • Yeo, Woon-Ki;Seo, Young-Min;Jee, Hong-Kee
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2011.05a
    • /
    • pp.382-382
    • /
    • 2011
  • 최근의 극심한 기상이변으로 인하여 발생되는 유출량의 예측에 관한 사항은 치수 이수는 물론 방재의 측면에서도 역시 매우 중요한 관심사로 부각되고 있다. 강우-유출 관계는 유역의 수많은 시 공간적 변수들에 의해 영향을 받기 때문에 매우 복잡하여 예측하기 힘든 요소이며, 과거에는 추계학적 예측모형이나 확정론적 예측모형 혹은 경험적 모형 등을 사용하여 유출량을 예측하였으나 최근에는 인공신경망과 퍼지모형 그리고 유전자 알고리즘과 같은 인공지능기반의 모형들이 많이 사용되고 있다. 하지만 유출량을 예측하고자 할 때 학습자료 및 검정자료로써 사용되는 유출량은 수위-유량 관계곡선식으로부터 구하는 경우가 대부분으로 이는 이렇게 유도된 유출량의 경우 오차가 크기 때문에 그 신뢰성에 문제가 있을 것으로 판단된다. 따라서 본 논문에서는 수위를 직접 예측함으로써 이러한 오차의 문제점을 극복 하고자 한다. Neuro-Fuzzy 모형은 과거자료의 입 출력 패턴에서 정보를 추출하여 지식으로 보유하고, 이를 근거로 새로운 상황에 대한 해답을 제시하도록 하는 인공지능분야의 학습기법으로 인간이 과거의 경험과 훈련으로 지식을 축적하듯이 시스템의 입 출력에 의하여 소속함수를 최적화함으로서 모형의 구조를 스스로 조직화한다. 따라서 수학적 알고리즘의 적용이 어려운 강우와 유출관계를 하천유역이라는 시스템에서 발생된 신호체계의 입 출력패턴으로 간주하고 인간의 사고과정을 근거로 추론과정을 거쳐 수문계의 예측에 적용할 수 있을 것이다. 유전자 알고리즘은 적자생존의 생물학 원리에 바탕을 둔 최적화 기법중의 하나로 자연계의 생명체 중 환경에 잘 적응한 개체가 좀 더 많은 자손을 남길 수 있다는 자연선택 과정과 유전자의 변화를 통해서 좋은 방향으로 발전해 나간다는 자연 진화의 과정인 자연계의 유전자 메커니즘에 바탕을 둔 탐색 알고리즘이다. 즉, 자연계의 유전과 진화 메커니즘을 공학적으로 모델화함으로써 잠재적인 해의 후보들을 모아 군집을 형성한 뒤 서로간의 교배 혹은 변이를 통해서 최적 해를 찾는 계산 모델이다. 이러한 유전자 알고리즘은 전역 샘플링을 중심으로 한 수법으로 해 공간상에서 유전자의 개수만큼 복수의 탐색점을 설정할 뿐만 아니라 교배와 돌연변이 등으로 좁아지는 탐색점 바깥의 영역으로 탐색을 확장할 수 있기 때문에 지역해에 빠질 위험성이 크게 줄어든다. 따라서 예측과 패턴인식에 강한 뉴로퍼지 모형의 해 탐색방법을 유전자 알고리즘을 사용한다면 보다 정확한 해를 찾는 것이 가능할 것으로 판단된다. 따라서 본 논문에서는 선행우량 및 상류의 수위자료로부터 하류의 단시간 수위예측에 관해 연구하였으며, 이를 위해 유전자 알고리즘을 이용항여 소속함수를 최적화 시키는 형태의 Neuro-Fuzzy모형에 대하여 연구하였다.

  • PDF

Predicting RNA Pseudoknots Using a Genetic Algorithm (유전자 알고리즘을 이용한 RNA Pseudoknot 예측)

  • 이동규;한경숙
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04a
    • /
    • pp.682-684
    • /
    • 2002
  • RNA 분자의 pseudoknot 구조는 이차 구조의 loop에 있는 염기와 이 loop 외부에 있는 염기와의 결합으로 생성되는 삼차 구조 요소이다. pseudoknot은 삼차 구조 형성에 필수적인 구조 요소일 뿐만 아니라, RNA 분자의 기능에 중요한 영향을 미친다. pseudoknot을 포함한 RNA 구조를 예측하는 문제는 매우 어려우며 많은 계산을 필요로 한다. 현재까지, 병렬 구조를 갖는 수퍼 컴퓨터에서 유전자 알고리즘을 이용한 프로그램의 예측 결과가 가장 우수하다고 알려져 있다. 그러나 이 프로그램은 수퍼 컴퓨터에서만 운용되기 때문에 일반 연구자가 쉽게 사용하기 어려운 단점이 있다. 본 논문은 유전자 알고리즘을 이용한 PC 기반의 pseudoknot 예측 프로그램에 대하여 기술한다. 실헙 결과는 PC 기반에서도 유전자 알고리즘을 이용하여 pseudoknot을 포함한 RNA 구조를 효과적으로 예측하고 있음을 보인다.

  • PDF

Eukaryotic Gene Structure Prediction Using Duration HMM (Duration HMM을 이용한 진핵생물 유전자 구조 예측)

  • Tae, Hong-Seok;Park, Kie-Jung
    • Proceedings of the Korean Society for Bioinformatics Conference
    • /
    • 2003.10a
    • /
    • pp.200-209
    • /
    • 2003
  • 주어진 염기서열에서 유전자 영역을 예측하는 유전자 구조 예측은 유전체 프로젝트의 중요한 과정 중 하나이며 유전체 프로젝트 전체에 큰 영향을 준다. 진핵생물의 유전체가 원핵생물의 유전체에 비해 더 복잡한 구조를 가지기 때문에 진핵생물의 유전자 구조 예측 모델 역시원핵생물에 비해 다양한 모델이 제안되었다. 본 연구팀은 duration hidden markov model을 기본형태로 하여 EGSP(Eukaryotic Gene Structure Prediction)프로그램을 개발하였다. 현재 개발된 진핵생물의 유전자 구조 예측 알고리즘 중에서 GenScan이 가장 정교한 젓으로 보고 되고 있는데, EGSP의 결과분석을 위해 Genscan과 함께 GeneID, Morgan의 예측결과를 여러 가지 기준에서 비교하였다. EGSP는 정교한 예측모델을 가지고 있음에도 각 구성모듈에 대한 파라메터의 정교함에서 부족한 면이 나타나므로, 모델의 개선과 각 모듈의 조율을 통해 더욱 개선된 결과를 가지게 될 것이다.

  • PDF

Prediction of microRNA Targets and Discrimination of microRNA Regulatory Mechanisms using Multilayer Perceptron Neural Network (다층 퍼셉트론 신경망을 이용한 microRNA의 목표 유전자 예측 및 조절 메커니즘 분별)

  • Lee, Min-Su;Nam, Jin-Wu;Zhang, Byoung-Tak
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.06b
    • /
    • pp.36-40
    • /
    • 2007
  • miRNA 유전체학의 중요한 이슈로 miRNA가 조절하는 목표 유전자를 예측하는 작업과 miRNA가 목표 유전자를 조절하는 메커니즘이 무엇인지 규명하는 것을 들 수 있다. 본 논문에서는 생물학적 특징들과 다층 퍼셉트론 신경망을 이용하여 miRNA의 목표 유전자를 예측하고 해당 miRNA 조절 메커니즘 타입을 분별해주는 시스템을 제안하고 실제 데이터를 사용하여 그 성능을 평가한다. 실험적으로 검증된 데이터를 사용하여 제안 시스템을 평가해본 결과, 다층 퍼셉트론 신경망을 사용할 경우 84.63%의 정확도로 miRNA의 목표 유전자를 예측할 수 있었고, 87.90%의 정확도로 miRNA가 목표 유전자를 조절하는 메커니즘을 분별할 수 있었다. 학습 데이터가 충분히 많아진다면 제안 시스템의 예측 성능은 더욱 높아질 것으로 예상된다.

  • PDF

공간데이터마이닝에서의 유전자알고리즘을 이용한 예측방법연구

  • 김효정;강한구;강창완
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2001.11a
    • /
    • pp.95-97
    • /
    • 2001
  • 공간자료의 예측문제에 있어 전통적 예측방법인 크리깅방법과 최근 통계적문제 적용되기 시작한 신경망분석방법 간의 비교를 사례연구를 통해 행하였다. 일반적으로 크리깅에 의한 선형예측은 공간자료에 대한 일반적 통계모형으로서 간주되어 왔다. 한편 예측문제에 있어 뉴럴네트워크에 기초한 비모수적 방법이 관심의 대상이 되고 있으며 특히 대용량 자료의 경우 데이터마이닝 기법의 한 분야로 널리 사용되고 있는 실정이다. 본 연구에서는 공간 자료의 예측에 있어 유전자 알고리즘을 신경망분석 모형을 결합하여 기존의 크리깅방법과의 예측력을 비교한다.

  • PDF

Study on Water Stage Prediction by Artificial Neural Network and Genetic Algorithm (인공신경망과 유전자알고리즘을 이용한 수위예측에 관한 연구)

  • Yeo, Woon-Ki;Jee, Hong-Kee;Lee, Soon-Tak
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2010.05a
    • /
    • pp.1159-1163
    • /
    • 2010
  • 최근의 극심한 기상이변으로 인하여 발생되는 유출량의 예측에 관한 사항은 치수 이수는 물론 방재의 측면에서도 역시 매우 중요한 관심사로 부각되고 있다. 강우-유출 관계는 유역의 수많은 시 공간적 변수들에 의해 영향을 받기 때문에 매우 복잡하여 예측하기 힘든 요소이다. 과거에는 추계학적 예측모형이나 확정론적 예측모형 혹은 경험적 모형 등을 사용하여 유출량을 예측하였으나 최근에는 인공신경망과 퍼지모형 그리고 유전자 알고리즘과 같은 인공지능기반의 모형들이 많이 사용되고 있다. 하지만 유출량을 예측하고자 할 때 학습자료 및 검정자료로써 사용되는 유출량은 수위-유량 관계곡선식으로부터 구하는 경우가 대부분으로 이렇게 유도된 유출량의 경우 오차가 크기 때문에 그 신뢰성에 문제가 있을 것으로 판단된다. 따라서 본 논문에서는 선행우량 및 수위자료로부터 단시간 수위예측에 관해 연구하였다. 신경망은 과거자료의 입 출력 패턴에서 정보를 추출하여 지식으로 보유하고, 이를 근거로 새로운 상황에 대한 해답을 제시하도록 하는 인공지능분야의 학습기법으로 인간이 과거의 경험과 훈련으로 지식을 축적하듯이 시스템의 입 출력에 의하여 연결강도를 최적화함으로서 모형의 구조를 스스로 조직화하기 때문에 모형의 구조에 적합한 최적 매개변수를 추정할 수 있다. 따라서 정확한 예측이 어려운 하천수위를 과거의 자료로 부터 학습된 신경망의 수학적 알고리즘을 통해 유출량의 예측에 적용할 수 있을 것이다. 유전자 알고리즘은 적자생존의 생물학 원리에 바탕을 둔 최적화 기법중의 하나로 자연계의 생명체 중 환경에 잘 적응한 개체가 좀 더 많은 자손을 남길 수 있다는 자연선택 과정과 유전자의 변화를 통해서 좋은 방향으로 발전해 나간다는 자연 진화의 과정인 자연계의 유전자 메커니즘에 바탕을 둔 탐색 알고리즘이다. 즉, 자연계의 유전과 진화 메커니즘을 공학적으로 모델화함으로써 잠재적인 해의 후보들을 모아 군집을 형성한 뒤 서로간의 교배 혹은 변이를 통해서 최적 해를 찾는 계산 모델이다. 따라서 본 연구에서는 인공신경망의 가중치를 유전자 알고리즘에 의해 최적화시킨후 오류역전파알고리즘에 의해 신경망의 학습을 진행하는 모형으로 감천유역의 선산수위표지점의 수위를 1시간~6시간까지 예측하였다.

  • PDF

A Eukaryotic Gene Structure Prediction Program Using Duration HMM (Duration HMM을 이용한 진핵생물 유전자 예측 프로그램 개발)

  • Tae, Hong-Seok;Park, Gi-Jeong
    • Korean Journal of Microbiology
    • /
    • v.39 no.4
    • /
    • pp.207-215
    • /
    • 2003
  • Gene structure prediction, which is to predict protein coding regions in a given nucleotide sequence, is the most important process in annotating genes and greatly affects gene analysis and genome annotation. As eukaryotic genes have more complicated stuructures in DNA sequences than those of prokaryotic genes, analysis programs for eukaryotic gene structure prediction have more diverse and more complicated computational models. We have developed EGSP, a eukaryotic gene structure program, using duration hidden markov model. The program consists of two major processes, one of which is a training process to produce parameter values from training data sets and the other of which is to predict protein coding regions based on the parameter values. The program predicts multiple genes rather than a single gene from a DNA sequence. A few computational models were implemented to detect signal pattern and their scanning efficiency was tested. Prediction performance was calculated and was compared with those of a few commonly used programs, GenScan, GeneID and Morgan based on a few criteria. The results show that the program can be practically used as a stand-alone program and a module in a system. For gene prediction of eukaryotic microbial genomes, training and prediction analysis was done with Saccharomyces chromosomes and the result shows the program is currently practically applicable to real eukaryotic microbial genomes.

유전자 알고리즘을 활용한 인공지능 예측모형간 결합 기법: 주식시장에의 응용

  • Ahn, Hyeon-Cheol;Lee, Hyeong-Yong
    • 한국경영정보학회:학술대회논문집
    • /
    • 2008.06a
    • /
    • pp.141-148
    • /
    • 2008
  • 각종 인공지능 기법들을 활용하여, 주식시장의 흐름을 예측하려는 연구가 지금까지 많은 인공지능 및 금융공학의 연구자들에 의해 시도되어 왔으며, 그 결과 다양한 인공지능 기법들이 예측 방법론으로 제시되어 왔다. 이런 가운데 서로 다른 예측모형들이 산출하는 예측결과를 종합 - 보완하는 결합기법에 관련된 연구가 90년대 후반부터 오늘날까지 꾸준하게 발표되고 있다. 본 연구 역시 유전자 알고리즘 기반의 새로 인공지능 예측모형간 결합기법을 제시하고 있다. 다만, 기존의 연구모형들이 각 개별모형 결과의 상대적 가중치에 초점을 맞추고 있었다면, 본 연구의 제안모형은 등락을 판단하는데 활용되는 임계치까지 유전자 알고리즘을 이용해 동시에 최적화하도록 설계되어 있다는 점에서 차별화된다. 제안모형의 유용성을 검증하기 위해, 본 연구에서는 지난 1998년부터 2007년까지의 KOSPI 지수 등락 예측을 위해 구축된 로지스틱 회귀모형, 인공신경망, SVM모형의 결과들을 제안모형을 이용해 결합하였다. 그 결과, 예측력 향상에 본 연구의 제안모형이 기여 할 수 있음을 확인 할 수 있었다.

  • PDF