• 제목/요약/키워드: 유전자 예측

검색결과 503건 처리시간 0.032초

XML기반의 유전자 예측결과 분석도구 (An XML-Based Analysis Tool for Gene Prediction Results)

  • 김진홍;변상희;이명준;박양수
    • 정보처리학회논문지D
    • /
    • 제12D권5호
    • /
    • pp.755-764
    • /
    • 2005
  • 생명체의 주된 기능 요소인 유전자를 모두 식별하는 작업의 중요성이 증가함에 따라, 최근에 유전자 예측도구들이 활발히 개발되고 있다. 그러나 유전자 예측 프로그램들은 예측 결과를 그들 고유의 형식으로 제공하여 사용자가 그 결과를 이해하기 위해서는 상당히 많은 추가적인 노력이 필요하다. 따라서 유전자 예측결과에 대한 표준화된 표현과 유전자 데이터 집합에 대한 예측결과를 자동으로 계산하는 방법을 지원하는 것이 바람직하다. 본 논문에서는 다양한 유전자 예측 정보에 대한 효과적인 XML 표현과 이를 바탕으로 예측된 유전자 결과를 자동으로 분석하는 in 기반 분석 도구에 대하여 기술한다. 개발된 도구는 유전자 예측도구를 사용하는 사용자들이 편리하게 예측결과를 분석하고 예측결과에 대한 통계결과를 자동으로 산출할 수 있도록 지원한다. 도구의 유용성을 보여주기 위하여 널리 사용되는 유전자 예측 도구인 GenScan과 GeneID의 처리결과를 개발된 도구에 적용시켜 보았다.

Ortholog 데이터베이스를 이용한 생물 경로 재구축 시스템 (Pathway Reconstruction System using Orthlogs Database)

  • 정태성;오정수;조완섭
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.280-282
    • /
    • 2005
  • 현재 국내외 적으로 많은 대사경로 재구축을 위한 소프트웨어들이 개발 보급되고 있다. 그러나 기존의 소프트웨어들은 유전자 서열의 주해 작업이 끝난 게놈에 대해서만 가능하다. 따라서 대사경로를 예측하고자 할 경우는 주해 작업이 선행되어야 하는 어려움이 있었다. 본 논문에서는 주해 작업이 완료되지 않은 유전자 서열로부터 유전자의 기능 예측뿐만 아니라 대사경로를 예측할 수 있는 시스템을 제안한다. 제안된 시스템은 Orthologous 데이터베이스를 활용하여 새롭게 밝혀진 유전자 서열을 대상으로 비교적 정확성이 높은 대사경로를 예측하는 기능을 제공한다. 이 방법을 통해 주해 작업이 완료되지 않은 유전자 서열을 이용하여 서열 내에 포함된 유전자의 기능을 예측할 뿐만 아니라 예측된 유전자 정보를 이용하여 대사 경로를 예측할 수 있다.

  • PDF

Neuro-Fuzzy와 유전자알고리즘을 이용한 수위 예측에 관한 연구 (Study on Water Stage Prediction using Neuro-Fuzzy with Genetic Algorithm)

  • 여운기;서영민;지홍기
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2011년도 학술발표회
    • /
    • pp.382-382
    • /
    • 2011
  • 최근의 극심한 기상이변으로 인하여 발생되는 유출량의 예측에 관한 사항은 치수 이수는 물론 방재의 측면에서도 역시 매우 중요한 관심사로 부각되고 있다. 강우-유출 관계는 유역의 수많은 시 공간적 변수들에 의해 영향을 받기 때문에 매우 복잡하여 예측하기 힘든 요소이며, 과거에는 추계학적 예측모형이나 확정론적 예측모형 혹은 경험적 모형 등을 사용하여 유출량을 예측하였으나 최근에는 인공신경망과 퍼지모형 그리고 유전자 알고리즘과 같은 인공지능기반의 모형들이 많이 사용되고 있다. 하지만 유출량을 예측하고자 할 때 학습자료 및 검정자료로써 사용되는 유출량은 수위-유량 관계곡선식으로부터 구하는 경우가 대부분으로 이는 이렇게 유도된 유출량의 경우 오차가 크기 때문에 그 신뢰성에 문제가 있을 것으로 판단된다. 따라서 본 논문에서는 수위를 직접 예측함으로써 이러한 오차의 문제점을 극복 하고자 한다. Neuro-Fuzzy 모형은 과거자료의 입 출력 패턴에서 정보를 추출하여 지식으로 보유하고, 이를 근거로 새로운 상황에 대한 해답을 제시하도록 하는 인공지능분야의 학습기법으로 인간이 과거의 경험과 훈련으로 지식을 축적하듯이 시스템의 입 출력에 의하여 소속함수를 최적화함으로서 모형의 구조를 스스로 조직화한다. 따라서 수학적 알고리즘의 적용이 어려운 강우와 유출관계를 하천유역이라는 시스템에서 발생된 신호체계의 입 출력패턴으로 간주하고 인간의 사고과정을 근거로 추론과정을 거쳐 수문계의 예측에 적용할 수 있을 것이다. 유전자 알고리즘은 적자생존의 생물학 원리에 바탕을 둔 최적화 기법중의 하나로 자연계의 생명체 중 환경에 잘 적응한 개체가 좀 더 많은 자손을 남길 수 있다는 자연선택 과정과 유전자의 변화를 통해서 좋은 방향으로 발전해 나간다는 자연 진화의 과정인 자연계의 유전자 메커니즘에 바탕을 둔 탐색 알고리즘이다. 즉, 자연계의 유전과 진화 메커니즘을 공학적으로 모델화함으로써 잠재적인 해의 후보들을 모아 군집을 형성한 뒤 서로간의 교배 혹은 변이를 통해서 최적 해를 찾는 계산 모델이다. 이러한 유전자 알고리즘은 전역 샘플링을 중심으로 한 수법으로 해 공간상에서 유전자의 개수만큼 복수의 탐색점을 설정할 뿐만 아니라 교배와 돌연변이 등으로 좁아지는 탐색점 바깥의 영역으로 탐색을 확장할 수 있기 때문에 지역해에 빠질 위험성이 크게 줄어든다. 따라서 예측과 패턴인식에 강한 뉴로퍼지 모형의 해 탐색방법을 유전자 알고리즘을 사용한다면 보다 정확한 해를 찾는 것이 가능할 것으로 판단된다. 따라서 본 논문에서는 선행우량 및 상류의 수위자료로부터 하류의 단시간 수위예측에 관해 연구하였으며, 이를 위해 유전자 알고리즘을 이용항여 소속함수를 최적화 시키는 형태의 Neuro-Fuzzy모형에 대하여 연구하였다.

  • PDF

유전자 알고리즘을 이용한 RNA Pseudoknot 예측 (Predicting RNA Pseudoknots Using a Genetic Algorithm)

  • 이동규;한경숙
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (A)
    • /
    • pp.682-684
    • /
    • 2002
  • RNA 분자의 pseudoknot 구조는 이차 구조의 loop에 있는 염기와 이 loop 외부에 있는 염기와의 결합으로 생성되는 삼차 구조 요소이다. pseudoknot은 삼차 구조 형성에 필수적인 구조 요소일 뿐만 아니라, RNA 분자의 기능에 중요한 영향을 미친다. pseudoknot을 포함한 RNA 구조를 예측하는 문제는 매우 어려우며 많은 계산을 필요로 한다. 현재까지, 병렬 구조를 갖는 수퍼 컴퓨터에서 유전자 알고리즘을 이용한 프로그램의 예측 결과가 가장 우수하다고 알려져 있다. 그러나 이 프로그램은 수퍼 컴퓨터에서만 운용되기 때문에 일반 연구자가 쉽게 사용하기 어려운 단점이 있다. 본 논문은 유전자 알고리즘을 이용한 PC 기반의 pseudoknot 예측 프로그램에 대하여 기술한다. 실헙 결과는 PC 기반에서도 유전자 알고리즘을 이용하여 pseudoknot을 포함한 RNA 구조를 효과적으로 예측하고 있음을 보인다.

  • PDF

Duration HMM을 이용한 진핵생물 유전자 구조 예측 (Eukaryotic Gene Structure Prediction Using Duration HMM)

  • Tae, Hong-Seok;Park, Kie-Jung
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2003년도 제2차 연례학술대회 발표논문집
    • /
    • pp.200-209
    • /
    • 2003
  • 주어진 염기서열에서 유전자 영역을 예측하는 유전자 구조 예측은 유전체 프로젝트의 중요한 과정 중 하나이며 유전체 프로젝트 전체에 큰 영향을 준다. 진핵생물의 유전체가 원핵생물의 유전체에 비해 더 복잡한 구조를 가지기 때문에 진핵생물의 유전자 구조 예측 모델 역시원핵생물에 비해 다양한 모델이 제안되었다. 본 연구팀은 duration hidden markov model을 기본형태로 하여 EGSP(Eukaryotic Gene Structure Prediction)프로그램을 개발하였다. 현재 개발된 진핵생물의 유전자 구조 예측 알고리즘 중에서 GenScan이 가장 정교한 젓으로 보고 되고 있는데, EGSP의 결과분석을 위해 Genscan과 함께 GeneID, Morgan의 예측결과를 여러 가지 기준에서 비교하였다. EGSP는 정교한 예측모델을 가지고 있음에도 각 구성모듈에 대한 파라메터의 정교함에서 부족한 면이 나타나므로, 모델의 개선과 각 모듈의 조율을 통해 더욱 개선된 결과를 가지게 될 것이다.

  • PDF

다층 퍼셉트론 신경망을 이용한 microRNA의 목표 유전자 예측 및 조절 메커니즘 분별 (Prediction of microRNA Targets and Discrimination of microRNA Regulatory Mechanisms using Multilayer Perceptron Neural Network)

  • 이민수;남진우;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (B)
    • /
    • pp.36-40
    • /
    • 2007
  • miRNA 유전체학의 중요한 이슈로 miRNA가 조절하는 목표 유전자를 예측하는 작업과 miRNA가 목표 유전자를 조절하는 메커니즘이 무엇인지 규명하는 것을 들 수 있다. 본 논문에서는 생물학적 특징들과 다층 퍼셉트론 신경망을 이용하여 miRNA의 목표 유전자를 예측하고 해당 miRNA 조절 메커니즘 타입을 분별해주는 시스템을 제안하고 실제 데이터를 사용하여 그 성능을 평가한다. 실험적으로 검증된 데이터를 사용하여 제안 시스템을 평가해본 결과, 다층 퍼셉트론 신경망을 사용할 경우 84.63%의 정확도로 miRNA의 목표 유전자를 예측할 수 있었고, 87.90%의 정확도로 miRNA가 목표 유전자를 조절하는 메커니즘을 분별할 수 있었다. 학습 데이터가 충분히 많아진다면 제안 시스템의 예측 성능은 더욱 높아질 것으로 예상된다.

  • PDF

공간데이터마이닝에서의 유전자알고리즘을 이용한 예측방법연구

  • 김효정;강한구;강창완
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2001년도 추계학술발표회 논문집
    • /
    • pp.95-97
    • /
    • 2001
  • 공간자료의 예측문제에 있어 전통적 예측방법인 크리깅방법과 최근 통계적문제 적용되기 시작한 신경망분석방법 간의 비교를 사례연구를 통해 행하였다. 일반적으로 크리깅에 의한 선형예측은 공간자료에 대한 일반적 통계모형으로서 간주되어 왔다. 한편 예측문제에 있어 뉴럴네트워크에 기초한 비모수적 방법이 관심의 대상이 되고 있으며 특히 대용량 자료의 경우 데이터마이닝 기법의 한 분야로 널리 사용되고 있는 실정이다. 본 연구에서는 공간 자료의 예측에 있어 유전자 알고리즘을 신경망분석 모형을 결합하여 기존의 크리깅방법과의 예측력을 비교한다.

  • PDF

인공신경망과 유전자알고리즘을 이용한 수위예측에 관한 연구 (Study on Water Stage Prediction by Artificial Neural Network and Genetic Algorithm)

  • 여운기;지홍기;이순탁
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2010년도 학술발표회
    • /
    • pp.1159-1163
    • /
    • 2010
  • 최근의 극심한 기상이변으로 인하여 발생되는 유출량의 예측에 관한 사항은 치수 이수는 물론 방재의 측면에서도 역시 매우 중요한 관심사로 부각되고 있다. 강우-유출 관계는 유역의 수많은 시 공간적 변수들에 의해 영향을 받기 때문에 매우 복잡하여 예측하기 힘든 요소이다. 과거에는 추계학적 예측모형이나 확정론적 예측모형 혹은 경험적 모형 등을 사용하여 유출량을 예측하였으나 최근에는 인공신경망과 퍼지모형 그리고 유전자 알고리즘과 같은 인공지능기반의 모형들이 많이 사용되고 있다. 하지만 유출량을 예측하고자 할 때 학습자료 및 검정자료로써 사용되는 유출량은 수위-유량 관계곡선식으로부터 구하는 경우가 대부분으로 이렇게 유도된 유출량의 경우 오차가 크기 때문에 그 신뢰성에 문제가 있을 것으로 판단된다. 따라서 본 논문에서는 선행우량 및 수위자료로부터 단시간 수위예측에 관해 연구하였다. 신경망은 과거자료의 입 출력 패턴에서 정보를 추출하여 지식으로 보유하고, 이를 근거로 새로운 상황에 대한 해답을 제시하도록 하는 인공지능분야의 학습기법으로 인간이 과거의 경험과 훈련으로 지식을 축적하듯이 시스템의 입 출력에 의하여 연결강도를 최적화함으로서 모형의 구조를 스스로 조직화하기 때문에 모형의 구조에 적합한 최적 매개변수를 추정할 수 있다. 따라서 정확한 예측이 어려운 하천수위를 과거의 자료로 부터 학습된 신경망의 수학적 알고리즘을 통해 유출량의 예측에 적용할 수 있을 것이다. 유전자 알고리즘은 적자생존의 생물학 원리에 바탕을 둔 최적화 기법중의 하나로 자연계의 생명체 중 환경에 잘 적응한 개체가 좀 더 많은 자손을 남길 수 있다는 자연선택 과정과 유전자의 변화를 통해서 좋은 방향으로 발전해 나간다는 자연 진화의 과정인 자연계의 유전자 메커니즘에 바탕을 둔 탐색 알고리즘이다. 즉, 자연계의 유전과 진화 메커니즘을 공학적으로 모델화함으로써 잠재적인 해의 후보들을 모아 군집을 형성한 뒤 서로간의 교배 혹은 변이를 통해서 최적 해를 찾는 계산 모델이다. 따라서 본 연구에서는 인공신경망의 가중치를 유전자 알고리즘에 의해 최적화시킨후 오류역전파알고리즘에 의해 신경망의 학습을 진행하는 모형으로 감천유역의 선산수위표지점의 수위를 1시간~6시간까지 예측하였다.

  • PDF

Duration HMM을 이용한 진핵생물 유전자 예측 프로그램 개발 (A Eukaryotic Gene Structure Prediction Program Using Duration HMM)

  • 태홍석;박기정
    • 미생물학회지
    • /
    • 제39권4호
    • /
    • pp.207-215
    • /
    • 2003
  • 주어진 염기서열에서 단백질로 코딩되는 영역을 예측하는 유전자 구조 예측은 유전자 annotation의 가장 핵심적인 부분으로 유전자 분석 및 유전체 프로젝트 전체에 큰 영향을 준다. 진핵생물의 유전자가 원핵생물의 유전자에 비해 더 복잡한 구조를 가지기 때문에 진핵생물의 유전자 구조 예측 모델 역시 원핵생물에 비해 다양하고 복잡한 모델로 구성되어 있다. 본 연구팀은 duration hidden markov model을 기본형태로 하여 진핵생물의 유전자 구조 예측 프로그램인 EGSP를 개발하였다. 이 프로그램은 각 생명체의 유전자 구조 예측에 필요한 파라메터를 생성하는 학습기능과, 이를 기반으로 핵산 서열을 입력으로 해서 단백질을 코딩하는 부위를 예측하여 출력하는 기능으로 구성되며, 최근의 프로그램들의 추세대로 복수 개 유전자 예측의 기능을 갖추고 있다. EGSP의 학습과 예측에 사용되는 각 파라메터의 전체 성능에 대한 효과 분석 등을 위해 여러 개 signal에 대한 개별 모델이 주는 효과 등을 분석하였다. 진핵생물의 유전자 구조 예측에 가장 많이 연구되는 human dataset을 이용하여 현재 개발된 유전자 구조 예측 프로그램인 GenScan과 GeneID, Morgan 등 보편적으로 사용되는 프로그램들과의 성능을 여러 가지 기준에서 비교한 결과, 본 프로그램이 실용성 있는 수준을 보여주는 것을 확인하였다. 그리고 진핵 미생물인 Saccharomyces cerevisiae로 성능을 테스트한 결과 만족할 만한 수준의 성능을 나타내는 것을 알 수 있었다.

유전자 알고리즘을 활용한 인공지능 예측모형간 결합 기법: 주식시장에의 응용

  • 안현철;이형용
    • 한국경영정보학회:학술대회논문집
    • /
    • 한국경영정보학회 2008년도 춘계학술대회
    • /
    • pp.141-148
    • /
    • 2008
  • 각종 인공지능 기법들을 활용하여, 주식시장의 흐름을 예측하려는 연구가 지금까지 많은 인공지능 및 금융공학의 연구자들에 의해 시도되어 왔으며, 그 결과 다양한 인공지능 기법들이 예측 방법론으로 제시되어 왔다. 이런 가운데 서로 다른 예측모형들이 산출하는 예측결과를 종합 - 보완하는 결합기법에 관련된 연구가 90년대 후반부터 오늘날까지 꾸준하게 발표되고 있다. 본 연구 역시 유전자 알고리즘 기반의 새로 인공지능 예측모형간 결합기법을 제시하고 있다. 다만, 기존의 연구모형들이 각 개별모형 결과의 상대적 가중치에 초점을 맞추고 있었다면, 본 연구의 제안모형은 등락을 판단하는데 활용되는 임계치까지 유전자 알고리즘을 이용해 동시에 최적화하도록 설계되어 있다는 점에서 차별화된다. 제안모형의 유용성을 검증하기 위해, 본 연구에서는 지난 1998년부터 2007년까지의 KOSPI 지수 등락 예측을 위해 구축된 로지스틱 회귀모형, 인공신경망, SVM모형의 결과들을 제안모형을 이용해 결합하였다. 그 결과, 예측력 향상에 본 연구의 제안모형이 기여 할 수 있음을 확인 할 수 있었다.

  • PDF