• Title/Summary/Keyword: 단백질 기능 예측

Search Result 128, Processing Time 0.032 seconds

Prediction of Protein Function using Pattern Mining in Protein-Protein Interaction Network (단백질 상호작용 네트워크에서의 단백질 기능예측을 위한 패턴 마이닝)

  • Kim, Taewook;Li, Meijing;Li, Peipei;Ryu, Keun Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.11a
    • /
    • pp.1115-1118
    • /
    • 2011
  • 단백질 사이의 상호작용 네트워크(PPI network: Protein-Protein Interaction network)를 이용하여 단백질 기능을 예측 하는 것은 단백질 기능 예측 기법들 중에서 중요한 작용을 한다. 하지만 PPI를 이용한 단백질 기능 예측은 기능의 복잡도와 다양성으로 인해 제한적인 결과를 나타내 왔다. 따라서 본 논문에서는 기존의 연구들 보다 높은 정확도로 단백질 기능을 예측하기 위해 기능 예측을 하려는 단백질과 상호작용 하는 단백질들에 그래프 마이닝 기법을 적용하여 빈발 2-노드 상호작용 패턴을 찾고, 그 패턴을 이용하여 단백질 기능을 예측하는 접근법을 제안하였다. 실험데이터로 DIP(Database of Interacting Proteins)에서 제공하는 단백질 상호작용 데이터를 사용하였으며, 다른 기존의 단백질 기능 예측 기법들보다 높은 정확도를 보여주었다.

A Protein Function Prediction in Interaction Maps (상호작용 맵에서 단백질 기능 예측)

  • 정재영;최재훈;박종민;박선희
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.286-288
    • /
    • 2004
  • 단백질 상호작용 데이터는 현 생물정보학에서 기능이 알려지지 않은 단백질의 기능 예측에 높은 신뢰성이 있는 프로티오믹스의 계산 모델에 이용되고 있다. 일반적으로 이 단백질 기능 예측 알고리즘들은 대규모의 2차원 단백질-단백질 상호작용 맵에서 Guilt-by-Association 개념 기반으로 개발되고 있다. 본 논문에서는 단백질-단백질 상호작용 데이터를 이용한 그래프 기반 단백질 기능 예측 모델을 개발하였다. 특히, 이 모델은 대량의 상호작용 데이터에서 정확한 기능 예측을 수행할 수 있다는 장점을 가지고 있다. 이를 위해 Yeast에 대한 단백질 상호작용 맵, Homology 및 Interaction Generality를 이용하여 이 모델을 평가하였다.

  • PDF

Modified Chi-square Method for Prediction of Unannotated Proteins from Protein Interaction Network (단백질 상호작용 네트워크에서 단백질 기능 예측을 위한 Modified Chi-square 기법)

  • Tae-Ho Kang;Jae-Soo Yoo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2008.11a
    • /
    • pp.785-787
    • /
    • 2008
  • 생명체의 생명현상을 주관하는 각종 화학반응들은 단백질이 관여하고 있다. 단백질은 일정한 질서에 따라 서로 조립되기도 하고, 기능적으로 연관돼 네트워크를 이루고 있다. 이 네트워크를 구성하는 단백질-단백질 상호작용은 단백질의 기능과 밀접하게 관련되어 있다. 즉, 상호작용하는 단백질은 같은 기능을 수행할 가능성이 크다. 이러한 사실은 단백질-단백질 상호작용을 통해 기능이 알려지지 않은 미지 단백질의 기능을 예측할 수 있게 한다. 대표적인 연구로는 이웃 노드에 존재하는 기능분포를 이용하는 이웃노드 카운트(Neighborhood Counting)방식과 특정 기능의 나타날 빈도를 계산하여 기능을 예측하는 카이-제곱(Chi-Square)방식 등이 있다. 본 논문에서는 단백질 기능 예측의 정확성을 높이기 위해 이들 두 방식의 장점을 취합한 보완된 카이-제곱 방식을 제안한다. 그리고 다양한 단백질 상호작용 네트워크 데이터를 비교 분석하여 보완된 카이-제곱 방식이 기능 예측의 정확성이 높음을 증명한다.

Modular neural network in prediction of protein function (단위 신경망을 이용한 단백질 기능 예측)

  • Hwang Doo-Sung
    • The KIPS Transactions:PartB
    • /
    • v.13B no.1 s.104
    • /
    • pp.1-6
    • /
    • 2006
  • The prediction of protein function basically make use of a protein-protein interaction map based on the concept of guilt-by-association. The method however cannot determine the functions of proteins in case that the target protein does not interact with proteins with known functions directly. This paper studies protein function prediction considering the given problem as a K-class classification problem and proposes a predictive approach utilizing a modular neural network. The proposed method uses interaction data and protein related attributes as well. The experimental results demonstrate that the proposed approach can predict the functional roles of Yeast proteins whose interaction knowledge is not known and shows better performance than the graph-based models that use protein interaction data.

A Hybrid Protein Function Prediction System Using Sequence Similarity and Feature-based Classification (서열 유사도와 특징 기반 분류를 융합시킨 단백질 기능 예측 시스템)

  • Moon, Ji Hwan;Kim, Yoo-Sung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.197-200
    • /
    • 2010
  • 단백질의 서열 정보와 기능 정보의 양이 증가함에 따라 컴퓨터 실험을 통한 단백질의 기능 예측이 가능해졌으며 정확성이 높은 예측 시스템을 개발하려는 여러 연구가 시도되고 있다. 대표적인 방법으로 서열 유사도를 기반으로 기능 예측을 하는 시스템이 제안되었으나 단백질 중에는 서열이 유사하지만 기능이 다르거나 또는 서열은 다름에도 불구하고 기능이 같은 단백질이 존재하기 때문에 서열의 유사도 만을 이용해서는 단백질의 기능 예측을 어렵다. 이러한 유사도 방법의 단점을 극복하기 위해 단백질 서열로부터 추출한 특징을 기반으로 분류하는 방법도 제안되었다. 본 논문에서는 이러한 기존 방법들의 장점을 얻기 위하여 서열 유사도 방법과 특징 기반 방법을 융합한 단백질 기능 예측 시스템을 제안하고 예측 정확성 분석을 위한 실험을 실시하였다. 실험의 결과에 따르면 제안된 융합시스템이 서열 유사도만을 이용한 방법과 특징 기반 방법보다 좋은 예측 정확률을 갖는 것으로 분석되었다.

Graph-based modeling for protein function prediction (단백질 기능 예측을 위한 그래프 기반 모델링)

  • Hwang Doosung;Jung Jae-Young
    • The KIPS Transactions:PartB
    • /
    • v.12B no.2 s.98
    • /
    • pp.209-214
    • /
    • 2005
  • The use of protein interaction data is highly reliable for predicting functions to proteins without function in proteomics study. The computational studies on protein function prediction are mostly based on the concept of guilt-by-association and utilize large-scale interaction map from revealed protein-protein interaction data. This study compares graph-based approaches such as neighbor-counting and $\chi^2-statistics$ methods using protein-protein interaction data and proposes an approach that is effective in analyzing large-scale protein interaction data. The proposed approach is also based protein interaction map but sequence similarity and heuristic knowledge to make prediction results more reliable. The test result of the proposed approach is given for KDD Cup 2001 competition data along with those of neighbor-counting and $\chi^2-statistics$ methods.

Function Prediction of Gene products by Term based Probabilistic Model (단어 기반의 확률 모델을 이용한 단백질 기능 예측)

  • Park, Dae-Won;Kwon, Hyuk-Chul
    • Proceedings of the Korean Society for Bioinformatics Conference
    • /
    • 2003.10a
    • /
    • pp.73-78
    • /
    • 2003
  • 유전 연구를 통해 밝혀지고 있는 단백질은 각각의 기능적 특성을 가지고 서로 영향을 주고받으며 상호 작용한다. 단백질의 기능적 특성은 생물체에서는 단백질이 나타내는 기능으로 단백질 이름은 이들 단백질의 기능을 정확히 나타낼 수 있도록 붙여진다. 기능적 특성에 의해 명명된 단백질은 단백질을 구성하는 단어도 단백질과 유사한 기능 특성을 가질 가능성이 높다. 이는 텍스트 기반의 연구에서 단어가 가지는 중요성에서 비롯된다. 본 논문에서는 단백질을 구성하는 단어들을 단백질의 기능적 특성으로 분류하고, 이 기능분포에 의해서 단백질의 기능을 역으로 예측하고 판단하고자 하였다.

  • PDF

Fucntional Prediction Method for Proteins by using Modified Chi-square Measure (보완된 카이-제곱 기법을 이용한 단백질 기능 예측 기법)

  • Kang, Tae-Ho;Yoo, Jae-Soo;Kim, Hak-Yong
    • The Journal of the Korea Contents Association
    • /
    • v.9 no.5
    • /
    • pp.332-336
    • /
    • 2009
  • Functional prediction of unannotated proteins is one of the most important tasks in yeast genomics. Analysis of a protein-protein interaction network leads to a better understanding of the functions of unannotated proteins. A number of researches have been performed for the functional prediction of unannotated proteins from a protein-protein interaction network. A chi-square method is one of the existing methods for the functional prediction of unannotated proteins from a protein-protein interaction network. But, the method does not consider the topology of network. In this paper, we propose a novel method that is able to predict specific molecular functions for unannotated proteins from a protein-protein interaction network. To do this, we investigated all protein interaction DBs of yeast in the public sites such as MIPS, DIP, and SGD. For the prediction of unannotated proteins, we employed a modified chi-square measure based on neighborhood counting and we assess the prediction accuracy of protein function from a protein-protein interaction network.

Search method of Domain for prediction of protein function (단백질의 기능 예측을 위한 도메인 검색 방법)

  • 허미영;김홍기;최진성
    • Proceedings of the IEEK Conference
    • /
    • 2003.11b
    • /
    • pp.239-242
    • /
    • 2003
  • 모든 생명체는 유전자의 최종 산물인 다양한 단백질들이 각각의 복잡한 기능을 수행함과 동시에 그들 사이의 긴밀한 상호작용에 의해 생명을 유지한다. 도메인 (Domain)은 단백질의 기능적 단위로서 한 개 단백질은 최대 수십 개의 도메인을 가지는데 이들 도메인에 대한 정보는 단백질의 기능을 예측하는데 도움이 될 수 있다. 본 논문에서는 종양을 억제하는 기능을 가지는 단백질과 그러한 기능을 가질 것으로 추정되어지는 단백질의 아미노산 서열, 또 기능이 밝혀지지 않은 미지의 아미노산 서열을 가지고 이미 밝혀져 있는 도메인 서열과 비교 검색하여 이들 사이에 일치하는 도메인을 통하여 표적 단백질의 기능 동정에 관한 연구에 도움이 되며, 또한 기능이 밝혀지지 않은 아미노산 서열의 도메인을 검색하여 새로운 기능을 예측함으로써 다른 실험적 방법과 비교하여 시간과 비용을 절약할 수 있는 효과적인 방법을 얻었기에 제안하고자 한다.

  • PDF

An Extraction Technique of Protein Geometric Features for Predicition of Residue Location (잔기 위치 예측을 위한 단백질 기하학적 특징 추출 기법)

  • Yu, Ki-Jin;Jung, Kwang-Su;Ryu, Keun-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.11a
    • /
    • pp.673-676
    • /
    • 2006
  • 생명현상을 이해하기 위해서는 단백질의 기능 규명이 이루어져야한다. 단백질 기능 규명을 위한 서열분석 방법은 서열 상동성이 현저히 낮은 경우 단백질 기능 예측이 불가능하고, 과거의 전체적인 단백질 구조 분석을 통한 기능 예측의 문제점이 보고되고 있다. 이 논문에서는 기능상 중요한 의미를 가지고 있는 단백질의 특정하위구조의 기하학적 특징을 추출하여 이 특징과 잔기의 위치와의 관계를 규명하였다. 또한 NaiveBayes, SVM, C4.5의 분류알고리즘을 이용하여 각 알고리즘별 분류성능을 평가하였다. 기능상 중요한 의미를 가지고 있는 특정하위구조를 비교함으로써 모르는 단백질의 기능을 예측할 수 있다.

  • PDF