• Title/Summary/Keyword: 단백질 기능 예측

Search Result 128, Processing Time 0.027 seconds

Protein Function Finding Systems through Domain Analysis on Protein Hub Network (단백질 허브 네트워크에서 도메인분석을 통한 단백질 기능발견 시스템)

  • Kang, Tae-Ho;Ryu, Jea-Woon;Kim, Hak-Yong;Yoo, Jae-Soo
    • The Journal of the Korea Contents Association
    • /
    • v.8 no.1
    • /
    • pp.259-271
    • /
    • 2008
  • We propose a protein function finding algorithm that is able to predict specific molecular function for unannotated proteins through domain analysis from protein-protein network. To do this, we first construct protein-protein interaction(PPI) network in Saccharomyces cerevisiae from MIPS databases. The PPI network(proteins; 3,637, interactions; 10,391) shows the characteristics of a scale-free network and a hierarchical network that proteins with a number of interactions occur in small and the inherent modularity of protein clusters. Protein-protein interaction databases obtained from a Y2H(Yeast Two Hybrid) screen or a composite data set include random false positives. To filter the database, we reconstruct the PPI networks based on the cellular localization. And then we analyze Hub proteins and the network structure in the reconstructed network and define structural modules from the network. We analyze protein domains from the structural modules and derive functional modules from them. From the derived functional modules with high certainty, we find tentative functions for unannotated proteins.

Automatic Protein Function Prediction Through Processing Large-Scale Protein Microenvironment Information (대용량 미세환경 정보처리를 통한 단백질 기능 예측 자동화)

  • Min, Hye-Young;Yoon, Sung-Roh
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2008.05a
    • /
    • pp.431-432
    • /
    • 2008
  • 정보처리 기술의 발전에 따라 정보기술을 통한 생명과학 문제 해결을 연구하는 생명정보학(bioinformatics) 분야에서도 보다 대용량의 바이오 정보를 처리하게 되었다. 특히 우리 몸을 이루는 핵심 요소인 단백질의 기능 예측 자동화는 다루어야 할 정보량이 매우 방대한 관계로 일찍부터 컴퓨터를 사용한 정보처리 기법이 중요하게 다루어져 왔다. 본 연구에서는 특정 단백질 주변의 미세환경 (microenvironment)에 관한 정보를 수집하고 분석하여 그 기능이 알려진 다른 종류의 단백질 주변의 미세환경과 비교함으로써 기능을 예측하는 방법에 대해 소개한다.

Prediction of Protein Interactions using the Associative Feature Concept Space Mapping (연관속성개념공간으로의 사상을 이용한 단백질 상호작용 예측)

  • Eom Jae-Hong;Zhang Byoung-Tak
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06a
    • /
    • pp.73-75
    • /
    • 2006
  • 생물체 내에서 중요 생물학적 기능을 수행하는 기본 단위인 단백질 및 이들의 상호작용 대한 많은 연구가 이루어져 다양한 생물체에 대한 단백질 상호작용 데이터베이스가 구축되었다. 본 논문에서는 효모에 대해 공개되어있는 단백질 상호작용 데이터를 이용하여 새로운 단백질 상호작용을 예측하는 방법을 제안한다. 논문에서는 문헌에서 연관 정보를 효율적으로 찾아내기 위하여 제안된 연관개념공간 탐색 방법을 확장하여 단백질 상호작용 예측에 사용한다. 단백질들은 각각이 가지는 다양한 속성들의 벡터로 간주되며, 상호작용은 해당 단백질들의 연관성을 통해 이루어지는 것으로 표현된다. 상호작용하는 두 단백질들의 속성은 단어의 공동 출현과 같이 고려되어 단백질 상호작용은 두 단백질 벡터의 요소로 표현되고 벡터의 요소 속성들 간의 연관성을 표현하기 위해 연관속성개념공간으로 사상되어 공간상의 거리 기반으로 연관속성을 추출한다. 추출된 연관속성을 최대로 포함하는 단백질들 간의 상호작용을 예측하는 방식으로 단백질 상호작용을 예측한다. 논문에서 제안한 방법은 효모의 단백질 상호작용 예측에 대해 평균 약 91.8%의 예측 정확도를 보여, 연관속성개념공간을 이용한 방법이 단백질 상호작용을 예측하는 또 다른 대안으로 사용 될 수 있음을 확인하였다.

  • PDF

Prediction of Yeast Protein-Protein Interactions by Neural Feature Association Rule (Neural Feature Association Rule을 이용한 효모 단백질-단백질 상호작용의 예측)

  • Eom Jae-Hong;Zhang Byoung-Tak
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.277-279
    • /
    • 2005
  • 단백질들은 서로 다른 단백질들과 상호작용하거나 복합물을 형성함으로써 생물학적으로 중요한 기능을 한다고 알려져 있다. 때문에 대부분의 세포작용에 있어 중요한 역할을 하는 단백질들 간의 상호작용 분석 및 예측에 대한 연구는 여러 연구그룹으로부터 풍부한 데이터가 산출된 후게놈시대(post-genomic era)에서 또 하나의 중요한 이슈가 되고 있다. 본 논문에서는 효모에 대해 공개되어있는 단백질 상호작용 데이터들에서 속성들 간의 연관규칙 학습을 통해 잠재적 단백질 상호작용들을 예측하기 위한 연관규칙 기반의 상호작용 예측 방법을 제시한다. 단백질들 간의 상호작용 예측을 위해 고려되는 각 단백질의 다수의 속성차원은 정보이론 기반의 속성선택 알고리즘을 이용하여 효율적으로 줄이며 상호작용의 속성집합을 이용하여 신경망을 훈련시키고 이렇게 훈련된 신경망에서 속성들 간의 연관규칙을 디코딩하여 연관규칙 기반의 상호작용 예측에 활용한다. 연관속성 발굴을 통한 상호작용 예측을 위한 마이닝 방법으로는 연관규칙 발견 알고리즘을 사용하였으며 예측 정확도를 높이기 위하여 신경망 예측 모델의 학습 결과를 디코딩한 규칙들이 추가적으로 사용하였다. 논문에서 제안한 방법을 발견된 연관규칙을 통한 단백질 상호작용 예측문제에 있어 평균 약 $94.5\%$의 예측 정확도를 보였다.

  • PDF

PreSPI: Protein-Protein Interaction Prediction Service System (PreSPI: 단백질 상호작용 예측 서비스 시스템)

  • Han Dong-Soo;Kim Hong-Soog;Jang Woo-Hyuk;Lee Sung-Doke
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.11 no.6
    • /
    • pp.503-513
    • /
    • 2005
  • With the recognition of the importance of computational approach for protein-protein interaction prediction, many techniques have been developed to computationally predict protein-protein interactions. However, few techniques are actually implemented and announced in service form for general users to readily access and use the techniques. In this paper, we design and implement a protein interaction prediction service system based on the domain combination based protein-protein interaction prediction technique, which is known to show superior accuracy to other conventional computational protein-protein interaction prediction methods. In the prediction accuracy test of the method, high sensitivity($77\%$) and specificity($95\%$) are achieved for test protein pairs containing common domains with teaming sets of proteins in a Yeast. The stability of the method is also manifested through the testing over DIP CORE, HMS-PCI, and TAP data. Performance, openness and flexibility are the major design goals and they are achieved by adopting parallel execution techniques, web Services standards, and layered architecture respectively. In this paper, several representative user interfaces of the system are also introduced with comprehensive usage guides.

Comparison of External Information Performance Predicting Subcellular Localization of Proteins (단백질의 세포내 위치를 예측하기 위한 외부정보의 성능 비교)

  • Chi, Sang-Mun
    • Journal of KIISE:Software and Applications
    • /
    • v.37 no.11
    • /
    • pp.803-811
    • /
    • 2010
  • Since protein subcellular location and biological function are highly correlated, the prediction of protein subcellular localization can provide information about the function of a protein. In order to enhance the prediction performance, external information other than amino acids sequence information is actively exploited in many researches. This paper compares the prediction capabilities resided in amino acid sequence similarity, protein profile, gene ontology, motif, and textual information. In the experiments using PLOC dataset which has proteins less than 80% sequence similarity, sequence similarity information and gene ontology are effective information, achieving a classification accuracy of 94.8%. In the experiments using BaCelLo IDS dataset with low sequence similarity less than 30%, using gene ontology gives the best prediction accuracies, 93.2% for animals and 86.6% for fungi.

Predicting Transmembrane $\alpha$-helix protein with SVM and HMM (SVM과 HMM을 이용한 $\alpha$-Helix 막횡단 단백질 예측)

  • 송철환;유성준;김민경;설영주
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.817-819
    • /
    • 2003
  • 현재 바이오인포매틱스(Bioinformatics) 분야에서 가장 중요한 부분 중의 하나는 유전자 및 단백질의 구조와 기능을 정확하게 예측하는 것이다. 이는 질병 치료 및 신약개발에 유용하여 이로부터 나온 결과로부터 경제적 산업적 효과를 기대할 수 있다. 이 논문에서는 기계학습(Machine Learning)의 한 분야인 SVM(Support Vector Machine)과 HMM(Hidden Markov Model)를 결합하여 단백질의 막횡단(Transmembrane) $\alpha$-Helix 단백질 지역을 예측하는 새로운 알고리즘을 개발, 구현 및 실험하였다. 그 결과 이 두 가지 알고리즘이 결합된 방식을 사용함으로써 성능을 향상 시킬 수 있음을 증명했다.

  • PDF

Integration of Protein-Protein Interaction Data and Design of Data Search System (단백질 상호작용 데이터 통합 및 자료 검색 시스템 설계)

  • Choi, Ji-Hye;Itgel, Bayarsaikhan;Oh, Se-Jong
    • Proceedings of the KAIS Fall Conference
    • /
    • 2010.05b
    • /
    • pp.1197-1200
    • /
    • 2010
  • Post-genomic 시대에 접어들면서 단백질의 기능의 주석이 중요한 문제로 떠오르기 시작하였다. 이런 단백질 기능을 예측하기 위해 단백질 상호작용(Protein-Protein interaction) 데이터를 이용한 방법들이 지난 10여 년간 발표되어왔다. 단백질 상호작용(Protein-Protein interaction) 데이터는 단백질들 간의 서열 등의 특징을 이용해 상호간의 연결 관련성이 있는 단백질끼리의 관계를 네트워크로 나타낸 자료이다. 현재 이러한 단백질 상호작용(Protein-Protein interaction) 데이터들은 MIPS, DIP, BioGrid등 약 5~6군데에서 제공되고 있다. 각각의 데이터는 다른 형식을 가지고 있고, 중복되는 정보도 포함하고 있다. 여러 연구 방법에서 데이터를 사용할 때 한군데에서만 추출하기 보다는 여러 데이터에서 추출하는 경우가 많기 때문에 다른 형식의 데이터를 이용하는데 불필요한 수고가 들어가게 된다. 때문에 여러군데의 데이터를 한 가지 형식으로 맞추어 통합적으로 구축하여 연구 시 데이터 사용에 용이하도록 설계 하였다. 또한 발표된 단백질 기능 예측 방법에 대한 정리를 통해 앞으로의 연구를 하는데 있어서 필요한 자료를 얻고 열람할 수 있도록 설계하였다. 이를 통해 관련 연구를 하거나 관심이 있는 사람들의 데이터를 검색하는데 많은 도움이 될 것이다.

  • PDF

Designing of Surface Comparison Method on Active Site of Enzyme (Enzyme의 활성 사이트 표면 비교기법 설계)

  • Nam Hee Yu;Kwang Su Jung;Keun Ho Ryu;Yong Je Chung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2008.11a
    • /
    • pp.279-282
    • /
    • 2008
  • 단백질의 구조는 그 기능과 밀접히 연관되어 있기 때문에 구조에 조금이라도 변화가 생기면 바로 생체기능에 이상이 생긴다. 그래서 단백질 구조연구는 필수적이고 구조의 유사성 검색을 이용하여 단백질 기능을 예측한다. 그러나 전체적인 구조가 유사한 단백질이라도 기능에 중요한 특정구조가 다르게 되면 다른 기능을 수행 할 수 있고 구조가 다른 단백질이라도 핵심 영역의 구조가 유사하다면 유사한 기능을 수행할 수 있다. 이는 단백질의 기능이 특정 하위구조의 잘 보존된 활성 사이트에 따라 결정되기 때문이다. 이 논문은 단백질의 3차원 공간정보를 matrix로 표현 할 수 있는 가장 작은 평면도형인 삼각형을 이용하여 단백질 표면에 대한 상세한 형태비교를 제공한다. 단백질 표면에서 활성 사이트 아미노산 잔기의 side chain은 일반적으로 바깥을 향하여 표면의 형태를 결정짓기 때문에 단백질 표면을 비교하기 위해 side chain 정보가 필수적이다. 우리는 아미노산 잔기의 Cα원자에 side chain을 포함하여 Cα삼각형과 side chain 삼각형 2개를 하나의 특정하위구조 set으로 정의하고 이 하위구조로 distance matrix를 구축한다. 만들어진 distance matrix에 RMSD를 이용하여 활성 사이트의 표면을 비교한다. 제시한 기법은 단백질의 전체적인 서열과 구조 정보를 이용하지 않고, 활성 사이트의 특정하위 영역만을 고려함으로써 더욱 효과적이고 빠른 시간 내에 상세한 비교를 수행할 수 있다.

Prediction of Protein-Protein Interaction Sites Based on 3D Surface Patches Using SVM (SVM 모델을 이용한 3차원 패치 기반 단백질 상호작용 사이트 예측기법)

  • Park, Sung-Hee;Hansen, Bjorn
    • The KIPS Transactions:PartD
    • /
    • v.19D no.1
    • /
    • pp.21-28
    • /
    • 2012
  • Predication of protein interaction sites for monomer structures can reduce the search space for protein docking and has been regarded as very significant for predicting unknown functions of proteins from their interacting proteins whose functions are known. In the other hand, the prediction of interaction sites has been limited in crystallizing weakly interacting complexes which are transient and do not form the complexes stable enough for obtaining experimental structures by crystallization or even NMR for the most important protein-protein interactions. This work reports the calculation of 3D surface patches of complex structures and their properties and a machine learning approach to build a predictive model for the 3D surface patches in interaction and non-interaction sites using support vector machine. To overcome classification problems for class imbalanced data, we employed an under-sampling technique. 9 properties of the patches were calculated from amino acid compositions and secondary structure elements. With 10 fold cross validation, the predictive model built from SVM achieved an accuracy of 92.7% for classification of 3D patches in interaction and non-interaction sites from 147 complexes.