Validation of Domain Combination Based Protein-Protein Interaction Prediction Method Using Human and Fly Proteins

인간 및 초파리 단백질을 대상으로 한 도메인 조합 기반 단백질-단백질 상호작용 예측 기법 검증

  • Published : 2005.11.01

Abstract

도메인 조합 기반의 단백질-단백질 상호작용 예측 기법(DCPPIP)은 효모 단백질에 대하여 뛰어난 정확도를 보여준다. 그러나 다른 종에서의 예측 정확도 및 기법의 유효성은 아직까지 검증되지 않고 있다. 본 논문에서는, 초파리 및 인간 단백질을 이용한 예측 정확도 검증 및 이종간의 상호작용 예측 실험의 결과를 기술한다. 초파리와 인간 단백질의 실험에서는 각각 10,351개와 2,345개의 상호작용 단백질 쌍이 사용되었다. 초파리와 인간의 상호작용 단백질 쌍 중 $80\%$$20\%$를 각각 학습집단 및 실험집단으로 사용하였으며. 상호작용이 없는 단백질 쌍의 학습집단은 1배에서 5배까지 변화시키면서 예측 정확도를 관찰하였다. 정확도는 실험집단 중 학습집단과 도메인이 완전히 혹은 부분적으로 겹치는 쌍들에 대하여 계산하였다. 이 결과 초파리에서는 약 $77\%$의 민감도와 $92\%$의 특이도가 확인되었고 인간 단백질에 대하여는 약 $96\%$의 민감도와 $95\%$의 특이도를 보여주었다. 이종간의 상호작용 예측 실험은 효모, 초파리, 효모+초파리에 해당하는 학습집단 각각을 바탕으로 Human, Mouse, H. pylori, E. coli, C. elegans 등의 단백질 상호작용 예측을 수행하였다. 실험 결과 학습집단의 도메인이 실험집단의 도메인과 많이 겹칠 수륵 높은 정확도를 보여주었으며, 도메인 집단간의 유사도를 나타내기 위해 고안한 Domain Overlapping Rate(DOR)는 상호작용 예측 정확도의 중요한 요소임을 찾아 내었다.

Keywords