DOI QR코드

DOI QR Code

MODf : An Effective and Fast Algorithm for Identification of PTM in Large Protein Sequence Database

MODf : 대규모 단백질 DB에서 효과적이고 빠르게 PTM을 동정하는 알고리즘

  • Shin, Seong-Ho (Dept of Electronics and Computer Engineering, Hanyang University) ;
  • Park, Heejin (Dept of Computer Science and Engineering, Hanyang University) ;
  • Paek, Eunok (Dept of Mechanical and Information Engineering, University of Seoul)
  • 신성호 (한양대학교 전자컴퓨터통신공학과) ;
  • 박희진 (한양대학교 컴퓨터공학부) ;
  • 백은옥 (서울시립대학교 기계정보공학과)
  • Published : 2010.11.12

Abstract

프로테오믹스는 세포 안 또는 개체 안의 모든 단백질을 총체적으로 연구하는 분야이다. 단백질 동정은 단백질이 어떤 아미노산의 서열로 구성되었는지를 확인하는 것이다. 하지만 Post-translational modification과 같은 단백질 변형을 고려하게 되면 단백질 동정은 매우 어렵게 된다. $MOD^i$ 알고리즘은 단백질 동정을 할 때 Post-translational modification의 종류나 개수에 제한 없이 단백질 동정을 정확하게 수행한다. 하지만, 대용량 단백질 서열 데이터베이스를 사용하면 수행시간이 많이 걸리는 단점이 있다. 본 논문에서는 $MOD^i$를 보완하기 위해 대용량 데이터베이스에서 후보 단백질을 선정하는 알고리즘을 통해서 개선된 $MOD^f$ 알고리즘을 제안하고 Target-decoy search strategy를 적용하여 정확성을 분석한다. 후보 단백질 선정 알고리즘과 Target-decoy search strategy 적용 결과 $MOD^f$$MOD^i$에 비해 정확도를 희생하지 않으면서 수행속도는 약 2배 향상되었다.

Keywords