Principal Component Analysis as a Preprocessing Method for Protein Structure Comparison

단백질 구조 비교를 위한 전처리 기법으로서의 주성분 분석

  • Park Sung Hee (Bioinformatics Research Team, ETRI at Daejeon, Korea) ;
  • Park Chan Yong (Bioinformatics Research Team, ETRI at Daejeon, Korea) ;
  • Kim Dae Hee (Bioinformatics Research Team, ETRI at Daejeon, Korea) ;
  • Park Soo-Jun (Bioinformatics Research Team, ETRI at Daejeon, Korea) ;
  • Park Seon Hee (Bioinformatics Research Team, ETRI at Daejeon, Korea)
  • 박성희 (한국전자통신연구원 바이오정보연구팀) ;
  • 박찬용 (한국전자통신연구원 바이오정보연구팀) ;
  • 김대희 (한국전자통신연구원 바이오정보연구팀) ;
  • 박수준 (한국전자통신연구원 바이오정보연구팀) ;
  • 박선희 (한국전자통신연구원 바이오정보연구팀)
  • Published : 2004.11.01

Abstract

본 논문에서는 두 단백질의 구조적 유사성을 기반으로 한 단백질 비교를 위해서 전처리 기법으로서의 주성분분석기법을 소개한다. 기존의 백본 및 알파탄소 간의 거리행렬(distance matrix), 2차 구조 비교기법, 구역(segment)단위의 비교 기법과 같은 단백질 비교 기법들은 위치이동(translation)와 회전(rotation)에 불변한(invariant) 차이를 구하기 위하여 거리행렬을 이용하였다. 그리고, 난 다음 이들의 최적화 과정을 거쳤다. 그러나, 본 논문에서 제시하는 전처리 기법으로서의 주성분분석기법은 단백질 구조를 전체적인 구조 관점에서 위치를 정렬시킨 후에 단백질 간의 구조를 비교하는 방식이다. 단백질의 구조의 방향성(Orientation)을 맞춘 다음에는 다양한 단백질 표현으로 구를 비교할 수 있다. 본 논문에서는 두 단백질의 구조의 유사성을 측정하기 위한 간결한 단백질 표현(representation)으로 3 차원 에지 히스토그램을 사용하였다. 이 기법은 방향성을 정렬하기 위하여 기존의 방법에서 사용되었던 반복적인 거리계산을 통한 최적화하는 과정을 없앰으로써 단백질 구조 비교 시간을 단축할 수 있는 새로운 단백질 구조 비교 패러다임을 가능하게 한다. 따라서, 이 패러다임을 통하여 적절한 단백질 구조 방향성 정렬과 단백질 구조 표현을 이용한 단백질 구조 비교 검색 시스템은 많은 양의 단백질 구조 정보로부터 원하는 형태의 단백질 구조를 빠른 시간에 검색할 수 있는 장점을 가질 수 있다.

Keywords