Abstract
Protein molecules are combined with another ones which have similar shapes at pocket positions. The pocket positions can be good references to describe the shapes of protein molecules. Harris corner detector is commonly used to detect feature points of 2 or 3D objects. Feature points can be found on the pocket areas and the points which have high derivatives. Generally speaking, the densities of feature points are relatively high at pocket areas because the shapes of pockets are concave. The pocket areas can be decided by the subdivision of voxel cubes which include feature points. The Euclidean distances between feature points and the central coordinate of the decided pocket area are calculated and sorted. The graph of sorted distances describes the shape of a protein molecule and the distribution of feature points. Therefore, it can be used to classify protein molecules by their shapes. Even though the shapes of protein molecules have been distorted with noises, they can be recognized with the accuracy more than 95 %. The accurate shape recognition provides the information to predict the binding properties of protein molecules.
단백질 분자는 포켓 위치에서 유사한 형상을 갖는 다른 분자와 결합되며, 포켓은 단백질 분자의 형상을 묘사하기 위한 참조 점으로 사용될 수 있다. Harris 검출기는 2 차원이나 3차원 객체의 특징 점을 검출하기 위해 널리 사용된다. 특징 점들은 데이터의 변화율이 높은 영역과 포켓 영역에서 발견된다. 일반적으로 포켓 영역은 함몰된 형태로 존재하기 때문에 이 영역에는 다른 영역에 비해 다수의 특징 점들이 존재한다. 특징 점들을 포함하는 voxel cube를 연속적으로 분할함으로써 포켓 영역을 발견할 수 있었고, 포켓 영역의 중심 좌표와 특징 점들 간의 Euclidean 거리를 계산한 후 이들을 크기순으로 정렬 하였다. 정렬된 거리에 대한 그래프는 단백질 분자의 형상과 특징 점들의 분포에 대한 정보를 제공하므로 단백질 분자를 형상별로 분리 할 수 있었다. 본 연구에서는 인위적인 잡음을 단백질 분자에 추가하여 형상이 왜곡된 분자를 얻었고, 왜곡된 분자에 대해서도 95 % 이상의 정확 도로 형상을 인식 할 수 있었다. 정확한 단백질 분자의 형상 인식은 분자들 간의 결합특성을 예측할 수 있는 중요한 정보를 제공한다.