• 제목/요약/키워드: 단백질구조

검색결과 1,039건 처리시간 0.029초

PDB 데이터에서 PSAML로의 변환도구 개발 (Development of a Translator from PDB Data to PSAML)

  • 조민수;이수현;이명준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (하)
    • /
    • pp.2403-2406
    • /
    • 2002
  • 현재의 단백질 구조비교 시스템들 사이의 호환성이나 상호작용성의 문제를 해결하고 단백질 구조를 비교하는 시스템을 신속히 개발하기 위해서 단백질 3차구조를 표현하기 위한 데이터를 추출하여 XML과 같은 표준 형식으로 기술된 데이터를 제공하는 것이 바람직하다. 이에 따라 단백질의 2차구조 구성요소와 그들 사이의 관계를 이용하여 단백질 구조를 기술하는 PSA가 제안되었으며, PSA를 기반으로 하여 단백질 데이터의 XML 표현기법인 PSAML이 제안되었다. 본 논문에서는 PSAML 데이터의 생성을 위하여 PDB에서 제공되는 데이터를 PSAML 형식으로 변환시키는 도구를 설계하고 구현하였다. 변환도구는 XML DOM과 Java를 이용하여 구현되었으며, 생성된 데이터는 단백질 구조 및 유사성을 비교하기 위한 단백질 구조비교 시스템에서 사용될 수 있다.

  • PDF

머신 러닝을 통한 단백질의 자유 에너지 예측

  • 이광중;함시현
    • EDISON SW 활용 경진대회 논문집
    • /
    • 제6회(2017년)
    • /
    • pp.95-99
    • /
    • 2017
  • Protein contact map은 단백질 삼차구조에 대한 정보를 이차원의 이미지로 표현하는 방법의 하나로, 비교적 간략하지만 단백질 구조에 대한 핵심적 정보를 함축하고 있다. 이러한 단백질 구조를 바탕으로 단백질의 internal energy, solvation free energy, free energy 와 같은 열역학 함수를 도출할 수 있다. 본 연구에서는 이미지 인식에 대한 머신러닝 기법을 사용하여 단백질 구조를 함축하는 단백질의 contact map으로부터 단백질의 열역학적 함수를 예측하는 연구를 진행하였다. 단백질의 main-chain 간의 contact map, side-chain 간의 contact map, main-chain과 side-chain 간의 contact map 들로부터 단백질의 여러 가지 열역학적 함수를 예측하고자 했으며 최종적으로 Convolution Neural Network (CNN) 기법을 사용하여 단백질의 free energy를 ~18 kcal/mol의 범위에서 예측 가능함을 보였다. 본 연구를 바탕으로 단백질의 contact map과 열역학 함수 사이의 상관관계가 있으며, 머신러닝 기법을 사용하여 단백질 contact map으로부터 열역학적 함수를 예측하는 것이 가능함을 보였다.

  • PDF

단백질 부분 구조를 위한 효율적인 오류 허용 알고리즘 (An Efficient Fault Tolerant Apriori Algorithm for Local Protein Structures)

  • 김계형;김민호;허준호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.869-871
    • /
    • 2003
  • 단백질 부분 구조는 일종의 단백질 패턴으로써 진화적인 성질을 띄고 있다. 본 논문에서는 단백질 간의 열 안정성과 이러한 단백질 부분 구조 간의 관련성에 대해서 알아보고자 한다. 또한 오류 허용 알고리즘 (FT-Apriori)의 성능을 향상시킬 수 있는 효과적인 기법을 제안한다. 이러한 기법을 단백질 부분 구조에 적용시킴으로써 실제 단백질 데이터에서 그 효용성을 일아본다.

  • PDF

단백질 서열의 상동 관계를 가중 조합한 단백질 이차 구조 예측 (Prediction of Protein Secondary Structure Using the Weighted Combination of Homology Information of Protein Sequences)

  • 지상문
    • 한국정보통신학회논문지
    • /
    • 제20권9호
    • /
    • pp.1816-1821
    • /
    • 2016
  • 단백질은 대부분의 생물학적 과정에서 중대한 역할을 수행하고 있으므로, 단백질 진화, 구조와 기능을 알아내기 위하여 많은 연구가 수행되고 있는데, 단백질의 이차 구조는 이러한 연구의 중요한 기본적 정보이다. 본 연구는 대규모 단백질 구조 자료로부터 단백질 이차 구조 정보를 효과적으로 추출하여 미지의 단백질 서열이 가지는 이차 구조를 예측하려 한다. 질의 서열과 상동관계에 있는 단백질 구조자료내의 서열들을 광범위하게 찾아내기 위하여, 탐색에 사용하는 프로파일의 구성에 질의 서열과 유사한 서열들을 사용하고 갭을 허용하여 반복적인 탐색이 가능한 PSI-BLAST를 사용하였다. 상동 단백질들의 이차구조는 질의 서열과의 상동 관계의 강도에 따라 가중되어 이차 구조 예측에 기여되었다. 이차 구조를 각각 세 개와 여덟 개로 분류하는 예측 실험에서 상동 서열들과 신경망을 동시에 사용하여 93.28%와 88.79%의 정확도를 얻어서 기존 방법보다 성능이 향상되었다.

변형펩타이드(Peptide Mimetics) 연구동향

  • 최진호
    • 식품기술
    • /
    • 제15권2호
    • /
    • pp.3-24
    • /
    • 2002
  • 펩타이드와 단백질은 전사, 번역, 후번역 단계에 걸친 모든 생물학적 반응을 조절한다. 그러나 분자수준에서 구조와 기능에 대한 우리의 이해는 초보적인 수준이다. 구조와 기능의 연관성에 대한 문제는 펩타이드와 단백질 자체에 대한 것과는 좀 다르다는 것을 명확히 할 필요가 있다. Multidomain을 갖는 단백질은 작고 통합적이며, 구조적으로 제한된 부분으로 쪼개는 것은 천연 단백질의 활성을 모방하여 저분자의 nonpeptide를 설계하는데 있어서 주요한 일이다. 결정적인 역할을 수행하는 domain을 모방하는 것은 특이성과 치료 효과에 있어서 자연적으로 얻어지는 단백질 물질과 비교하여 이로운 특성을 갖을 수 있고 분자 인지 분야에 관한 연구에 유용한 단서를 제공한다(Chen etal., 1992). 한편 펩타이드는 환경에 의해 구조가 심하게 영향을 받아 특성이 쉽게 변한다(Marshall et al., 1978). 수용액 내에서 이러한 구조적 유동성 때문에 그들이 결합할 수용체나 생리활성을 띄는 구조를 결정하는 것은 어렵고 복잡한 일이다(Fauchre,1987; Hruby, 1987). 구조를 한정하면 이러한 결정을 매우 쉽게 할 수 있다(Hrubyet al., 1987). 단백질 모방학은 분자지각 연구에 강력한 수단이며, 복잡한 단백질과 펩타이드의 구조-기능관계를 탐구하고 분석하는데 독특한 방법이다. 이 장에서는 매우넓고 빠르게 확장되고 있는 Peptidomimetic연구를 간략히 소개하고 있다. 단 본문은 기술 범위를 N-Methylated 아미노산과 스테로이드 등으로 제한하여 소개한다.

  • PDF

단백질 이차구조의 검색을 위한 클러스터링된 세그먼트 인덱싱 (Clustered Segment Indexing for Searching on the Secondary Structure of Protein)

  • 서민구;박상현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.298-300
    • /
    • 2004
  • 바이오 인포메틱스에서의 데이터 검색은 DNA와 단백질 시퀀스에 대해서 주로 이루어지며, 지금까지의 연구는 주로 DNA와 단백질 1차 구조의 검색에 대해 이루어졌다. 단백질 2차구조는 1차구조 내 인접한 아미노산들의 공간적인 배열을 나타내며. 단백질의 기능을 예측하는데 중요한 3차구조의 지역적 아미노산의 특성을 나타낸다. 따라서 2차구조에 대한 검색은 단백질의 기능을 이해하는데 매우 중요한 역할을 한다[1]. 이 논문에서는 단백질 2차구조 및 질의 문자열을 세그먼트 단위로 나누고 검색하는 r41의 방법을 개선하여 세그먼트를 조합한 클러스터 구조 및 Look Ahead를 사용해 Exact Matching 및 Wildcard Matching 질의를 효율적으로 처리할 수 있는 기법을 제시한다.

  • PDF

단백질 이차 구조 예측을 위한 단백질 프로파일의 성능 비교 (A Performance Comparison of Protein Profiles for the Prediction of Protein Secondary Structures)

  • 지상문
    • 한국정보통신학회논문지
    • /
    • 제22권1호
    • /
    • pp.26-32
    • /
    • 2018
  • 단백질의 이차구조는 단백질의 진화, 구조, 기능을 연구하는데 중요한 정보이다. 단백질 서열 정보만을 이용하여 단백질의 이차 구조를 예측하는 분야에 심층 학습 방법들이 최근 들어 활발히 적용되고 있다. 이러한 방법에서 널리 사용되는 입력은 단백질 서열을 변환하여 만들어진 단백질 프로파일이다. 본 논문에서는 효과적인 단백질 프로파일을 얻기 위하여 단백질 서열 탐색 방법으로 PSI-BLAST와 더불어서 HHblits를 사용하였다. 단백질 프로파일의 구성에 사용되는 상동 단백질 서열을 결정하기 위한 유사도 문턱치와 상동 단백질 서열 정보를 반복적으로 사용하는 회수를 조절하였다. 합성곱 신경망과 순환 신경망을 사용하여 단백질 이차구조를 예측하였는데, 진화적 정보를 한번만 추가하여 만들어진 단백질 프로파일이 효과적이었다.

단백질 가시화 형태에 따른 정보표현적합도 평가 (Evaluation of Information Representation Goodness-of-fit According to Protein Visualization Pattern)

  • 변재희;최유주;서정근
    • 인터넷정보학회논문지
    • /
    • 제16권2호
    • /
    • pp.117-125
    • /
    • 2015
  • 단백질 기능을 규명하는 단백질 구조 정보는 단백질 의약품의 약효를 증진시키고, 개발을 단축시키는데 큰 영향을 미친다. 따라서 단백질의 구조를 효과적으로 분석하기 위한 단백질 가시화에 대한 연구가 증가하고 있다. 하지만 단백질 가시화에 대한 연구가 단백질의 구조를 예측하거나 렌더링의 속도를 향상시키는 것을 중심으로 이뤄지고 있으며, 단백질 가시화 형태에 따른 정보 전달 효용성에 대한 연구는 미비한 실정이다. 본 연구는 단백질 의약품에 대한 효율적인 정보 서비스의 사전 연구로써 단백질 1, 2차구조 혼합가시화 형태별 정보표현적합도를 분석하였다. 단백질 1, 2차구조 혼합가시화 형태는 대표적 가시화 서비스인 Chimera, PDB, Cn3D와 기존 가시화 서비스의 문제점을 개선한 단백질 1, 2차구조 혼합가시화 형태를 대상으로 하였다. 정보표현적합도를 구하기 위한 정보요인은 피험자 분석 결과를 바탕으로 단백질 1차구조, 아미노산 위치, 단백질 2차구조, 단백질 2차구조 비율정보로 구분하였으며, 피험자는 단백질 의약품 업계종사기간이 5년 이상인 전문가 집단을 대상으로 하였다. 그 결과 단백질 1, 2차구조 혼합가시화형태별 정보표현적합도에는 유의미한 차이가 있었으며, 가시화 형태별 정보 전달 효용성에 차이가 있음을 입증할 수 있었다.

단백질 구조기반 단백질 간의 기능관계 예측 기법 (A Method to Predict Protein Functional Relationships from Protein Structures)

  • 김선신;정광수;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 추계학술발표대회 및 정기총회
    • /
    • pp.55-58
    • /
    • 2005
  • 단백질 구조로부터 단백질사이의 기능관계를 유추하는 일은 생명정보학에 있어서 중요한 연구과제이다. 여기서, 단백질 1차 구조로부터 단백질 기능관계의 예측이 용이한 진화적으로 가까운 종간에는, 아미노산 서열을 비교하여 결과를 획득하고, 진화적으로 먼 종간에는 단백질 3차 구조 및 표면구조를 종합적으로 활용함으로써, 단백질간의 기능관계를 보다 효율적이고 정확하게 예측할 수 있음을 보인다.

  • PDF

출현 시퀀스 마이닝 기반의 단백질 2 차 구조 예측 (Predict Protein Secondary Structure based on Emerging Sequence Mining)

  • ;이헌규;;손호선;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.379-382
    • /
    • 2009
  • 최근 단백질 기능 예측을 위한 서열비교와 구조비교 기법들은 정확한 분류가 가능한 반면, 새로운 단백질 기능 분류를 함에 있어서 많은 복잡도가 따른다. 따라서 이 논문에서는 보다 빠른 단백질의 구조 분류 및 예측을 위하여 출현 시퀀스(emerging sequence)를 기반으로 하는 분류기법을 제안하였다. 이 기법에서는 먼저, 출현 시퀀스 마이닝 알고리즘을 이용하여 단백질 서열 데이터로부터 4 가지의 단백질 2 차 구조 출현 시퀀스를 발견하고, SVM을 이용하여 단백질의 출현 시퀀스 속성으로부터 단백질의 2 차 구조를 예측하였다.