• Title/Summary/Keyword: 단백질구조

검색결과 1,036건 처리시간 0.031초

클러스터링 단백질 데이터베이스와 데이터 분산 기법을 적용한 단백질 이차구조예측 시스템 설계 (Protein Secondary Structure System Design Using Clustering Protein Database and Data Distribution Scheme)

  • 이수진;김재훈;정진원;이원태
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.82-84
    • /
    • 2003
  • 생물학 데이터베이스의 크기가 점점 증가함에 따라 데이터베이스를 사용하여 서열을 정렬할 경우 많은 처리시간이 필요하게 되었다. 단백질 이차구조예측 시스템에서 단백질 서열 데이터베이스를 이용해 사용자의 서열들을 정렬하는 부분에서도 많은 처리 시간을 요구한다. 본 논문에서는 단백질 데이터베이스를 비슷한 크기로 나눠 여러 노드에서 서열 정렬을 분산 처리하여 처리율을 높이고자 했다. 또한, ClustalW에서 서열들의 관계에 따라 다양한 BLOSUM을 사용하여 정렬의 정확도를 높이는 휴리스틱 전략을 적용하기 위해 기존의 데이터베이스를 클러스터링 하였다. 클러스터링된 데이터베이스의 대표서열과 사용자 서열의 거리를 비교하여 적합한 BLOSUM을 선택하여 보다 정확한 서열 정렬을 통해 단백질 이차구조예측의 정확도를 높이게 될 것이다. 본 논문에서는 대용량의 단백질 데이터베이스를 여러 노드를 사용하여 병렬 클러스터링하여 이를 이차구조예측 시스템에 적용하여 처리율과 정확도를 높이고자 하였다.

  • PDF

단백질 구조 비교를 위한 ${\beta}-sheet$의 분할 (Division of ${\beta}-sheet$ for Protein Structure Comparison)

  • 조민수;김진홍;이명준;이수현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (중)
    • /
    • pp.821-824
    • /
    • 2003
  • 단백질의 이차구조 중에서 ${\beta}-sheet$의 구조를 비교하는데 있어서 비정확성의 문제가 있다. 이는 ${\beta}-sheet$가 그 구조적 특성 때문에 휘어지기 때문이다. 그래서 본 논문에서는 PSA에서 정의된 ${\beta}-sheet$를 좀 더 적절하게 추상화하기 위해서 ${\beta}-sheet$를 분할하는 방법을 제안하였으며 이 방법을 DOM을 이용하여 JAVA로 구현하였다. 본 논문에서 제안한 방법은, 단백질의 이차구조의 정보를 포함하는 PSAML 데이터로부터 단백질의 구조 및 유사성을 비교하기 위한 단백질 구조비교 시스템에서 사용할 수 있다.

  • PDF

단백질 구조 정보 분석을 위한 바이오 온톨로지 (Bio-ontology for Analyzing Protein Structure Information)

  • 남덕우;예형석;진훈;김인철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.799-801
    • /
    • 2003
  • 생물정보학 분야에서의 온톨로지는 다양한 생물학적 의미들을 표현하는 구조로 되어 있으며, 생물학 데이터의 의미를 효과적으로 해석할 수 있는 매우 중요한 기술로 인식되고 있다. 특히 바이오 온톨로지는 생물학 데이터베이스로부터 정보에 대한 탐색과 추론 등 의미 전달 과정에서 중심적인 역할을 수행한다. 본 논문에서는 단백질 구조 예측을 지원하는 다중 에이전트시스템인 APSS내에서 각 구성원 에이전트들간에 온톨로지에 기초한 정확한 구조 정보의 전달을 통해 효과적인 단백질 구조 예측 작업을 지원하고자 한다. 이를 위하여 먼저 단백질 구조 관련 바이오 온톨로지의 설계방법을 제시하고, 이것에 기초한 실제 바이오 온톨로지의 설계에 대해 설명한다. 그리고 이렇게 구축된 단백질 구조 온톨로지를 APSS시스템 안에서 어떻게 응용하였는가에 대해서도 설명한다.

  • PDF

한국산 멧누에 (Bombyx mandarina)에 있어서 난각유전자의 형질발현. I. 난각구조의 특이성과 Chorion 단백질 (Chorion Gene Expression in the Cellular Differentiation and Accumulation of Chorion Protein of Silkmoth, Bombyx mandarina I. Specific Structures of Egg-shell and Chorion Protein)

  • 노시갑
    • 한국응용곤충학회지
    • /
    • 제29권3호
    • /
    • pp.157-164
    • /
    • 1990
  • 한국산 멧누에(Bomdyx mandarina)chorion 유전자의 형질 발현기구를 규명하기 위한 연구의 일환으로 본 실험을 실시했다. 멧누에의 난각구조를 주사형 전자현마경에 의해 관찰한 결과 매우 특이적인 구조가 인정되었다. 즉 원추상의 불규칙 돌기에 의한 돌기구조층과 이 돌기 구조층을 덮고 있는 한 층의 얇은 덮개 구조층이 그것이다. 2차원 전기영동법에 의해 chorion 단백질을 분석한 결과, 난각을 구성하는 주요 단백질 성분은 등전점 4~6, 분자량 6~30 kd로 밝혀졌다. 특히 특이난각구조와 관련된 특이단백질 성분을 검출하였으며 이들의 대부분은 고cysteine 단백질인 것으로 추정했다. 이상의 연구결과에 의해 멧누에 난각의 특이 구조 형성에 따른 유전자발현기구 규명을 위한 기초자료가 얻어졌다.

  • PDF

정렬된 잔기 사이의 최대거리와 유사도 그래프에 기반한 단백질 구조 정렬 (Protein Structure Alignment Based on Maximum of Residue Pair Distance and Similarity Graph)

  • 김우철;박상현;원정임
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권5호
    • /
    • pp.396-408
    • /
    • 2007
  • 최근 인간 게놈 프로젝트를 통해서 인간의 DNA가 해석된 이후 유전자가 생성하는 단백질의 기능에 대한 관심이 높아지고 있다. 단백질의 기능은 서열의 유사도보다는 진화과정 상에서 잘 보존되는 구조의 유사도에 더 연관되어 있다. 이를 통해 두 개의 단백질 간에 구조 유사성이 관찰되면 이로부터 이들이 유사한 생물학적 기능을 가질 것을 기대할 수 있다. 따라서 유사한 단백질 구조를 가진 단백질을 찾기 위한 방법으로 단백질 구조 정렬에 대한 많은 연구들이 진행되었다. 하지만 기존의 연구들은 유사도로 주로 RMSD(Root Mean Square Deviation)를 사용했기 때문에 두 단백질의 정렬 결과가 유사한지 흑은 유사하지 않은지를 직관적으로 판단하기 쉽지 않다. 또한 대부분의 기존 연구들은 정렬 결과로 최적의 정렬 결과 하나만을 찾기 때문에 서로 다른 목적을 가지는 사용자들을 만족시키기 어렵다. 따라서 본 논문에서는 새로운 유사도인 MRPD(Maximum of Residue Pair Distance)와 다수의 정렬 결과를 하나의 그래프로 표현하는 SG(Similarity Graph)을 기반으로 여러 가지 정렬 결과를 한 번에 생성하는 단백질 구조 정렬 방식을 제안한다. 단백질 정렬에 MRPB를 유사도로 사용하면 RMSD를 사용하는 경우에 비해서 유사 정도를 직관적으로 이해할 수 있을 뿐 아니라 신속하게 결과를 얻을 수 있다. SG는 사용자가 다양한 후보 정렬 결과들 중에서 자신이 원하는 정렬결과를 신속히 검색할 수 있도록 지원한다. 따라서 본 논문에서 제안한 단백질 구조 정렬 알고리즘은 다양한 길이에 따른 다수의 최적 정렬들을 제시하여 사용자의 만족도를 향상시킬 수 있었으며, 다수의 정렬결과 검색임에도 불구하고 정렬 시간은 기존 방법들과 거의 비슷하다는 장점이 있다.

클러스터 세그먼트 인덱스를 이용한 단백질 이차 구조의 효율적인 유사 검색 (Clustered Segment Index for Efficient Approximate Searching on the Secondary Structure of Protein Sequences)

  • 서민구;박상현;원정임
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권3호
    • /
    • pp.251-260
    • /
    • 2006
  • 단백질 일차 구조(아미노산 배열)에 대한 상동 검색은 유전자나 단백질의 기능과 진화 과정을 유추하기 위한 필수 연산이다. 그러나 진화 단계가 멀리 떨어진 경우 단백질 일차 구조는 보존되지 않기 때문에 단백질의 공간적 구조에 대한 유사 검색을 통해서만 진화 단계를 유추할 수 있다. 따라서 본 논문에서는 단백질의 공간적 구조를 표현하는 단백질 이차 구조를 대상으로 하여 RDBMS상에 쉽게 구현이 가능한 인덱싱 방안을 제안한다. 제안된 인덱싱 방안은 클러스터링 기법과 LookAhead 개념을 활용하여 Exact Match, Range Match, Wildcard Match 질의를 신속하게 처리한다. 제안된 방법의 우수성을 검증하기 위하여 실제의 단백질 데이타를 대상으로 성능 평가를 수행하였다. 실험 결과에 의하면, 제안된 방법은 기존의 방법과 비교하여 Exact Match의 경우 6.3배까지, Range Match의 경우 3.3배까지, Wildcard Match의 경우 1.5배까지의 개선된 검색 성능을 가지는 것으로 나타났다.

JProtein : Java3D 기법을 이용한 단백질 구조 뷰어 (JProtein : A Protein Structure Viewer based on Java3D Technology)

  • 문남두;변상희;김진홍;한인섭;이명준
    • 정보처리학회논문지D
    • /
    • 제11D권7호
    • /
    • pp.1517-1526
    • /
    • 2004
  • 공공 데이터베이스의 이용 가능한 단백질 데이터의 양적 증가와 함께 포스트지놈 시대가 도래되면서, 단백질의 3차 구조에 대한 연구가 활발하게 진행되고 있다. 단백질의 구조를 효과적으로 파악하기 위해서 단백질의 3차 구조를 시각화할 필요가 있다. 최근 많은 시각화 도구들이 이미 그 구조가 알려진 단백질을 시각화하기 위해 Java 기술을 이용하여 개발되었다. 본 논문에서는 새로운 단백질 시각화 도구인 JProtein 시스템은 Java3D 기법을 이용하여 개발되었다. Java3D 3D 표현을 위한 프로그래밍 인터페이스를 제공하는 APIdl다. JProtein 시스템은 시각화된 아미노산 내의 원자들간의 각도 및 거리 정보를 제공하며, 단백질 분자구조에 대해 여러 가지 3차원 표현 모델을 지원한다. 특히, JProtein 시스템은 비동기식 스테레오 뷰와 함께 동기식 스테레오 뷰를 지원한다.

JXTA 기반 단백질 구조 비교 시스템 (A JXTA- based system for protein structure comparison)

  • 정효숙;안진현;박성빈
    • 컴퓨터교육학회논문지
    • /
    • 제12권4호
    • /
    • pp.57-64
    • /
    • 2009
  • 단백질 구조 비교는 각 단백질에 존재하는 수많은 원자들을 처리해야 하므로 많은 컴퓨팅 자원을 요구하는 작업이다. 이러한 작업을 처리하기 위한 접근법으로써 그리드 환경에서 시간 소모가 큰 계산 작업을 분산 처리하는 것이 널리 사용되어 왔다. 그러나 이러한 그리드 환경을 통제하는 것은 비전문가들에게 쉽지 않을 수 있다. 본 논문에서는 비전문가들도 쉽게 그리드 환경을 통제할 수 있는 JXTA 기반의 단백질 구조 비교 시스템을 제안한다. 쿼리 단백질과 비슷한 단백질들을 찾기 위해 사전처리 단계 와 인식단계로 구성된 기하학적 해싱 알고리즘이 사용되었다. 실험 결과에 의하면 주어진 쿼리 단백질 구조와 일치하는 단백질 구조를 시스템이 정확히 찾고 또한 제안된 시스템은 쉽게 단백질 다킹 문제를 해결하도록 확장될 수도 있다. 본 논문에서 제안하는 시스템은 비전문가들, 특히 생물학이나 화학을 전공하는 대학생들처럼 일반적으로 분산 시스템에 대한 숙련된 지식이 없는 사용자들에게 도움이 되리라 기대된다.

  • PDF

단백질 서열 연관 규칙 마이닝을 위한 효율적인 알고리즘 설계 (Efficient Sequence Association Rule Mining for Discovering Protein Relations)

  • 김현민;김지혜
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (하)
    • /
    • pp.1183-1186
    • /
    • 2002
  • DNA 의 염기서열 탐색을 위한 유전체학의 다음 세대인 구조유전체학은 유전체 사업으로 인한 인간 게놈지도의 완성과 축적된 생물정보를 이용한 생물정보학의 발달과 함께 급속한 성장을 계속하고 있다. 포스트 게놈 시대를 맞이하여 생명현상에 대한 궁극적인 이해를 위한 노력으로 단백질의 구조와 기능에 대한 연구가 주목을 받게 되었다. 다양한 구조 규명을 위한 도구들과 단백질 정보를 관리하기 위한 데이터베이스 구축에 따른 관련 기술의 발전은, 앞으로 다가올 생물정보의 방대함을 감안할 때, 가치 있는 지식정보를 얻기 위한 데이터 마이닝 기법들을 통해서만 가능하다. 본 논문은 데이터 마이닝의 근간 기술인 연관규칙 마이닝을 응용한 효율적인 서열 연관 규칙 알고리즘을 제안하며, 단백질 구조의 예측을 위한 단백질 서열 및 DNA 서열간의 패턴 비교 및 연관성을 목적으로 한다. 또한, 공간적 시간적 복잡성을 CMS-tree 라는 자료구조를 통해 알고리즘의 확장성 및 병렬화의 기본 알고리즘으로 사용하도록 개발하였다.

  • PDF

단백질 구조예측작업 에이전트의 프로토타입 설계

  • 남덕우;진훈;김인철
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2003년도 춘계학술대회
    • /
    • pp.239-245
    • /
    • 2003
  • 15년에 걸쳐 수행된 게놈프로젝트의 완성으로 인류는 본격적으로 프로테옴 시대로 접어들게 되었다. 90년대 중반 이후 전세계적으로 다량의 단백질 구조정보 및 예측을 위한 방법들이 소개되고 있지만 각 자원들마다 저장, 관리 형식이 다를 뿐만아니라 이용하는 방법도 어렵다. 또한 결과적으로 컴퓨터기술을 이용한 단백질의 구조예측작업을 제대로 지원하기 어렵다. 본 논문에서는 개방형다중 에이전트 시스템을 통해 이를 해결하고자 했으며 특히 단백질 자원 데이터베이스를 효과적으로 이용하기 위한 에이전트 설계방법에 대하여 기술하고자 한다. 단백질 구조 예측 지원을 위해 효과적인 에이전트 내부 구조를 설계함으로써 점차로 요구되는 온톨로지 기술이나, 자동 예측 기능과 같은 다양한 요구사항들을 충족시킬 수 있을 것이다.

  • PDF