• 제목/요약/키워드: 다중위치 단백질

검색결과 16건 처리시간 0.031초

레이블 멱집합 분류와 다중클래스 확률추정을 사용한 단백질 세포내 위치 예측 (Prediction of Protein Subcellular Localization using Label Power-set Classification and Multi-class Probability Estimates)

  • 지상문
    • 한국정보통신학회논문지
    • /
    • 제18권10호
    • /
    • pp.2562-2570
    • /
    • 2014
  • 단백질의 기능을 유추할 수 있는 중요한 정보중의 하나는 단백질이 존재하는 세포내 위치이다. 최근에는 하나의 단백질이 동시에 존재하는 여러 세포내 위치를 예측하는 연구가 활발하다. 본 논문에서는 단백질이 존재하는 세포내의 다중위치를 예측하기 위해서 레이블 멱집합 방법을 개선한다. 레이블 멱집합 방법으로 분류한 다중위치들을 예측 확률에 따라 결합하여 최종적인 다중레이블로 분류한다. 각 다중위치에 대한 정확한 확률적 기여를 구하기 위하여 쌍별 비교와 오류정정 출력코드를 사용한 다중클래스 확률추정 방법을 적용하였다. 단백질 세포내 위치 예측 실험에 제안한 방법을 적용하여 성능이 향상됨을 보였다.

다중레이블 조합을 사용한 단백질 세포내 위치 예측 (Multi-Label Combination for Prediction of Protein Subcellular Localization)

  • 지상문
    • 한국정보통신학회논문지
    • /
    • 제18권7호
    • /
    • pp.1749-1756
    • /
    • 2014
  • 단백질이 존재하는 세포내 위치에 대한 지식은 단백질의 기능과 관련된 중요한 정보이다. 본 논문은 개선된 레이블 멱집합 다중레이블 분류방법을 제안하여 단백질이 존재하는 세포내의 다중 위치를 예측한다. 다중레이블 분류 방법 중에서 레이블 멱집합 방법은 특정 생물학적 기능을 수행하는 단백질의 세포내 위치간의 연관 관계를 효과적으로 모델링할 수 있다. 본 논문은 다중레이블을 다른 다중레이블들의 선형조합으로 나타낼 때의 조합가중치를 제약조건이 있는 최적화를 통하여 구하고, 이를 사용하여 여러 다중레이블의 예측 확률들을 조합하여 최종적인 예측을 수행한다. 인간 단백질 자료에 대한 실험에서 제안한 방법이 다른 단백질 세포내 위치 예측 방법에 비하여 높은 성능을 보였다. 이는 제안한 방법이 레이블 멱집합 방법에서 사용되는 다중레이블들내에 존재하는 중복 정보를 이용하여 다중 레이블의 예측확률을 성공적으로 강화할 수 있기 때문이다.

단백질의 세포내 위치 예측을 위한 다중레이블 분류 방법의 성능 비교 (A Performance Comparison of Multi-Label Classification Methods for Protein Subcellular Localization Prediction)

  • 지상문
    • 한국정보통신학회논문지
    • /
    • 제18권4호
    • /
    • pp.992-999
    • /
    • 2014
  • 단백질이 존재하는 세포내의 다중 위치를 정확하게 예측하기 위하여 다중레이블 학습 방법을 광범위하게 비교한다. 이를 위하여 다중레이블 분류의 접근 방법인 알고리즘 적응, 문제 변환, 메타 학습의 여러 방법을 비교 평가한다. 다양한 관점에서 다중레이블 분류 방법의 특성을 평가하기 위하여 12가지 평가 척도를 사용하였고, 최적의 성능을 보이는 방법을 찾기 위하여 새로운 요약 척도를 사용하였다. 비교 실험 결과, 흔하지 않은 다중레이블 집합을 가지치기 하는 멱집합 방법과, 관련 레이블들을 추가된 특징으로 나타내는 분류기-체인 방법의 성능이 높았다. 또한, 이들 방법들로 구성된 여러 개의 분류기를 조합하면 더욱 성능이 향상되었다. 즉, 세포내 위치간의 연관관계를 사용하는 것이 예측에 효과적인데, 특정 생물학적 기능을 수행하는 단백질의 세포내 위치들의 관계는 독립적이지 않고 서로 관련되어 있기 때문이라 판단된다.

대용량 단백질 상호관계의 시각화를 위한 기능기반 추상화 방법 (A function-based abstraction method for visualizing the large scale of protein-protein interaction relationships)

  • 김대희;최재훈;정재영;박선희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.793-795
    • /
    • 2003
  • 이 논문은 대용량 단백질 상호작용의 관계를 효과적으로 시각화하기 위해 단백질이 가지고 있는 기능에 기반한 추상화 방법을 제안한다. 제안하는 방법은 FDP(force-directed placement) 알고리즘에 기반을 두고 있지만 다중 레벨 처리를 위해 기능에 기반한 추상화 방법과 확장을 사용한다는 점에서 차이점을 나타낸다. 제안하는 그래프 레이아웃 방법은 추상화, 위치화, 확장의 3부분으로 구성되어 있으며 특히 추상화 부분은 다중 레벨 처리를 포함한다.

  • PDF

신경세포 연접후 위치에 단백질합성 해석시작인자(eIF)들의 존재 (Localization of Translation Initiation Factors to the Postsynaptic Sites)

  • 최명권;박성동;박인식;문일수
    • 생명과학회지
    • /
    • 제21권11호
    • /
    • pp.1526-1531
    • /
    • 2011
  • 신경세포의 연접후 위치에서 단백질합성은 국소적 연접가소성의 조절에 중요한 역할을 한다. 본 연구에서는 연접후 위치에 eIF들이 존재하는지를 배양한 흰쥐해마신경세포의 면역세포화학적 염색과 immunoblot, 그리고 세제세척실험으로 알아보았다. 단백질해석 시작단계의 초기에 중요한 역할을 하는 eIF4E와 eIF4G, 개시코돈을 찾는 단계에서 중요한 eIF5, 외부자극에 의하여 합성을 시작하게 하는 eIF6, 그리고 불리한 환경에서 해석의 효율을 높여주는 eIF5A 들은 모두 해마신경세포의 연접후에 위치함을 배양한 해마신경세포를 다중초점형광현미경으로 관찰할 수 있었다. 또한 Immunoblot 실험에서도 이들은 연접후치밀질(PSD) 분획에서 검출되었으며, 여러 가지 세제에 의하여 PSD로부터 잘 떨어지지 않는 것으로 보아 PSD와 강하게 결합하고 있음을 알 수 있었다. 본 연구결과는 여러 가지 eIF들이 연접후에 위치하여 다양한 상황에서 단백질합성을 시작하게 할 수 있음을 시사한다.

역류분배를 이용한 모델단백질의 분리정제시 pH의 영향에 관한 연구 (Effects of pH on the Separation and Purification of Model Protein using Counter Current Distribution)

  • 이부용;이창호;이철호
    • 한국식품과학회지
    • /
    • 제22권1호
    • /
    • pp.56-60
    • /
    • 1990
  • 역류분배 방법을 이용한 단백질의 분리정제 가능성을 높이기 위하여 4가지 모델단백질에 대하여 수용성 액체 2상계에서의 분획계수를 pH 변화에 따라 조사하였다. 또한 역류분배를 이용한 다중분배추출방식으로 모델 단백질의 혼합물을 수준의 pH(4.5-12.0)에서 분획하였다. 그 결과 pH에 따라 단백질들의 등전점 차이로 인한 분획계수(K)값이 다르게 나타서, 다중분배를 행할 때 각 단백질 분획들이 위치하는 튜브번호가 다르게 되므로 역류분배 방법을 통한 단백질의 분리 가능성을 보여주었다.

  • PDF

순차 패턴 마이닝 기법을 이용한 단백질 서열 분류 (Classification of Protein Sequence Using Sequential Pattern Mining)

  • 정광호;김진수;최성용;한승진;이정현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.298-300
    • /
    • 2004
  • 기존의 생물정보학 연구는 전체 서열들의 매칭을 통한 상동성 연구에 중점을 두고 진행되어 왔다 최근에 서열 데이터베이스의 급격한 증가와 게놈 정보가 축적됨에 따라 서열로부터 다양한 정보를 얻기 위해 서열 데이터 분석에 마이닝 기법을 접목시키고자 하는 다양한 기술들이 제안되고 있다. 단백질과 DNA의 서열 비교는 생물정보학의 기본 작업 기운데 하나이다. 신속하고 자동화 된 서열 비교 능력은 새로운 서열에 대한 기능 판별 및 분석 등 모든 작업을 용이하게 한다 본 논문에서는 동종의 단백질 서열들을 다중 정렬하여 일치하는 구간을 찾아내고, 그 구간에서 아미노산 코드와 위치정보를 이용해 동종 서열들 간의 특정한 패턴 규칙을 찾아내고, 새로운 서열에서 어떤 서열 필턴 특징이 발생하는지를 찾아냄으로써 서얼을 분류하는 방법을 제안한다.

  • PDF

다중서열정렬에 기반한 종의 차이 (Differences between Species Based on Multiple Sequence Alignment Analysis)

  • 권혁주;김상진;김근무
    • 한국전자통신학회논문지
    • /
    • 제19권2호
    • /
    • pp.467-472
    • /
    • 2024
  • 다중서열정렬(MSA : multiple sequence alignment)은 다양한 생명체에서 같은 기능을 하는 여러 개의 단백질 서열이나 핵산 서열을 한 번에 모아서 서로 정렬하는 방법이다. 바이오파이썬을 이용하여 인간이 다른 동물과 어떻게 다른지 조사하였다. 대표적인 다중서열정렬 알고리즘인 clustalW는 열의 위치별로 정렬된 정도를 비교한다. 또한, 웹로고와 계통수를 만들어서 보존서열을 가시화하여 이해도를 향상한다. 인간과 다른 동물의 차이점을 확인하는 예를 제시하고 바이오파이썬을 활용도를 제시한다.

아미노-말단 리보플라빈 생성효소 단백질의 형광 특성 (Spectrofluorometric Characteristics of the N-Terminal Domain of Riboflavin Synthase)

  • 김류련;이정환;남기석;고경원;이찬용
    • 미생물학회지
    • /
    • 제47권1호
    • /
    • pp.14-21
    • /
    • 2011
  • 리보플라빈 생성효소(riboflavin synthase)는 기질인 두 분자의 6,7-dimetyl-8-ribityllumazine과 결합 후, 4-탄소 단위(4-carbon unit)의 자리 옮김 반응을 거쳐 한 분자의 리보플라빈과 한 분자의 pyrimidine 유도체를 형성하는 반응을 촉매한다. 대장균(Escherichia coli) 리보플라빈 생성효소의 아미노-말단 도메인 절반(N-terminal domain half)과 카복시-말단 도메인 절반(C-terminal domain half)은 매우 유사한 내부 자체 아미노산 서열(intra-molecular amino acid sequence)을 갖는다. 아미노-말단 영역 리보플라빈 생성효소(N-RS) 단백질의 구조와 형광 특성을 알아보기 위하여 중합효소 연쇄 반응과 위치지정 돌연변이를 통하여 10개 이상의 돌연변이 아미노-말단 리보플라빈 생성효소 단백질을 코드 하는 유전자를 증폭시켜 pQE30 벡터에 삽입한 재조합 플라스미드를 제조하여, 과발현시킨 후 분리 정제하였다. 대부분의 아미노-말단 도메인 리보플라빈 생성효소의 돌연변이 단백질들은 야생형과 같이 형광성 리간드인 6,7-dimetyl-8-ribityllumazine 혹은 리보플라빈과 결합할 수 있는 능력을 지니고 있었으나, N-RS C47D, N-RS ET66,67DQ 돌연변이 단백질의 경우는 리간드와의 결합능력이 현저히 떨어져 형광을 띠지 않았다. 대부분의 돌연변이 단백질들의 형광 세기는 야생형 단백질(N-RS wt)보다 낮았으나, N-RS C48S는 예외적으로 야생형 단백질에 비해 2배 이상의 형광세기를 가졌다. 이와 같은 결과를 바탕으로 리보플라빈 생성효소와 형광성 리간드 사이의 상호작용을 예측 할 수 있으며, N-RS C48S 돌연변이 단백질의 형광성을 활용하여 효과적으로 효소 저해제를 발굴할 수 있는 고속다중 스크리닝 법(high-throughput screening system)으로써 활용될 수 있을 것이다.

다중 피크의 영역 성장 기법에 의한 전기영동 젤의 영상 분석 ((Image Analysis of Electrophoresis Gels by using Region Growing with Multiple Peaks))

  • 김영원;전병환
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권5_6호
    • /
    • pp.444-453
    • /
    • 2003
  • 최근 생명공학(BT)에 대한 관심이 집중되면서, 새로운 생리활성 물질을 찾거나 유전자 정보를 분석하기 위한 목적으로 전기영동 젤의 영상 분석 기술에 대한 요구가 급증하고 있다. 이를 위해서는 젤 영상의 레인에서 각 밴드의 위치와 양을 정확히 측정해야 한다. 기존 연구에서는 주로 레인의 프로파일에서 피크를 탐색하는 접근방법을 사용하는데, 이 피크의 위치는 밴드에 있는 최대 자기 화소의 위치도 아니고 더욱이 밴드 무게중심의 위치도 아니기 때문에 밴드의 대표 위치로 인정하기 어렵다. 또한, 피크 추출을 쉽게 하기 위해 다양한 영상 향상 처리를 적용하기 때문에 밴드의 양을 측정하기에는 부적절한 경우가 많다. 본 논문에서는 영상의 상대적인 밝기를 변화시키지 않으면서 먼저 밴드의 영역을 추출한 후, 밴드 영역의 밝기 합으로 양을 구하고 이의 무게중심을 밴드 위치로 정하는 방식을 채택한다. 실제로, 먼저 젤 영상 히스토그램에 엔트로피기반 임계치를 설정하여 레인을 추출한 후, 밴드 영역 추출을 위해 서로 다른 세 가지 방법을 시도한다. 첫째, 추출된 레인을 이등분하는 중심선을 탐색하여 피크와 밸리를 찾고, 피크의 상하 밸리를 각 밴드의 최소 포함 박스영역으로 지정하는 방법(MER), 둘째, 앞의 방법에서와 같이 구한 피크를 영역 성장의 시드로 사용하여 이웃하는 밴드와의 중첩을 해결하면서 밴드 영역을 추출하는 방법(RG-1), 셋째, 이와 달리 레인을 삼등분하는 두 탐색선에서 피크를 찾고 동일한 밴드에 속하는 피크 쌍을 결정한 후 영역을 성장하는 방법(RG-2)을 제안한다. 이상의 세 방법을 비교하기 위해 밴드의 위치 및 양을 측정한 결과, 밴드 위치의 평균 오차는 레인의 길이를 단위 크기로 정규화 할 때, MER 방법이 6%, RG-1 방법이 3%, RG-2 방법이 1%로 나타났다. 또한, 밴드 양의 평균 오차는 레인 내 밴드들의 양의 합을 단위 크기로 정규화 할 때, MER 방법이 8%, RG-1 방법이 5%, RG-2 방법이 2%로 나타났다. 결과적으로, RG-2 방법이 밴드의 위치 및 양 추출에 있어서 정확도가 가장 높은 것으로 판명되었다.