Improving ncRNA Prediction using RNA common-structural Desciptor (RCSD) Committee Machine

RNA 공통 구조 기술자 Committee Machine을 이용한 ncRNA 예측 성능 향상 기법

  • Nam Jin-Wu (Graduate Program in Bioinformatics Seoul National University) ;
  • Kim Sung-Kyu (Center for Bioinformation Technology (CBIT) Seoul National University) ;
  • Joung Je-Gun (Graduate Program in Bioinformatics Seoul National University) ;
  • Zhang Byoung-Tak (Biointelligence Laboratory, School of Computer Science and Engineering Seoul National University)
  • 남진우 (서울대학교 대학원 생물정보학 협동과정) ;
  • 김성규 (서울대학교 바이오정보기술 연구센터(CBIT)) ;
  • 정제균 (서울대학교 대학원 생물정보학 협동과정) ;
  • 장병탁 (서울대학교 대학원 컴퓨터공학부 바이오지능연구실)
  • Published : 2005.11.01

Abstract

최근 포유동물의 유전체에는 알려진 것보다 훨씬 많은 RNA 전사체가 발현되고 있음이 밝혀지고 있으며, 그 중에 많은 부분이 non-coding RNA로 알려지고 있다. 세포 내에서 non-coding RNA의 기능이 훨씬 다양해지고, 중요해지고 있는 상황에서 새로운 non-coding RNA를 정의하고, 탐색하는 것은 가장 시급한 과제이다. 본 연구에서는 이전 연구에서 RNA 공통 구조 학습을 위해 제안되었던, esRCSG (evolutionary search for RNA common-structural grammar) 알고리즘의 성능 향상을 위해, committee machine을 도입한다. Committee machine은 마지막 세대에서 최적화된 RNA 공통 구조 기술자 (RCSD)와 차상위로 최적화된 기술자들 중 양성데이터와 음성데이터의 치역을 합쳤을 때 특이도는 거의 변화가 없으면서 민감도의 증가가 가장 큰 기술자들의 집합이다. Committee machine은 특히 family type의 서열의 가진 특정 ncRNA에서 좋은 성능 향상을 보인다. microRNA를 이용한 성능평가에서 특이도의 변화가 거의 없이 민감도의 성능이 약 1.5배 향상되는 결과를 보였다. 이러한 특이도와 민감도가 높은 기술자를 이용함으로써 새로운 non-coding RNA를 예측하는 것을 약속할 수 있을 것이다.

Keywords