RNA-Seq 데이터를 이용한 선택 스플라이싱 유형 분석

Alternative Splicing Pattern Analysis from RNA-Seq data

  • 공진화 (한림대학교 컴퓨터공학과) ;
  • 이종근 (한림대학교 컴퓨터공학과) ;
  • 이은주 (한림대학교 전자공학과) ;
  • 윤지희 (한림대학교 컴퓨터공학과)
  • Kong, Jin-Hwa (Dept. of Computer Engineering, Hallym University) ;
  • Lee, Jong-Keun (Dept. of Computer Engineering, Hallym University) ;
  • Lee, Un-Joo (Dept. of Electronic Engineering, Hallym University) ;
  • Yoon, Jee-Hee (Dept. of Computer Engineering, Hallym University)
  • 발행 : 2011.06.29

초록

선택 스플라이싱 (alternative splicing)은 mRNA (messenger RNA)의 전구체인 pre-mRNA가 mRNA로 전사될 때 pre-mRNA의 엑손 영역들 (exons)이 여러 가지 유형 (pattern)으로 다시 연결되는 과정을 말한다. 선택 스플라이싱에 의해 하나의 유전자로부터 서로 다른 mRNA가 만들어 지고 서로 다른 이소형의 단백질 (protein isoforms)이 생성된다. 현재까지 알려진 선택 스플라이싱의 유형은 약 7가지 종류가 있으며, 유전자의 돌연변이 및 질병과 밀접한 연관성을 가지고 있는 것으로 알려져 있다. 본 연구에서는 차세대 시퀀싱 (Next Generation Sequencing : NGS) 기술로 생성된 RNA-Seq 데이터로부터 각 유전자 영역에 대한 선택 스플라이싱 유형을 분류/추출하는 새로운 알고리즘을 제안한다. 제안된 알고리즘에서는 RNA-Seq 데이터를 DNA 시퀀스와 mRNA 트랜스크립트 시퀀스에 동시 매핑하고, 각 엑손 영역에 정렬된 RNA-Seq 데이터의 커버리지 정보 및 엑손의 접합 (junction) 정보를 이용하여 발현된 트랜스크립트 (transcript)의 종류와 양을 측정한다. 알고리즘의 유효성을 보이기 위하여 시뮬레이션 데이터를 이용한 인간 유전자 영역에서의 선택 스플라이싱 유형 추출 실험을 수행하였으며, 검증된 선택 스플라이싱 DB와 비교, 검증하였다.

키워드

과제정보

연구 과제 주관 기관 : 한국연구재단