DOI QR코드

DOI QR Code

SNP Analysis Method for Next-generation Sequencing Data

차세대 시퀀싱 데이터를 위한 SNP 분석 방법

  • 홍상균 (한림대학교 컴퓨터공학과) ;
  • 이덕해 (한림대학교 컴퓨터공학과) ;
  • 공진화 (한림대학교 컴퓨터공학과) ;
  • 김덕근 (한림대학교 컴퓨터공학과) ;
  • 홍동완 (한림대학교 컴퓨터공학과) ;
  • 윤지희 (한림대학교 컴퓨터공학과)
  • Published : 2010.11.12

Abstract

최근 차세대 시퀀싱 기술의 급속한 발전에 따라 서열 정보의 해독이 비교적 쉬워지면서 개인별 맞춤의학의 실현에 대한 기대와 관심이 높아지고 있다. 각 개인의 서열 정보 사이에는 SNP (single nucleotide polymorphism), Indel, CNV (copy number variation) 등의 다양한 유전적 구조 변이가 존재하며, 이러한 서열 정보의 부분적 차이는 각 개인의 유전적 특성 및 질병 감수성 등과 밀접한 관련을 갖는다. 본 연구에서는 차세대 시퀀싱 결과로 산출되는 수많은 짧은 DNA 서열 조각인 리드 데이터를 이용한 SNP 추출 알고리즘을 제안한다. 제안된 알고리즘에서는 레퍼런스 시퀀스의 각 위치에 대한 리드 시퀀스의 매핑 정보를 기반으로 SNP 후보 영역을 추출하며, 품질 정보 등을 활용하여 에러 발생률을 최소화한다. 또한 대규모 시퀀싱 데이터와 SNP 구조 변이 데이터의 효율적인 저장/검색을 지원하는 시각적 분석 도구를 구현하여 제안된 방식의 유용성을 검증한다.

Keywords