Annual Conference of KIPS (한국정보처리학회:학술대회논문집)
- 2010.11a
- /
- Pages.95-98
- /
- 2010
- /
- 2005-0011(pISSN)
- /
- 2671-7298(eISSN)
DOI QR Code
SNP Analysis Method for Next-generation Sequencing Data
차세대 시퀀싱 데이터를 위한 SNP 분석 방법
- Hong, Sang-kyoon (Dept of Computer Engineering, Hallym University) ;
- Lee, Deok-hae (Dept of Computer Engineering, Hallym University) ;
- Kong, Jin-hwa (Dept of Computer Engineering, Hallym University) ;
- Kim, Deok-Keun (Dept of Computer Engineering, Hallym University) ;
- Hong, Dong-wan (Dept of Computer Engineering, Hallym University) ;
- Yoon, Jee-hee (Dept of Computer Engineering, Hallym University)
- 홍상균 (한림대학교 컴퓨터공학과) ;
- 이덕해 (한림대학교 컴퓨터공학과) ;
- 공진화 (한림대학교 컴퓨터공학과) ;
- 김덕근 (한림대학교 컴퓨터공학과) ;
- 홍동완 (한림대학교 컴퓨터공학과) ;
- 윤지희 (한림대학교 컴퓨터공학과)
- Published : 2010.11.12
Abstract
최근 차세대 시퀀싱 기술의 급속한 발전에 따라 서열 정보의 해독이 비교적 쉬워지면서 개인별 맞춤의학의 실현에 대한 기대와 관심이 높아지고 있다. 각 개인의 서열 정보 사이에는 SNP (single nucleotide polymorphism), Indel, CNV (copy number variation) 등의 다양한 유전적 구조 변이가 존재하며, 이러한 서열 정보의 부분적 차이는 각 개인의 유전적 특성 및 질병 감수성 등과 밀접한 관련을 갖는다. 본 연구에서는 차세대 시퀀싱 결과로 산출되는 수많은 짧은 DNA 서열 조각인 리드 데이터를 이용한 SNP 추출 알고리즘을 제안한다. 제안된 알고리즘에서는 레퍼런스 시퀀스의 각 위치에 대한 리드 시퀀스의 매핑 정보를 기반으로 SNP 후보 영역을 추출하며, 품질 정보 등을 활용하여 에러 발생률을 최소화한다. 또한 대규모 시퀀싱 데이터와 SNP 구조 변이 데이터의 효율적인 저장/검색을 지원하는 시각적 분석 도구를 구현하여 제안된 방식의 유용성을 검증한다.
Keywords