• 제목/요약/키워드: NGS techniques

검색결과 12건 처리시간 0.018초

빅데이터 및 고성능컴퓨팅 프레임워크를 활용한 유전체 데이터 전처리 과정의 병렬화 (Parallelization of Genome Sequence Data Pre-Processing on Big Data and HPC Framework)

  • 변은규;곽재혁;문지협
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제8권10호
    • /
    • pp.231-238
    • /
    • 2019
  • 차세대 염기 서열 분석법이 생성한 유전체 원시 데이터를 기존의 방식대로 하나의 서버에서 분석하기 위해서는 데이터 크기에 따라 수십 시간이 필요할 수 있다. 그러나 응급 환자의 진단처럼 수 시간 내에 결과를 알아야 하는 상황이 존재하기 때문에 단일 유전체 분석의 성능을 향상시킬 필요가 있다. 본 연구에서는 빅데이터 기술의 병렬화 기법과 고속의 네트워크로 연결되고 병렬파일시스템을 공유하는 고성능컴퓨팅 클러스터를 적극적으로 활용하여 분석 시간을 크게 단축시킬 수 있는 유전체 데이터 분석의 전처리 프로세스의 병렬화 방법을 제안한다. 분석 데이터의 신뢰성을 위해 기존의 검증된 분석 도구 및 알고리즘을 새로운 환경에 맞게 병렬화 하는 전략을 선택하였다. 프로세스의 병렬화, 데이터의 분배 및 병렬 병합 기법을 개발하였고 실험을 통해 성능 향상을 확인하였다.

DNA 서열 분석을 위한 클라우드 컴퓨팅 기반 지능형 미들웨어 설계 (A Framework of Intelligent Middleware for DNA Sequence Analysis in Cloud Computing Environment)

  • 오준석;이윤재;이봉규
    • 인터넷정보학회논문지
    • /
    • 제15권1호
    • /
    • pp.29-43
    • /
    • 2014
  • 차세대 유전체 해독 기술과 자동화 기술이 발전하면서 DNA 서열 분석 환경이 개선되고 있지만, 아직까지 제한된 컴퓨팅 리소스는 분석시간 단축의 장애요인으로 작용하고 있다. 대부분의 과학 워크플로우 시스템은 수 많은 기능들이 특정 시스템 환경에 맞추어 구현되어 있기 때문에 복잡하고 유동적이지 못하며, 이로 인해 기존 시스템의 컴포넌트들을 클라우드 환경의 새로운 시스템에 적용하기 어려운 한계를 지니고 있다. 본 연구에서는 대량의 DNA 데이터를 동시적으로 분석할 수 있는 가상 인스턴스 제공이 가능하며 시스템간의 상호 운용성을 개선시키기 위하여 웹 서비스, DBMS, 클라우드 컴퓨팅 기능을 지원하는 DNA 서열 분석용 미들웨어를 개발하였다. 본 연구에서 개발된 지능형 미들웨어는 DBMS를 사용하여 파이프라인 정보를 관리하고, 클라우드 환경에서 경량의 가상 인스턴스를 제공하며, 상호운용성 개선을 위하여 단순 URI와 XML을 기반으로 한 RESTful 웹서비스 기능을 제공한다.