Trends of Standardization for Genome Compression and Storage

유전체 압축 및 저장 표준 동향

  • Published : 2017.02.01

Abstract

유전체 분석을 위한 시퀀싱 기술의 발전으로 유전체 데이터량이 폭발적으로 증가하고 있다. 저장 및 관리 비용 절감을 위해 유전체 데이터 압축 기술이 연구되고 있지만, 국제 표준의 부재로 다양한 포맷들이 사용되고 있다. 최근, MPEG에서 유전체 데이터의 압축 및 저장 표준에 대한 필요성을 받아들여 표준화 작업이 진행 중이다. 본고에서는 유전체 분석의 기본이 되는 염기서열의 분석 과정을 소개하고, 유전체 데이터 압축 및 저장 기술의 표준화 동향에 대해서 살펴보고자 한다.

Keywords

Acknowledgement

Grant : 초고품질 콘텐츠 지원 UHD 실감방송/디지털 시네마/사이니지 융합 서비스 기술 개발

Supported by : 정보통신기술진흥센터

References

  1. http://www.reuters.com/article/us-health-genomics-cloud-insight-idUSKBN0OL0BG20150605
  2. https://blog.23andme.com/news/one-in-a-million/
  3. 이수민, "최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향," BRIC View 동향리포트, Dec. 2014.
  4. Scott D. Kahn, "On the Future of Genomic Data," Science, vol. 331, Feb. 11th, 2011, pp. 728-729. https://doi.org/10.1126/science.1197891
  5. 장보영, 최민규, "2016년 MIT 10대 혁신 기술," KIAT 산업기술전략 Brief, June. 15th, 2016.
  6. J. Shendure and H. Ji, "Next-Generation DNA Sequencing," Nature biotechnology, vol. 26, No. 10, Oct. 2008.
  7. C. Alberti and M. Mattavelli, "Genome Compression 101 - Tutorial on Genome Compression and Storage," ISO/IEC JTC 1/SC 29/WG 11 N15527, June, 2015.
  8. "Database for Evaluation of Genomic Information Compression and Storage," ISO/IEC JTC 1/SC 29/WG 11 N16145, Feb. 2016.
  9. https://en.wikipedia.org/wiki/DNA_sequencer
  10. L.D. Stein, "The Case for Cloud Computing in Genome Informatics," Genome Biology, May, 2010.
  11. C. Alberti et al., "Proposal for Opening an Exploration Activity within SC29WG11 for the Definition of a Standard Technology for the Compression, Storage and Streaming of Genome Data," ISO/IEC JTC 1/SC 29/WG 11 M33114, Mar.-April, 2014.
  12. "Results of the Evaluation of the CfE on Genomic Information Compression and Storage," ISO/IEC JTC 1/SC 29/WG 11 N16147, Feb. 2016.
  13. Come Raczy, "Compression," ISO/IEC JTC 1/SC 29/WG 11 N16137, Feb. 2016
  14. "Joint Call for Proposals for Genomic Information Compression and Storage," ISO/IEC JTC 1/SC 29/WG 11 N16320, ISO/TC 276/WG 5 N99, June, 2016.
  15. "Requirements on Genomic Information Compression and Storage," ISO/IEC JTC 1/SC 29/WG 11 N16323, ISO/TC 276/WG 5 N97, June, 2016.
  16. "Evaluation Procedure for the Joint Call for Proposals on Genomic Information Compression and Storage," ISO/IEC JTC 1/SC 29/WG 11 N16321, ISO/TC 276/WG 5 N98, June, 2016.
  17. "Database for Evaluation of Genomic Information Compression and Storage," ISO/IEC JTC 1/SC 29/WG 11 N16322, ISO/TC 276/WG 5 N96, June, 2016.
  18. "Summary of the Current Status and Workplan of the Joint TC276/WG5 JTC1/SC29/WG11 Standardization Activities on Genomic Information Representation," ISO/IEC JTC 1/SC 29/WG 11 N16529, ISO/TC 276/WG 5 N122, Oct. 2016.
  19. G. Zoia and D. Renzi, "Coding and Transport Framework for Genomic Information," ISO/IEC JTC 1/SC 29/WG 11 M38961, Oct. 2016.
  20. J. Delgado et al., "GENIFF (GENomic Information File Format), a proposal for a Secure Genomic Information Transport Layer (GITL) based on the ISO Base Media File Format," ISO/IEC JTC 1/SC 29/WG 11 M39175, Oct. 2016.
  21. "Core Experiments on Genomic Information Representation," ISO/IEC JTC 1/SC 29/WG 11 N16526, ISO/TC 276/WG 5 N120, Oct. 2016.