An Efficient Data Distribution Store Schemes for Hadoop Distributed File System

하둡 분산 파일 시스템을 위한 효율적인 데이터 분산 저장 기법

  • Choi, Sung-Jin (Technology Development Team, ICT Business Unit, KTDS) ;
  • Jeon, Dae-Seuk (Technology Development Team, ICT Business Unit, KTDS) ;
  • Bae, Dae-Keuk (Technology Development Team, ICT Business Unit, KTDS) ;
  • Choi, Bu-Young (Technology Development Team, ICT Business Unit, KTDS)
  • 최성진 ((주)케이티디에스 ICT 본부 기술개발팀) ;
  • 전대석 ((주)케이티디에스 ICT 본부 기술개발팀) ;
  • 배대극 ((주)케이티디에스 ICT 본부 기술개발팀) ;
  • 최부영 ((주)케이티디에스 ICT 본부 기술개발팀)
  • Published : 2011.06.29

Abstract

클라우드 컴퓨팅이란 인터넷 기술을 활용하여 모든 인프라 자원(소프트웨어, 서버, 스토리지, 네트워크 등)을 서비스화(as a Service)하여, 언제, 어디서든, 장치에 독립적으로 네트워크를 통해 사용하고, 사용한 만큼 비용을 지불하는 컴퓨팅으로써, 대표적인 서비스 업체로는 구글과 아마존이 있다. 최근 아파치 재단에서는 구글의 GFS와 동일 또는 유사한 시스템을 만들기 위해 HDFS 오픈소스 프로젝트를 진행하고 있다. HDFS는 빈번한 하드웨어 고장에도 원본 데이터를 복구할 수 있는 가용성을 보장하기 위해 파일 데이터를 블록 단위로 나누어, 다시 datanode에 복제하여 저장한다. 이 기법은 복제가 많아 질수록 가용성은 높아지나 스토리지가 증가한다는 단점을 가지고 있다. 따라서 본 논문에서는 이러한 문제점을 해결하기 위해 행렬의 특성을 이용한 새로운 분산 저장 기법을 제안한다.

Keywords