Performance Improvement of Data Replication in Cloud Computing

Cloud Computing에서의 데이터 복제 성능 개선

  • Lee, Joon-Kyu (Dept. of Information & Communications Engineering, Daejeon University) ;
  • Lee, Bong-Hwan (Dept. of Information & Communications Engineering, Daejeon University)
  • 이준규 (대전대학교 정보통신공학과) ;
  • 이봉환 (대전대학교 정보통신공학과)
  • Published : 2008.10.31

Abstract

Recently, the distributed system is being evolved into a new paradigm, named cloud computing, which provides users with efficient computing resources and services from data centers. Cloud computing would reduce the potential danger of Grid computing which utilizes resource sharing by constructing centralized data center. In this paper, a new data replication scheme is proposed for Hadoop distributed file system by changing 1:1 data transmission to 1:N. The proposed scheme considerably reduced the data transmission delay comparing to the current mechanism.

최근 분산시스템은 사용자들에게 데이터센터의 컴퓨팅 자원 및 서비스를 온라인 상에서 효율적으로 제공하는 개념의 클라우드 컴퓨팅으로 진화하고 있다. 클라우드 컴퓨팅은 그리드 컴퓨팅에서 지역적으로 분산되어 있는 컴퓨팅 시스템 자원의 공유로 인하여 발생하는 잠재적 위험성을 중앙집중화 된 형태의 데이터센터를 구축하여 줄이고, 거대한 데이터 세트를 분산 처리할 수 있게 하는 서비스 플랫폼이다. 본 논문에서는 대표적인 클라우드 컴퓨팅 미들웨어인 하둡에서 데이터 복제 시 사용하는 1:1 전송 방식을 1:N 방식으로 수정하여 성능을 개선하는 메커니즘을 제안하였다. 제안한 1:N 데이터 복제 방식은 기존의 방식에 비하여 데이터 전송 시간을 현저히 개선하였다.

Keywords