A Content-Aware toad Balancing Technique Based on Histogram Transformation in a Cluster Web Server

클러스터 웹 서버 상에서 히스토그램 변환을 이용한 내용 기반 부하 분산 기법

  • 홍기호 ((주)엘비에스 플러스 연구소 솔루션 개발팀) ;
  • 권춘자 (강릉영동대학 사이버경찰과) ;
  • 최황규 (강원대학교 전기전자정보통신공학부)
  • Published : 2005.04.01

Abstract

As the Internet users are increasing rapidly, a cluster web server system is attracted by many researchers and Internet service providers. The cluster web server has been developed to efficiently support a larger number of users as well as to provide high scalable and available system. In order to provide the high performance in the cluster web server, efficient load distribution is important, and recently many content-aware request distribution techniques have been proposed. In this paper, we propose a new content-aware load balancing technique that can evenly distribute the workload to each node in the cluster web server. The proposed technique is based on the hash histogram transformation, in which each URL entry of the web log file is hashed, and the access frequency and file size are accumulated as a histogram. Each user request is assigned into a node by mapping of (hashed value-server node) in the histogram transformation. In the proposed technique, the histogram is updated periodically and then the even distribution of user requests can be maintained continuously. In addition to the load balancing, our technique can exploit the cache effect to improve the performance. The simulation results show that the performance of our technique is quite better than that of the traditional round-robin method and we can improve the performance more than $10\%$ compared with the existing workload-aware load balancing(WARD) method.

최근 인터넷 사용자의 기하급수적 증가에 따라 저렴한 가격의 고성능 대용량 클러스터 웹 서버 시스템에 관심이 증대되고 있다. 클러스터 웹 서버 시스템은 저렴한 비용. 높은 확장성과 가용성 등의 장점과 더불어 대규모 사용자에 대한 성능의 극대화를 목적으로 연구 개발되고 있으며, 최근에는 성능 향상을 위한 내용 기반의 부하 분산 기법에 관심이 모아지고 있다. 본 논문에서는 이러한 클러스터 웹 서버 상에서 사용자의 접근 빈도와 파일의 크기를 고려하여 각 서버 노드에 부하를 균등하게 할당하는 새로운 내용 기반의 부하 분산 기법을 제안한다. 제안된 기법은 웹 서버 로그의 각 URL 항목에 해시 함수를 적용하여 얻어지는 해시 값에 그 빈도와 전송된 파일의 크기를 고려한 누적 히스토그램을 생성한다. 사용자 요청은 (해시 값-서버 노드) 매핑에 의한 히스토그램 변환 과정을 통하여 각 서버 노드에 균등하게 할당된다. 제안된 기법은 누적 히스토그램을 주기적으로 갱신함으로써 동적으로 클러스터 웹 서버 시스템의 부하를 고르게 분산시킬 수 있으며, 또한 서버 노드의 캐시를 활용함으로써 전체 클러스터 시스템의 성능을 향상시킬 수 있다. 시뮬레이션을 통한 성능 분석에서 제안된 기법은 전통적인 라운드 로빈 방법보다는 월등히 우수함을 보이고, 기존의 내용 기반 WARD 방법보다는 약 $10\%$ 정도의 우수한 성능을 나타낸다.

Keywords