Compound Backup Technique using Hot-Cold Data Classification in the Distributed Memory System

분산메모리시스템에서의 핫콜드 데이터 분류를 이용한 복합 백업 기법

  • Received : 2014.12.22
  • Accepted : 2015.09.21
  • Published : 2015.09.30

Abstract

As the IT technology advances, data processing system is required to handle and process large amounts of data. However, the existing On-Disk system has limit to process data which increase rapidly. For that reason, the In-Memory system is being used which saves and manages data on the fast memory not saving data into hard disk. Although it has fast processing capability, it is necessary to use the fault tolerance techniques in the In-Memory system because it has a risk of data loss due to volatility which is one of the memory characteristics. These fault tolerance techniques lead to performance degradation of In-Memory system. In this paper, we classify the data into Hot and Cold data in consideration of the data usage characteristics in the In-Memory system and propose compound backup technique to ensure data persistence. The proposed technique increases the persistence and improves performance degradation.

IT 기술의 발전으로 인해 데이터 처리 시스템은 많은 양의 데이터를 처리 및 가공해야 한다. 하지만, 기존에 사용되던 온디스크(On-Disk) 시스템으로는 급증하는 데이터를 빠르게 처리하는 데 한계점을 가졌다. 이로 인해 많은 분야에서 하드디스크에 데이터를 저장하는 것이 아닌 속도가 빠른 메모리에 데이터를 저장 및 관리하는 인메모리(In-Memory) 시스템이 도입되고 있다. 하지만, 메모리에 데이터를 관리하는 것은 메모리의 특성 중 하나인 휘발성으로 인해 데이터 손실이라는 위험을 갖기 때문에 항상 결함 허용 기법이 뒤따라야 한다. 결함 허용 기법은 인메모리 시스템의 처리 속도를 낮추는 성능 저하 원인이 된다. 따라서 본 논문에서는 인메모리 시스템의 데이터 사용 특성을 고려하여 핫콜드 데이터로 분류하고, 데이터 영속성 보장을 위한 복합 백업 기법을 제안한다. 제안하는 기법은 영속성을 높이고, 성능 저하 원인을 보완한다.

Keywords

References

  1. 구영수, "In-Memory Computing 기술현황 및 전망", Technology Inside G CNS R&D Journal, 2013. 1
  2. M.K. Gupta, V. Verma, and M.S. Verma, "In-Memory Database Systems - A Paradigm Shift", International Journal of Engineering Trends and Technology (IJETT), vol. 6, no. 6, pp. 333-336, Dec. 2013.
  3. F. Cristian, "Understanding Fault-Tolerant Distributed Systems", Communications of the ACM, vol. 34, no. 2, pp. 56-78, Feb. 1991. https://doi.org/10.1145/102792.102801
  4. R. Cattell, "Scalable SQL and NoSQL Data Stores", ACM SIGMOD Record, vol. 39, no. 4, pp. 12-27, Dec. 2010.
  5. R. Koo and S. Toueg, "Checkpointing and Rollback-Recovery for Distributed Systems", Software Engineering, IEEE Transactions on, vol. 13, no. 1, pp. 23-31, Jan. 1987.
  6. J. Zhao, S. Li, D.H. Yoon, Y. Xie, and N.P. Jouppi, "Kiln: Closing the Performance gap between Systems with and without persistence support", Proceedings of the 46th Annual IEEE/ACM International Symposium on Microarchitecture, pp. 421-432, Canada, Dec. 2013.
  7. J.J. Levandoski, P. Larson, and R. Stoica, "Identifying Hot and Cold Data in Main-Memory Databases", Data Engineering (ICDE), 2013 IEEE 29th International Conference on, Brisbane QLD, pp. 26-37, Apr. 2013.
  8. B.F. Cooper, A. Silberstein, E. Tam, R. Ramakrishnan, and R. Sears, "Benchmarking cloud serving systems with YCSB", Proceedings of the 1st ACM Symposium on Cloud Computing, pp. 143-154, USA, Jun, 2010.