DOI QR코드

DOI QR Code

Data Processing Architecture for Cloud and Big Data Services in Terms of Cost Saving

비용절감 측면에서 클라우드, 빅데이터 서비스를 위한 대용량 데이터 처리 아키텍쳐

  • 이병엽 (배재대학교 전자상거래학과) ;
  • 박재열 (충북대학교 정보통신공학과) ;
  • 유재수 (충북대학교 정보통신공학과)
  • Received : 2015.01.22
  • Accepted : 2015.03.11
  • Published : 2015.05.28

Abstract

In recent years, many institutions predict that cloud services and big data will be popular IT trends in the near future. A number of leading IT vendors are focusing on practical solutions and services for cloud and big data. In addition, cloud has the advantage of unrestricted in selecting resources for business model based on a variety of internet-based technologies which is the reason that provisioning and virtualization technologies for active resource expansion has been attracting attention as a leading technology above all the other technologies. Big data took data prediction model to another level by providing the base for the analysis of unstructured data that could not have been analyzed in the past. Since what cloud services and big data have in common is the services and analysis based on mass amount of data, efficient operation and designing of mass data has become a critical issue from the early stage of development. Thus, in this paper, I would like to establish data processing architecture based on technological requirements of mass data for cloud and big data services. Particularly, I would like to introduce requirements that must be met in order for distributed file system to engage in cloud computing, and efficient compression technology requirements of mass data for big data and cloud computing in terms of cost-saving, as well as technological requirements of open-source-based system such as Hadoop eco system distributed file system and memory database that are available in cloud computing.

최근 많은 기관들로부터 클라우드 서비스, 빅 데이터가 향후 대세적인 IT 트렌드 및 확고한 기술로서 예견되고 있다. 또한 현재 IT를 선도하는 많은 벤더를 중심으로 클라우드, 빅데이터에 대한 실질적인 솔루션과 서비스를 제공하고 있다. 이러한 기술들은 기업의 비용절감 측면에서, 클라우드는 인터넷 기반의 다양한 기술들을 기반으로 비즈니스 모델에 대한 자원의 사용을 자유스럽게 선택할 수 있는 장점을 가지고 있어 능동적인 자원 확장을 위한 프로비져닝 기술과 가상화 기술들이 주요한 기술로 주목 받고 있다. 또한 빅데이터는 그동안 분석하지 못했던 새로운 비정형 데이터들에 대한 분석 환경을 제공함으로서 데이터 예측모델의 차원을 한층 높이고 있다. 하지만 클라우드 서비스, 빅데이터의 공통점은 대용량 데이터를 기반으로 서비스 또는 분석을 요하고 있어, 초기 발전 모델부터 대용량 데이터의 효율적인 운영 및 설계가 중요하게 대두 되고 있다. 따라서 본 논문에 클라우드, 빅데이터 서비스를 위한 대용량 데이터 기술 요건들을 토대로 데이터 처리 아키텍처를 정립하고자 한다. 특히, 클라우드 컴퓨팅을 위해 분산 파일 시스템이 갖추어야 할 사항들과 클라우드 컴퓨팅에서 활용 가능한 오픈소스 기반의 하둡 분산 파일 시스템, 메모리 데이터베이스 기술요건을 소개하고, 빅데이터, 클라우드의 대용량 데이터를 비용절감 측면에서 효율적인 압축기술 요건들을 제시한다.

Keywords

References

  1. 민옥기, 김학영, 남궁한, 클라우드 컴퓨팅 기술 동향, 전자통신동향 분석, 2009.
  2. 이정아, 모바일클라우드 서비스 국내외 정책 추진 현황, KT경제경연 연구소, 2010.
  3. 정제호, "클라우드 컴퓨팅의 현재와 미래, 그리고 시장 전략," http://www.software.or.kr, 2008년 10월.
  4. 채승병, SERI경영노트, 제167호, 2012(10).
  5. Adrian Johnson, "IDG Summary, Cloud & DataCenter World 2013, pp.1-5.
  6. George Lawton, "Developing Software Online with Platform-as-a-Servic Technology," Computer, Vol.41, 2008(6).
  7. http://hadoop.apache.org/core/docs
  8. KIPA, SaaS 대표주자, Salesforce.com의 성장세 분석, 2007(11).
  9. Oracle, Oracle Advanced Compression White Paper, 2012.
  10. "Vision, Hype, and Reality for Delivering IT Services as Computing Utilities," HPCC 2008 Keynote, 2008.
  11. http://hadoop.apache.org/
  12. http://ko.wikipedia.org/wiki/%EB%B9%85_%EB%8D%B0%EC%9D%B4%ED%84%B0
  13. http://blog.cafe-latte.co.kr/