Analysis of Scalable Triple Repository Architecture for Big Data

대용량 데이터 기반 트리플 저장소 아키텍처 분석

  • Kim, Tae-Hong (University of Science and Technology) ;
  • Um, Jung-Ho (Korea Institute of Science and Technology Information) ;
  • Cho, Min-Hee (Korea Institute of Science and Technology Information) ;
  • Choi, Sung-Pil (Korea Institute of Science and Technology Information) ;
  • Jung, Han-Min (Korea Institute of Science and Technology Information)
  • 김태홍 (과학기술연학대학원대학교) ;
  • 엄정호 (한국과학기술정보연구원) ;
  • 조민희 (한국과학기술정보연구원) ;
  • 최성필 (한국과학기술정보연구원) ;
  • 정한민 (한국과학기술정보연구원)
  • Published : 2012.06.22

Abstract

비정형데이터의 분석을 위한 다양한 연구가 진행되면서 폭발적인 트리플 데이터 증가가 이루어졌다. 이는 결국 서비스 인프라의 병목현상을 초래하고 있으며, 그 해결책으로서 분산 병렬 아키텍처가 주목받고 있다. 본 논문은 대용량 시맨틱웹 자원을 저장, 적재, 질의 및 추론할 수 있는 트리플 저장소 특성에 가장 적합한 시스템 구조를 선정하기 위해 대용량 처리 능력, 데이터 처리 속도 및 안정성의 측면에서 연합 DBMS와 맵리듀스를 분석하는데 초점을 맞추고 있다. 분석 결과는 대용량 데이터 기반 트리플 저장소의 특성과 아키텍처의 유연성 및 향후 성능 개선 가능성을 판단하는 요소로 활용하여 맵리듀스 방식을 대용량 트리플 저장소에 적합한 방식으로 선정하였다. 본 연구는 대용량 데이터 기반 트리플 저장소 개발의 방향 수립을 위한 기반 연구로서 중요한 가치를 가진다.

Keywords