DOI QR코드

DOI QR Code

An implementation of MongoDB based Distributed Triple Store on Jena Framework

MongoDB를 활용한 Jena 프레임워크 기반의 분산 트리플 저장소 구현

  • Ahn, Jinhyun (Biomedical Knowledge Engineering Lab. Seoul National University) ;
  • Yang, Sungkwon (Biomedical Knowledge Engineering Lab. Seoul National University) ;
  • Lee, Munhwan (Biomedical Knowledge Engineering Lab. Seoul National University) ;
  • Jung, Jinuk (Biomedical Knowledge Engineering Lab. Seoul National University) ;
  • Kim, Eung-Hee (Biomedical Knowledge Engineering Lab. Seoul National University) ;
  • Im, Dong-Hyuk (Dept. of Computer Engineering, Hoseo University) ;
  • Kim, Hong-Gee (Biomedical Knowledge Engineering Lab. Seoul National University)
  • 안진현 (서울대학교 의생명지식공학연구실) ;
  • 양성권 (서울대학교 의생명지식공학연구실) ;
  • 이문환 (서울대학교 의생명지식공학연구실) ;
  • 정진욱 (서울대학교 의생명지식공학연구실) ;
  • 김응희 (서울대학교 의생명지식공학연구실) ;
  • 임동혁 (호서대학교 컴퓨터공학과) ;
  • 김홍기 (서울대학교 의생명지식공학연구실)
  • Published : 2015.10.28

Abstract

웹을 통한 데이터 공유에 대한 관심의 증가로 RDF 트리플 형태의 데이터가 폭발적으로 증가하고 있다. 대용량 RDF 데이터를 저장하고 빠른 SPARQL 질의 처리를 지원하는 트리플 저장소의 개발이 중요하다. 아파치 프로젝트 중 하나인 Jena-TDB는 가장 잘 알려진 오픈소스 트리플 저장소 중 하나로서 Jena 프레임워크 기반으로 구현됐다. 하지만 Jena-TDB 의 경우 단일 컴퓨터에서 작동하기 때문에 대용량 RDF 데이터를 다룰 수 없다는 문제점이 있다. 본 논문에서는 MongoDB를 활용한 Jena 프레임워크 기반의 트리플 저장소인 Jena-MongoDB를 제안한다. Jena 프레임워크를 사용했기 때문에 기존 Jena-TDB와 동일한 인터페이스로 사용할 수 있고 최신 표준 SPARQL 문법도 지원한다. 또한 MongoDB를 사용했기 때문에 분산환경에서도 작동할 수 있다. 대용량 LUBM 데이터셋에 대한 SPARQL 질의 처리 실험결과 Jena-MongoDB가 Jena-TDB 보다 빠른 질의 응답 속도를 보여줬다.

Keywords

Acknowledgement

Grant : WiseKB: 빅데이터 이해 기반 자가학습형 지식베이스 및 추론 기술 개발

Supported by : 정보통신기술진흥센터