• 제목/요약/키워드: SPARQL

검색결과 85건 처리시간 0.029초

SPARQL-to-SQL 변환 알고리즘의 저장소 독립적 활용을 위한 시스템 모델 (A System Model for Storage Independent Use of SPARQL-to-SQL Translation Algorithm)

  • 손지성;정동원;백두권
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권5호
    • /
    • pp.467-471
    • /
    • 2008
  • 웹 온톨로지에 대한 연구가 활발해지면서 웹 온톨로지를 저장하기 위한 다양한 형태의 저장소와 질의 언어가 개발되고 있다. SPARQL의 이용이 증가하고 대부분 관계형 데이타베이스 기반의 저장소를 이용함에 따라 SPARQL을 SQL로 변환하는 알고리즘 개발의 필요성이 대두되었다. 지금까지 제안된 변환 알고리즘들은 SPARQL의 일부만을 SQL로 변환하거나 변환 알고리즘이 저장소 구조에 종속적이라는 문제점이 있다. 이 논문에서는 저장소에 독립적으로 특정 변환 알고리즘을 활용할 수 있는 모델을 제안한다.

관계형 데이터베이스로부터 OWL 온톨로지를 추출하기 위한 SPARQL-DL 프로세서 (SPARQL-DL Processor to Extract OWL Ontologies from Relational Databases)

  • 최지웅;김명호
    • 한국컴퓨터정보학회논문지
    • /
    • 제20권3호
    • /
    • pp.29-45
    • /
    • 2015
  • 본 논문에서는 RDB로부터 가상적 변환에 의해 생성되는 OWL 온톨로지의 질의 응답을 위하여 OWL을 위한 질의어인 SPARQL-DL의 구현 방법을 제안한다. 제안하는 SPARQL-DL 프로세서는 입력된 SPARQL-DL 질의문을 내부에서 SQL 질의문으로 변환하여 실행시킨다. 이러한 질의 처리 방식은 두 가지의 장점이 있다. 첫째, RDB로부터 생성된 OWL 온톨로지를 저장하기 위한 별도의 저장소가 요구되지 않는다. 둘째, 대용량 ABox 추론에 문제점을 나타내는 Tableau 알고리즘 기반의 추론기의 사용 없이도 RDB 인스턴스로부터 생성된 대용량 ABox가 서비스 될 수 있다. 본 논문의 SPARQL-DL 질의문으로부터 SQL 질의문을 생성하는 알고리즘은 RDB와의 연결 수립에 따른 오버헤드를 최소화하기 위하여 입력된 하나의 SPARQL-DL 질의문이 하나의 SQL 질의문으로 변환되도록 설계되어있다.

SPARQL-to-Original SQL 변환 모델 (A Model for SPARQL-to-Original SQL Translation)

  • 성하정;김장원;이석훈;백두권
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.1406-1409
    • /
    • 2012
  • 시맨틱 웹 환경을 통해 수 많은 온톨로지가 생성되고 이를 효율적으로 관리하고 저장하기 위한 온톨로지 저장소에 대한 연구가 진행되고 있다. 더불어 저장된 온톨로지로부터 원하는 정보를 얻기 위해 SPARQL 에 대한 연구 또한 활발히 진행되었다. 현재까지 많은 데이터들이 관계형 데이터베이스에 저장되어 있기 때문에 SPARQL 을 사용하기 위해서는 해당 저장소의 모델에 맞게 SPARQL 을 변환 해야 한다. 하지만 지금까지 연구된 SPARQL-to-SQL 변환 모델은 관계형 데이터베이스에 저장된 데이터를 트리플 형태로 변환하여 온톨로지 저장소에 저장해야 하는 추가 비용이 발생한다. 이 논문에서는 관계형 데이터베이스에 저장된 데이터를 트리플 형태로 변환하여 온톨로지 저장소에 저장하지 않고 SPARQL 질의문의 변환만으로 관계형 데이터베이스에 저장된 데이터에 질의 할 수 있는 SPARQL-to-Original SQL 변환 모델을 제안한다.

Text to SPARQL을 위한 지식 증강 프롬프팅 연구 (Study on Knowledge Augmented Prompting for Text to SPARQL)

  • 이연진;남정재;김우영;김우주
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.185-189
    • /
    • 2023
  • Text to SPARQL은 지식 그래프 기반 질의응답의 한 형태로 자연어 질문을 지식 그래프 검색 쿼리로 변환하는 태스크이다. SPARQL 쿼리는 지식 그래프의 정보를 기반으로 작성되어야 하기 때문에 기존 언어 모델을 통한 코드 생성방법으로는 잘 동작하지 않는다. 이에 우리는 거대 언어 모델을 활용하여 Text to SPARQL를 해결하기 위해 프롬프트에 지식 그래프의 정보를 증강시켜주는 방법론을 제안한다. 이에 더하여 다국어 정보 활용에 대한 영향을 검증하기 위해 한국어, 영어 각각의 레이블을 교차적으로 실험하였다. 추가로 한국어 Text to SPARQL 실험을 위하여 대표적인 Text to SPARQL 벤치마크 데이터셋 QALD-10을 한국어로 번역하여 공개하였다. 위 데이터를 이용해 지식 증강 프롬프팅의 효과를 실험적으로 입증하였다.

  • PDF

온톨로지 추론 모델에 독립적인 SPARQL 추론 질의 처리를 위한 재작성 알고리즘 (A Rewriting Algorithm for Inferrable SPARQL Query Processing Independent of Ontology Inference Models)

  • 정동원;;백두권
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권6호
    • /
    • pp.505-517
    • /
    • 2008
  • 이 논문에서는 SPARQL로 작성된 OWL-DL 온톨로지 질의에 대한 재작성 알고리즘은 제안한다. 현재 웹 온톨로지 저장소는 주어진 SPARQL 질의의 추론 결과를 얻기 위해 추론 온톨로지 모델을 생성하고 SPARQL 질의와 생성된 추곤 온톨로지 모델과의 일치성을 비교한다. 추론 모델은 베이스 온톨로지 모델에 비해 보다 큰 공간을 필요로 하고 다른 추론 질의론 위해 재사용 될 수 없기 때문에 앞서 언급한 접근 방법은 보다 방대한 크기의 SPARQL 질의 처리에 부적합하다. 이러한 문제점을 해결하기 위해 이 논문에서는 비SPARQL 질의를 재작성하고 이를 기본 베이스 온톨로지 모델에 대해 질의 연산을 수행하여 결과를 획득할 수 있는 SPARQL 재작성 알고리즘을 제안한다. 이러한 목적을 이루기 위해, 먼저 OWL-DL 추론 규칙을 정의하고 이를 질의 그래프 패턴 재작성에 적용한다. 또한 추론 규칙들을 분류하고 이러한 규칙들이 질의 재작성에 미치는 영향에 대하여 기술한다. 제안 알고리즘의 장점을 보이기 위해, Jena 기반의 프로토타입 시스템을 구현한다. 비교 평가론 위해 테스트 질의를 이용하여 실험을 수행하고 제안 방법과 기존 접근 방법을 비교한다. 실험 결과에서, 제안 알고리즘이 완전성 및 정확성의 손실없이 메모리 공간 및 온톨로지 로딩 측면에서 향상된 성능을 보였다.

Seq2SPARQL: 신경망 기계 번역을 사용한 지식 베이스 질의 언어 자동 생성 (Seq2SPARQL: Automatic Generation of Knowledge base Query Language using Neural Machine Translation)

  • 홍동균;심홍매;김광민
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.898-900
    • /
    • 2019
  • SPARQL(SPARQL Protocol and RDF Query Language)은 지식 베이스를 위한 표준 시맨틱 질의 언어이다. 최근 인공지능 분야에서 지식 베이스는 질의 응답 시스템, 시맨틱 검색 등 그 활용성이 커지고 있다. 그러나 SPARQL 과 같은 질의 언어를 사용하기 위해서는 질의 언어의 문법을 이해하기 때문에, 일반 사용자의 경우에는 그 활용성이 제한될 수밖에 없다. 이에 본 논문은 신경망 기반 기계 번역 기술을 활용하여 자연어 질의로부터 SPARQL 을 생성하는 방법을 제안한다. 우리는 제안하는 방법을 대규모 공개 지식 베이스인 Wikidata 를 사용해 검증하였다. 우리는 실험에서 사용할 Wikidata 에 존재하는 영화 지식을 묻는 자연어 질의-SPARQL 질의 쌍 20,000 건을 생성하였고, 여러 sequence-to-sequence 모델을 비교한 실험에서 합성곱 신경망 기반의 모델이 BLEU 96.8%의 가장 좋은 결과를 얻음을 보였다.

RDF와 SPARQL을 이용한 PC내 영상 메타데이터 저장 및 검색 (Storage and search of image metadata inside personal computers using RDF and SPARQL technology)

  • 유영진;이병래
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (C)
    • /
    • pp.64-68
    • /
    • 2007
  • 본 논문은 영상의 메타데이터를 RDF를 이용하여 표현, 저장하고, SPARQL을 이용하여 검색하는 솔루션을 구현하여, RDF와 SPARQL을 통한 멀티미디어 파일의 메타데이터 관리 방안을 제시한다. 솔루션은 Jena2 프레임워크 기반으로 구현하였으며, Controller, EXIF Extractor, Metadata Schema, RDF Generator, Repository Manager, SPARQL Executor의 모듈로 구성된다.

  • PDF

분산 메모리 시스템에서의 SPARQL 질의 처리 (SPARQL Query Processing in Distributed In-Memory System)

  • 작바랄 바트셀렘;이완곤;김강필;박영택
    • 정보과학회 논문지
    • /
    • 제42권9호
    • /
    • pp.1109-1116
    • /
    • 2015
  • 본 논문에서는 functional 프로그래밍과 분산 메모리 환경인 Spark를 통해 SPARQL 질의문 처리의 오버헤드를 줄일 수 있는 방법을 제안한다. 최근 몇 년간 시멘팁웹의 RDF 온톨로지 데이터는 폭발적으로 증가하고 있기 때문에, 대용량 온톨로지 데이터에 대한 질의문을 효율적으로 처리할 수 있는 방법이 주요 쟁점으로 떠오르고 있다. SPARQL 질의문 처리에 대한 기존의 연구들은 하둡의 맵리듀스 프레임워크에 초점을 맞추고 있다. 그러나 하둡은 분산 파일 처리를 기반의 작업을 수행하므로 성능 저하가 발생할 수 있다. 따라서 질의문 처리 속도를 향상 시키기 위해 본 논문에서는 분산 메모리 시스템을 통해 질의문을 처리할 수 있는 방법을 제안한다. 또한 SPARQL 질의어 사이의 Binding 값을 Propagation하기 위해서 Spark의 Join방식, Functional 프로그램의 Map, Filter 방식, Spark의 캐시 기능을 활용 하는 방식을 제안하고 있다. 본 논문의 실험 결과는 다른 기법들과 비교하여 높은 성능을 얻었다. 특히 현재 가장 빠른 성능을 보이는 SPARQL 질의 엔진인 Sempala와 유사하다는 결과를 얻었다.

저장소에 독립적인 SPARQL-to-SQL 변환 시스템 모텔에 대한 비용 평가 (Cost Evaluation of the SPARQL-to-SQL Translation System Model Independent on Storages)

  • 손지성;정동원;백두권
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2008년도 제39차 동계학술발표논문집 16권2호
    • /
    • pp.401-406
    • /
    • 2009
  • 이 논문에서는 저장소에 독립적인 SPARQL-to-SQL변환 시스템 모델의 비용 평가를 수행한다. 시맨틱 웹이 발전하면서 이를 기술하기 위한 다양한 웹 온톨로지 언어들이 제안되었고 이를 저장 및 검색하기 위한 관계형 데이터베이스 기반의 저장소와 SPARQL과 같은 질의 언어가 개발되었다. SPARQL의 활용도가 높아짐에 따라 관계형 데이터베이스에 저장된 웹 온톨로지 데이터를 질의하기 위해서는 SPARQL을 SQL로 변환하기 위한 알고리즘이 필요하다. 그러나 기존에 제안된 변환 알고리즘들은 몇 가지 해결해야 할 문제점을 가지고 있는데 그 중 변환 알고리즘이 저장소에 종속적이라는 문제점 때문에 변환 알고리즘의 활용도가 떨어진다. 이를 해결하기 위하여 기존 논문에서는 저장소에 독립적으로 변환 알고리즘을 활용할 수 있는 시스템 모델을 제안하였으며 프로토타입을 구현하여 제안 모델을 통한 질의 결과의 정확성을 측정하였다. 또한, 저장소의 종속적인 모델과 독립적인 모델간의 정성적 평가를 통하여 저장소에 독립적인 모델이 여러 측면에서 활용도가 높다는 것을 평가하였다. 그러나 기존 논문에서는 제안한 시스템 모델에 대한 명확한 정량적 평가가 이루어지지 않았다. 따라서 이 논문에서는 비용 평가 모델을 정의하여 제안한 시스템 모델의 효율성을 정량적으로 평가한다.

  • PDF

클라우드에서 SPARQL 질의 처리를 위한 조인 성능 향상 (Improving Join Performance for SPARQL Query Processing in the Clouds)

  • 최규진;손윤희;이규철
    • 정보과학회 논문지
    • /
    • 제43권6호
    • /
    • pp.700-709
    • /
    • 2016
  • 최근 LOD 데이터의 급격한 증가로 인해 기존의 싱글 머신 시스템을 통한 대량의 LOD 처리는 성능의 한계를 가진다. 이러한 문제를 해결하기 위해 최근 연구들은 분산, 병렬 프레임워크인 맵리듀스를 활용한다. 하지만 맵리듀스를 통해 SPARQL 질의를 처리하기 위해서는 다수의 맵리듀스 잡이 필요하고, 이로 인해 추가적인 비용이 발생하게 된다. 또한, 조인을 위해 불필요한 데이터를 처리해야 하는 문제가 있다. 본 논문에서는 이를 해결하기 위해 SPARQL 질의 처리 시 발생하는 맵리듀스 잡의 개수를 줄이고 Bitmap을 기반으로 조인 인덱스를 작성 후 이용하여 불필요한 데이터 처리를 최소화 하는 방법을 제안한다.