• 제목/요약/키워드: Data Provenance

검색결과 77건 처리시간 0.019초

A Semiotics Framework for Analyzing Data Provenance Research

  • Ram, Sudha;Liu, Jun
    • Journal of Computing Science and Engineering
    • /
    • 제2권3호
    • /
    • pp.221-248
    • /
    • 2008
  • Data provenance is the background knowledge that enables a piece of data to be interpreted and used correctly within context. The importance of tracking provenance is widely recognized, as witnessed by significant research in various areas including e-science, homeland security, and data warehousing and business intelligence. In order to further advance the research on data provenance, however, one must first understand the research that has been conducted to date and identify specific topics that merit further investigation. In this work, we develop a framework based on semiotics theory to assist in analyzing and comparing existing provenance research at the conceptual level. We provide a detailed review of data provenance research and compare and contrast the research based on d semiotics framework. We conclude with an identification of challenges that will drive future research in this field.

데이터형 전자기록을 위한 출처 개념 모델 개발 방향 (Toward Developing a Provenance Conceptual Model for Data-driven Electronic Records)

  • 현문수
    • 기록학연구
    • /
    • 제79호
    • /
    • pp.305-341
    • /
    • 2024
  • 이 연구는 디지털 환경에서 데이터가 중심이 되는 전자기록의 출처에 새롭게 접근하기 위해, 데이터 출처 개념과 출처 모델을 검토하고 수용하여, 어떻게 전자기록을 대상으로 새롭게 출처 개념을 적용할 수 있을지의 가능성을 살펴보았다. 이어서 데이터 중심의 전자기록을 대상으로 한 출처 표현 모델을 개발하기 위해 기초 연구를 진행하였다. 특히 소급형 출처와 전망형 출처 개념으로 전환할 것과, 기록관리 메타데이터와는 별개의 모델을 통해 출처를 표현하고 기록과 연결할 수 있는 모델을 개발할 것을 제안하였다. 기록과 동적 관계를 맺으면서도 독립적으로 출처를 표현할 수 있는 모델을 개발할 수 있다면, 오히려 기록의 유동성을 보장할 수 있으면서도, 기록의 속성과 이를 지원할 출처의 역할을 더 충실히 수행할 수 있을 것이다. 결국, 이 연구가 제안한 기본적인 모델 개발 방향을 수용하는 출처 모델은 기록의 고정성과 활동의 재현성, 재현의 신빙성을 뒷받침할 수 있을 것이며, 디지털환경에서 적합한 출처 모델로서 역할을 할 수 있을 것이다.

PROV의 확장에 기초한 데이터형 전자기록의 출처 모델 연구 (A Study on Developing a Provenance Conceptual Model for Data-driven Electronic Records Based on Extending W3C PROV)

  • 현문수
    • 기록학연구
    • /
    • 제80호
    • /
    • pp.5-41
    • /
    • 2024
  • 이 연구는 데이터형 전자기록을 대상으로 한 출처 표현 모델의 개발 방향에 맞추어 모델을 개발할 목적으로 진행되었다. 데이터형 전자기록의 생산·관리를 위해 출처와 맥락의 개념 구분을 지지하며, 이를 구분하여 표현할 수 있는 확장형 출처 모델을 제시할 것을 목표로 하였다. 이를 위해 W3C PROV를 기초 모델로 활용하며, P-Plan과 ProvONE도 일부 참고하였다. 이후, 기록관리 요건을 드러내고, 이를 바탕으로 기초 모델을 일부 확장하였다. 이 연구가 제안한 출처 모델은 데이터형 전자기록의 소급형 출처와 전망형 출처를 각각 표현하고 연결할 수 있도록 설계되었다. 향후 기록학 영역에서 출처 개념을 논의하고 모델을 확장해 나갈 수 있기를 기대한다.

A Fast and Exact Verification of Inter-Domain Data Transfer based on PKI

  • Jung, Im-Y.;Eom, Hyeon-Sang;Yeom, Heon-Y.
    • Journal of Information Technology Applications and Management
    • /
    • 제18권3호
    • /
    • pp.61-72
    • /
    • 2011
  • Trust for the data created, processed and transferred on e-Science environments can be estimated with provenance. The information to form provenance, which says how the data was created and reached its current state, increases as data evolves. It is a heavy burden to trace and verify the massive provenance in order to trust data. On the other hand, it is another issue how to trust the verification of data with provenance. This paper proposes a fast and exact verification of inter-domain data transfer and data origin for e-Science environment based on PKI. The verification, which is called two-way verification, cuts down the tracking overhead of the data along the causality presented on Open Provenance Model with the domain specialty of e-Science environment supported by Grid Security Infrastructure (GSI). The proposed scheme is easy-applicable without an extra infrastructure, scalable irrespective of the number of provenance records, transparent and secure with cryptography as well as low-overhead.

RDF 그래프 패턴을 고려한 프로버넌스 압축 기법 (Provenance Compression Scheme Considering RDF Graph Patterns)

  • 복경수;한지은;노연우;육미선;임종태;이석희;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제16권2호
    • /
    • pp.374-386
    • /
    • 2016
  • 프로버넌스 데이터는 데이터의 근원 정보나 변경 이력을 표현하는 메타데이터이다. 프로버넌스 정보는 변경 이력 정보가 쌓이면서 원본데이터와 비교하여 수십 배에 달하는 양을 차지한다. 따라서 대용량의 프로버넌스 데이터를 효율적으로 압축하기 위한 기법이 요구된다. 본 논문에서는 RDF 그래프 패턴을 고려한 프로버넌스 압축 기법을 제안한다. 제안하는 기법은 표준 PROV 모델을 기반으로 프로버넌스를 표현하고 텍스트 인코딩을 통해 프로버넌스 데이터를 숫자로 인코딩한다. 그래프 패턴을 이용하여 RDF 데이터와 프로버넌스 데이터를 압축한다. 제안하는 기법은 기존 프로버넌스 압축 기법과는 달리 시맨틱 웹상의 RDF 문서를 고려하여 프로버넌스 데이터를 압축한다. 압축률, 처리시간에 대한 성능 평가를 통해 제안하는 기법의 우수성을 증명한다.

Comparative Study of Evaluating the Trustworthiness of Data Based on Data Provenance

  • Gurjar, Kuldeep;Moon, Yang-Sae
    • Journal of Information Processing Systems
    • /
    • 제12권2호
    • /
    • pp.234-248
    • /
    • 2016
  • Due to the proliferation of data being exchanged and the increase of dependency on this data for critical decision-making, it has become imperative to ensure the trustworthiness of the data at the receiving end in order to obtain reliable results. Data provenance, the derivation history of data, is a useful tool for evaluating the trustworthiness of data. Various frameworks have been proposed to evaluate the trustworthiness of data based on data provenance. In this paper, we briefly review a history of these frameworks for evaluating the trustworthiness of data and present an overview of some prominent state-of-the-art evaluation frameworks. Moreover, we provide a comparative analysis of two key frameworks by evaluating various aspects in an executional environment. Our analysis points to various open research issues and provides an understanding of the functionalities of the frameworks that are used to evaluate the trustworthiness of data.

소셜 시맨틱 웹 환경에서 프로버넌스 기반의 웹 데이터 신뢰도 평가 기법 (Trust Evaluation Scheme of Web Data Based on Provenance in Social Semantic Web Environments)

  • 윤상원;최기태;박재열;임종태;복경수;유재수
    • 정보과학회 논문지
    • /
    • 제43권1호
    • /
    • pp.106-118
    • /
    • 2016
  • 최근 사용자들 사이의 웹 데이터의 생성 및 공유가 활발해 지면서 시맨틱 웹과 소셜 웹이 결합한 소셜 시맨틱 웹에 대한 중요성이 증가되고 있다. 본 논문은 소셜 시맨틱 웹 환경에서 PROV 모델을 확장하여 프로버넌스 기반의 웹 데이터 신뢰성 평가 기법을 제안한다. 제안하는 기법은 소셜 시맨틱 웹 환경에서 웹 데이터의 프로버넌스를 관리하고 신뢰성 평가를 위해 W3C의 PROV 모델에 필요한 요소를 추가하였다. 이와 같이 확장된 PROV 모델은 웹 데이터의 관리 및 프로버넌스 추적을 지원한다. 제안하는 신뢰성 평가 기법은 사용자의 신뢰도, 원본 데이터의 신뢰도 그리고 사람들의 평가 등과 같은 다양한 파라미터를 고려한다. 평가된 신뢰도는 프로버넌스 정보로 관리되고 사용자의 질의를 처리할 때 이 신뢰도를 고려하여 결과를 생성한다. 따라서 제안하는 기법은 소셜 시맨틱 웹 데이터의 프로버넌스를 관리할 수 있고 다양한 파라미터를 이용하여 웹 데이터 신뢰도를 정확하게 계산할 수 있다. 평가된 신뢰도는 사용자가 질의 결과의 신뢰 여부를 판단할 수 있는 기준이 된다. 제안하는 기법의 타당성을 보이기 위해 SPARQL 질의를 이용하여 신뢰성 평가의 성능을 검증한다.

시스템 기반 프로비넌스 그래프와 분석 기술 동향 (A Survey on system-based provenance graph and analysis trends)

  • 박찬일
    • 융합보안논문지
    • /
    • 제22권3호
    • /
    • pp.87-99
    • /
    • 2022
  • 사이버 공격이 정교해지고 고도화된 APT 공격이 증가함에 따라 공격을 탐지하고 추적하기가 더 어려워졌다. 시스템 프로비넌스 그래프는 분석가들에게 공격의 기원을 밝히기 위한 기법을 제공한다. 사이버 공격에 대한 침투 기원을 밝히기 위해서 다양한 시스템 프로비넌스 그래프 기법이 연구되었다. 본 연구에서는 다양한 시스템 프로비넌스 그래프 기법을 조사하고 데이터 수집과 분석 방법에 관련해서 기술하였다. 또한 조사 결과를 바탕으로 향후 연구 방향을 제시해 본다.

전북 순창 동촌유적 출토 청동기의 원료 산지연구 (Scientific Analysis and Provenance Study of Bronze Artifacts Excavated from Dongchon Site in Sunchang, Jeollabuk-do, Korea)

  • 배고운;정광용
    • 보존과학회지
    • /
    • 제32권2호
    • /
    • pp.101-108
    • /
    • 2016
  • 전북 순창 동촌유적 출토 청동기 4점에서 수습한 극미량의 시료를 대상으로 청동기 제작에 사용된 원료의 산지를 규명하고자 하였다. 납동위원소비 분석 결과를 동북아지역 방연석 광산 분포도 및 한반도 납동위원소 분포도와 비교한 결과 동부는 출토지와 인접한 옥천변성대 및 영남육괴지역, 나머지 3점은 중국 북부의 원료를 사용하였을 것으로 추정할 수 있다. 또한 익산 용제리유적 출토 세형동검 및 완주 덕동유적 출토 청동기 일부와 동촌유적 출토 동부의 경우 원료 산지 분석 결과가 일치하는 것으로 나타났다. 따라서 인근의 유사 지역에서 입수한 원료를 사용하였거나 동일한 공방에서 제작하여 여러 지역으로 전파되었을 것으로 추정된다. 향후 유사지역 출토 청동기의 원료 산지에 대한 추가 연구와 더불어 본 연구결과를 참고자료로 활용하여 초기철기시대 전북지역 청동기의 원료 산지 및 유통 과정에 대한 정보를 얻을 수 있을 것으로 기대된다.

클라우드 컴퓨팅 환경의 데이터 신뢰 확보 (Trust Assurance of Data in Cloud Computing Environment)

  • 정임영;조인순;유영진
    • 한국통신학회논문지
    • /
    • 제36권9B호
    • /
    • pp.1066-1072
    • /
    • 2011
  • 가상화를 통해 원하는 만큼의 컴퓨팅 파워와 데이터 저장 공간을 제공하면서도 관련된 IT자원의 유지보수 비용과 관리에서는 사용자를 해방시켜주는 많은 장점에도 불구하고, 클라우드 컴퓨팅이 가까운 미래에 실질적인 서비스로 자리잡고 활성화를 위해서는 먼저 넘어야 할 장벽들이 있다. 즉, 사용자의 제어 너머에 있는 클라우드 컴퓨팅 환경이 IT서비스와 인프라에 대해 사용자에게는 이용권만을 주기 때문에 비롯되는 여러 문제들이 생기게 된다. 가장 큰 이슈 중의 하나는 클라우드에 저장되는 정보의 보호 및 신뢰성 확보이다. 본 논문에서는 provenance 통한 클라우드 상의 데이터 신뢰확보에 대한 효과적이고 유용한 해법을 제안한다.