• 제목/요약/키워드: data materialization

검색결과 37건 처리시간 0.025초

스타 스키마 조인 처리에 대한 세로-지향 데이터베이스 시스템과 가로-지향 데이터베이스 시스템의 성능 비교 (Performance Comparison of Column-Oriented and Row-Oriented Database Systems for Star Schema Join Processing)

  • 오병중;안수민;김경창
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권8호
    • /
    • pp.29-38
    • /
    • 2011
  • 세로-지향 데이터베이스 시스템은 기존의 가로-지향 데이터베이스 시스템과 달리 데이터를 가로(row) 위주가 아닌 세로(column) 위주로 저장한다. 최근에는 데이터 웨어하우스나 의사 결정 시스템 같은 대용량 데이터를 갖는 읽기 위주의 응용들에서 세로-지향데이터베이스의 우수성이 관찰되었다. 본 논문에서는 세로-지향데이터베이스에서의 조인 전략을 구체적으로 분석하고 데이터 웨어하우스 시스템에서 세로-지향 데이터베이스의 우수성을 검증하고자 한다. 두 시스템간의 객관적인 비교를 위해 데이터 웨어하우스 분석 모델인 스타 스키마 벤치마크를 통해 스타스키마조인 질의에 대한 성능분석을 실시하고자 한다. 또한 세로-지향 데이터베이스의 조인 전략으로 조기 실체화(early materialization)와 지연 실체화(late materialization)를 고려하였다. 성능 분석을 통해 스타 스키마 조인 질의처리에 있어 가로-지향 시스템보다는 세로-지향 시스템에서 디스크 I/O 비용이 더 효율적인 결과를 확인할 수 있었다. 세로-지향 데이터베이스 시스템 측면에서는 조기 실체화보다는 지연 실체화 조인전략이 훨씬 우수한 성능을 보였다.

공간 데이타 큐브의 선택적 실체화에 관한 연구 (A Study on the Selective Materialization of Spatial Data Cube)

  • 이기영
    • 한국컴퓨터정보학회논문지
    • /
    • 제4권4호
    • /
    • pp.69-76
    • /
    • 1999
  • 최근에 공간 데이타 웨어하우스에서 자주 사용되어지고 질의 응답 시간이 많이 걸리는 복잡한 공간 집계 질의들은 미리 그 결과를 계산하여 실체화시키는 방법들이 연구되고 있다. 본 논문에서는 기존의 선택적 실체화 알고리즘에 대한 개선 방안으로 공간 뷰의 공간 측정에 대한 공간 연산의 계산 시간과 접근 빈도를 고려하여 선택적 실체화에 대한 방법을 제시하고 개선된 선택적 실체화 알고리즘을 제안한다.

  • PDF

데이타 큐브에서 세분화된 뷰 실체화 기법 (Fine Granule View Materialization in Data Cubes)

  • 김민정;정연동;박웅제;김명호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권4호
    • /
    • pp.587-595
    • /
    • 2001
  • 일반적으로 뷰라고 불리는 데이타 큐브의 일부를 실체화하여 저장하는 방법은 데이타 웨어하우스에서 많이 사용되는 기술이다. 유는 집계 함수로 정의되는 질의의 결과이다. 본 논문에서는 세분화된 뷰의 개념을 소개한다. 세분화된 뷰란 각 타원별로 정해진 구간에서의 집계 함수 결과이다. 이때 각 차원 별로 나누는 구간은 질의의 접근 형태를 기준으로 설정된다. 세분화된 뷰의 표현 및 선택을 위하여 AND-OR 큐브 그래프와 4ND-OR 최소 비용 그래프를 정의한다. 그리고, 이 구조체들을 이용하여 세분 화된 뷰 실체화 기법을 제안한다. 실험을 통해 제안하는 방법의 성능을 평가한다.

  • PDF

시공간 데이타베이스에서 영역 합 질의를 위한 색인 기법 (An Indexing Technique for Range Sum Queries in Spatio - Temporal Databases)

  • 조형주;최용진;민준기;정진완
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권2호
    • /
    • pp.129-141
    • /
    • 2005
  • 시공간 데이타베이스는 최근에 많은 주목을 받았지만, 영역 합 질의에 대한 연구는 그 중요성에 비하여 많이 부족하다. 영역 합 질의를 처리하기 위하여, 많은 양의 데이타에 대한 직접적인 접근은 엄청난 계산 비용을 야기하기 때문에, 최근에 기존 색인 기법을 활용한 materialization 방법이 제안되었다. 간단하면서 효과적인 방법은 시공간 조건을 가지는 윈도우 질의를 효율적인 처리하는 MVR-tree에 materialization 방법을 적용하는 것이다. 그러나, MVR-tree는 노드들 사이의 존재하는 원형 경로 때문에, 중간 노드에 미리 계산된 합을 유지하는 것이 불가능하다. 다른 색인 구조들에 기초한 집합적 구조(aggregate structures)는 만족스러운 질의 성능을 제공하지 못 한다. 본 논문에서는 적응적 분할 기법을 사용하는 새로운 색인 기법(Adaptive Partitioned Aggregate R-Tree, APART)과 다양한 환경에서 영역합 질의를 효율적으로 처리하는 질의 처리 알고리즘을 제안한다. 실험 결과는 APART의 성능이 다양한 상황에서 기존의 집합적 색인 기법들보다 2배 이상 우월하다는 것을 보여준다.

XML 뷰 인덱싱 (XML Vicw Indexing)

  • 김영성;강현철
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권3호
    • /
    • pp.252-272
    • /
    • 2003
  • 뷰는 이질적인 데이타의 통합 및 여과(filtering) 기능을 통해서 데이타베이스의 필요한 부분을 제공한다. 많은 정보가 쏟아지고 있는 웹 환경의 데이타 교환 표준인 XML에 대해서도 뷰의 개념은 유용하다. 본 논문은 XML 뷰 인덱싱이라고 명명한 XML 뷰를 구현하는 기법을 제안한다. XML 뷰는 XML 뷰에 대한 정보와 더불어 뷰를 구성하는 하부 XML 엘리먼트에 대한 식별자를 저장하는 구조인 XML 뷰 인덱스로 표현된다. XML 뷰 인덱스가 XML 엘리먼트 자체가 아닌 식별자만을 저장하므로, 사용자가 XML 뷰를 요청하면 하부 XML 문서를 기반으로 XML 뷰를 실체화해야 한다. 또한, 하부 XML 문서에 대한 변경에 대하여 XML 뷰 인덱스의 일관성을 유지하기 위한 효율적인 점진적 갱신 기법이 필요하다. 본 논문에서는 XML 뷰 인덱싱을 위한 자료구조와 알고리즘을 제안하고 구현하였다. 성능 평가 결과 XML 뷰 인덱싱을 사용하는 것이 매번 뷰를 재생성하는 경우보다 질의 재수행 시간이 적게 걸렸다. XML 뷰 인덱싱 기법이 실체화 시간으로 인해 XML 실체뷰 기법보다 질의 재수행 시간은 많이 걸리지만, 저장 공간 면에서는 약 30배 정도 효율적인 것으로 나타났다.

A Model-Based Method for Information Alignment: A Case Study on Educational Standards

  • Choi, Namyoun;Song, Il-Yeol;Zhu, Yongjun
    • Journal of Computing Science and Engineering
    • /
    • 제10권3호
    • /
    • pp.85-94
    • /
    • 2016
  • We propose a model-based method for information alignment using educational standards as a case study. Discrepancies and inconsistencies in educational standards across different states/cities hinder the retrieval and sharing of educational resources. Unlike existing educational standards alignment systems that only give binary judgments (either "aligned" or "not-aligned"), our proposed system classifies each pair of educational standard statements in one of seven levels of alignments: Strongly Fully-aligned, Weakly Fully-aligned, Partially-$aligned^{***}$, Partially-$aligned^{**}$, Partially-$aligned^*$, Poorly-aligned, and Not-aligned. Such a 7-level categorization extends the notion of binary alignment and provides a finer-grained system for comparing educational standards that can broaden categories of resource discovery and retrieval. This study continues our previous use of mathematics education as a domain, because of its generally unambiguous concepts. We adopt a materialization pattern (MP) model developed in our earlier work to represent each standard statement as a verb-phrase graph and a noun-phrase graph; we align a pair of statements using graph matching based on Bloom's Taxonomy, WordNet, and taxonomy of mathematics concepts. Our experiments on data sets of mathematics educational standards show that our proposed system can provide alignment results with a high degree of agreement with domain expert's judgments.

대용량 데이터 처리기술을 배전자동화 시스템에 적용 (Application of Data Processing Technology on Large Clusters to Distribution Automation System)

  • 이성우;하복남;서인용;장문종
    • 전기학회논문지
    • /
    • 제60권2호
    • /
    • pp.245-251
    • /
    • 2011
  • Quantities of data in the DMS (Distribution management system) or SCADA (Supervisory control and data acquisition) system is enormously large as illustrated by the usage of term flooding of data. This enormous quantity of data is transmitted to the status data or event data of the on-site apparatus in real-time. In addition, if GIS (Geographic information system) and AMR (Automatic meter reading), etc are integrated, the quantity of data to be processed in real-time increases unimaginably. Increase in the quantity of data due to addition of system or increase in the on-site facilities cannot be handled through the currently used Single Thread format of data processing technology. However, if Multi Thread technology that utilizes LF-POOL (Leader Follower -POOL) is applied in processing large quantity of data, large quantity of data can be processed in short period of time and the load on the server can be minimized. In this Study, the actual materialization and functions of LF POOL technology are examined.

요금수납시스템의 효율적인 유지관리를 위한 원격모니터링 통합모델 설계 및 구현 (Design and materialization of remote monitoring integrate mod for efficient TCS(Toll Collection System) maintenance)

  • 박동연
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.531-534
    • /
    • 2007
  • 원격모니터링 통합모델은 고속도로나 유료도로의 영업소 요금수납 체계의 하부시스템 (요금수납시스템, ETCS시스템, 위반차량촬영시스템, 축중시스템)의 구성 및 장애 현황을 감시하고, 장애 발생에 대한 장애처리 체계를 수행하는 모델이다. 본 논문에서는 실시간 장애감시, 효율적 WorkFlow 구성 및 차별화된 정보를 제공하기 위해서 감시 S/W 엔진과 DBMS(Database Managemnet System) 기반의 C/S (Client /Server)시스템을 구성하고 WEB기반의 환경을 설계한다. 본 통합모델을 구현함으로써 체계적인 구성관리/장애관리를 통한 효율적인 유지관리 업무가 가능하며, 현장 장비의 상태 파악이 조기에 용이하여 장애 시간을 최소화 할 수 있다. 또한 Data의 지식 DB화를 통하여 유사 장애에 대한 조치가 용이하다.

  • PDF

멀티서버 환경에서의 공간 뷰 생성 및 실체화 기법 (The Spatial View Creation and Materialization Technique in Multi-Server Environments)

  • 김태연;정보홍;조숙경;배해영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.112-114
    • /
    • 2001
  • 지금까지 구축 된 공간 데이터들을 각 서버끼리 공유하여 유사한 내용의 공간정보구축을 위만 중복투자를 막고 공간데이터의 활용도를 높이는 방안이 시급하다. 멀티서버 환경에서의 공간데이터의 공유는 데이터의 보안과 사용자 편의성을 고려하여 뷰로 제공되고 관리되어질 수 있다. 분산 된 대용량의 공간데이터에 대해 복잡한 공간연산 처리를 감안한다면 멀티서버 환경에서는 공간 뷰의 실체화가 필수적이다. 본 논문에서는 멀티서버 환경에서의 공간데이터의 유통을 지원하고 공유 된 공간데이터에 대한 사용자 편의성과 네트웍 부하를 고려한 공간 뷰 실체화 기법을 제안한다. 확장 된 공간데이터 디렉토리 서비스(Extended Spatial Data Diretory Service)를 이용하여 각 서버가 공유하는 공간테이블에 대란 정보를 검색하고, 검색 된 징보를 바탕으로 로컬서버는 각 서버에에 직접 접속하여 필요한 영역의 데이터를 얻어 뷰를 생성한다. 이때 공유 공간데이터가 대용량 데이터임을 고려하여 로컬서버는 공간 뷰 성의에 대한 술어를 분리하여 뷰 질의 처리를 각각의 원격서버로 분산시켜 네트웍 부하와 서버의 질의처리 비용을 줄이고 공간 뷰 서버에 실제화 시킴으로써 뷰에 대한 질의처리시 각 서버로의 접근을 데비터의 접근을 줄여 사용자 응-답시간을 최소화한다.

  • PDF