• 제목/요약/키워드: 데이타 웨어하우스

검색결과 45건 처리시간 0.029초

클라이언트 기반 웹하우스 유지 전략 (A Strategy for a Maintaining Client-based Web House)

  • 이혁민;김경창
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.94-96
    • /
    • 2002
  • 본 논문에서는 기존치 서버 기반 데이터 웨어하우스 유지 전략에 대한 문제점들을 해결하기 위해 클라이언트 기반 웹 하우스 유지 전략을 제시한다. 소스 시스템에서 데이터 갱신이 발생했을 경우 브라우져 모니터를 통해 자동적으로 웹하우스에 실시간 반영하도록 하여 모든 사용자 요청을 서버에서 처리하는 부담을 줄이고 사용자가 많더라도 웹하우스 시스템의 처리부담을 최소화할 수 있도록 클라이언트에서는 결과 데이타 재사용/질의 재생성을 사용하여 서버의 자원 사용을 최소화 할 수 있도록 하였다. 모든 클라이언트 프로그램은 자동적으로 설치되고 관리되므로 프로그램이 변동되더라도 쉽게 유지될 수 있으며 소스 시스템에는 어떠한 처리 부담도, 어떠한 프로그램도 설치하지 않기 때문에 실제 비즈니스 현실에서 적용하기가 용이하다.

  • PDF

데이타 웨어하우스에서 데이타 큐브를 위한 효율적인 점진적 관리 기법 (An Efficient Incremental Maintenance Method for Data Cubes in Data Warehouses)

  • 이기용;박창섭;김명호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권2호
    • /
    • pp.175-187
    • /
    • 2006
  • 데이타 큐브는 차원 애트리뷰트의 모든 가능한 조합에 대해 데이타를 집단화하는 연산자이다. 차원 애트리뷰트의 수가 n일 때, 데이타 큐브는 $2^n$개의 group-by를 계산한다. 데이타 큐브에 포함된 각각의 group-by를 큐보이드(cuboid)라 부른다. 데이타 큐브는 흔히 미리 계산되어 형태 뷰(materialized view)의 형태로 데이타 웨어하우스에 저장된다. 이러한 데이타 큐브는 소스 릴레이션이 변경되면 이를 반영하기 위해 갱신되어야 한다. 데이타 큐브의 점진적 관리는 데이타 큐브의 변경될 내용만을 계산하여 이를 데이타 큐브에 반영하는 방법을 의미한다. $2^n$개의 큐보이드로 이루어진 큐브의 변경될 내용을 계산하기 위하여, 기존의 방법들은 데이타 큐브와 동일한 개수의 큐보이드를 가지는 변경 큐브를 계산한다. 따라서, 차원 애트리뷰트의 수가 증가할수록 변경 큐브를 계산하는 비용이 매우 커지게 된다. 변경 큐브에 포함된 각 큐보이드들을 변경 큐보이드(delta cuboid)라 부른다. 본 논문에서는 $2^n$개의 변경 큐보이드 대신 $_nC_{{\lceil}n/2{\rceil}}$개의 변경 큐보이드만을 사용하여 데이타 큐브를 갱신하는 방법을 제안한다. 이에 따라 제안하는 방법은 변경 큐브를 계산하는 비용을 크게 줄일 수 있다. 성능 평가 결과는 제안하는 방법이 기존의 방법에 비해 더 좋은 성능을 가지고 있음을 보여준다.

실체 뷰와 차원 계층을 이용한 OLAP 질의 재작성 방법 (A Method Rewriting OLAP Queries using Materialized Views and Dimension Hierarchies)

  • 박창섭;김명호;이윤준
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권2호
    • /
    • pp.168-180
    • /
    • 2001
  • 데이터 웨어하우스 시스템에 대한 OLAP 질의들은 대량의 데이터를 대상으로 복잡한 분석 및 집계 연산을 수행한다. 이러한 고비용의 OLAP 질의들을 효율적으로 실행하는 것은 시 스템의 성능 향상을 위해 매우 중요하다. 이를 위해 본 논문에서는 데이터 웨어하우스 시스 템에 존재하는 여러 종류의 실체 집계 뷰들을 이용하여 주어진 OLAP 질의를 재작성하는 방법을 제안한다. 본 논문에서는 차원 계층들로부터 유도되는 그룹 격자를 이용하여 OLAP 질의와 실체 뷰의 선택 단위, 선택 영역, 집계 단위등을 정의하고, 이들로부터 OLAP 질의 와 식체 뷰에 대한 정규을 정의한다. 그리고 정규형으로 표현된 질의와 실체 뷰 사이의 관 계를 이용하여 실체 뷰가 질의의 재작성에 이용 가능하기 위한 조건을 제시한다. 제안하는 질의 재작성 방법은 데이터 웨어하우스의 메타 정보들과 OLAP 질의 및 실체 뷰들의 특성 을 고려하여 다양한 실체 뷰들을 함께 이용할 수 있으므로, 시스템에 존재하는 실체 뷰들의 효용성을 높이고 주어진 질의를 효율적으로 처리할 수 있다.

  • PDF

DEhBT: hB-tree를 이용한 다차원 데이타 분할 기법 (DEhBT:A Multidimensional Data Partitioning Scheme using hB-tree)

  • 김동연;오영배;최동훈;한상영;이상구
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권1호
    • /
    • pp.16-24
    • /
    • 1999
  • 본 논문에서는 병렬 DBMS를 사용하는 데이터 웨어하우스의 성능을 개선하기 위한 새로운 다차원 데이터 분할 기법을 제안한다. 데이터 웨어하우스는 많은 양의 데이터를 저장하는 대용량 데이터베이스이며 분석적인 정보를 얻기 위한 다차원 범위 질의가 대부분을 차지한다. 단일 차원분할 기법으로는 다차원 질의를 효과적으로 처리하기 어렵고 기존의 다차원 분할 기법은 임의의 알 수 없는 분포를 가진 데이터에 대해 균등한 분할을 보장하기 어렵다. 본 논문에서는 hB-tree 구조를 이용하여 균등한 분할을 보장하는 다차원 분할 기법을 제안하고 그 성능을 측정하기 위한 시뮬레이터 결과를 보인다. 시뮬레이션에서 hB-tree 분할 기법은 균등 분포뿐만 아니라 비균등 분포 데이터 집합에 대해서도 균등한 분할을 보인다.

시공간 집계정보를 위한 Aggregation R-tree 기반의 하이브리드 인덱스 (A Hybrid Index based on Aggregation R-tree for Spatio-Temporal Aggregation)

  • 유병섭;배해영
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권5호
    • /
    • pp.463-475
    • /
    • 2006
  • 교통 관리 시스템과 같은 응용에서는 공간 데이타 웨어하우스의 공간 계층을 이용한 분석을 수행하는데, 이러한 분석에서는 주로 단순한 집계정보만을 요구한다. 공간 계층 기반의 집계정보 제공을 위하여 기존의 연구들은 공간 인덱스를 사용한 해결방법을 제시하였는데, 대부분의 연구들은 공간 인덱스 중 가장 널리 이용되는 R-tree를 확장한 방법을 이용하였다. 그러나 단순히 현재 집계 정보만을 제공하여 수년에 걸친 분석을 요구하는 교통 정책에 대하여 의사결정을 지원할 수 없었다. 본 논문에서는 과거의 집계정보까지 관리할 수 있는 aR-tree(Aggregation R-tree)기반의 하이브리드 인덱스를 제안한다. 제안 기법은 aR-tree를 이용하여 공간 계층과 현재시점의 집계정보를 제공하며, 시간 구조체를 이용한 정렬 해쉬 테이블로 시간 계층과 과거의 집계정보를 제공한다. 따라서 제안기법은 시공간 분석을 통한 효율적인 의사결정을 지원하며, 이는 현재의 교통 분석 및 과거를 통한 교통 정책 결정을 가능하게 한다.

계층 최대 R-트리를 이용한 범위 상위-k 질의의 효율적 수행 (Efficient Execution of Range Top-k Queries in a Hierarchical Max R-Tree)

  • 홍석진;이상준;이석호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.746-748
    • /
    • 2003
  • 범위 상위-k 질의는 질의 범위 내의 다차원 데이타 중 값 애트리뷰트를 기준으로 상위 k개의 레코드를 반환하는 질의로 공간 데이타베이스와 데이타 웨어하우스에서 분석을 위해 많이 사용되는 유용한 질의 형태이다. 이 논문에서는 계층 최대 R-트리의 선택적인 탐색을 통해 범위 상위-k 질의를 효과적으로 수행하는 기법을 제시한다. 질의 결과를 포함하지 않는 단말 노드를 접근하지 않고 질의를 수행할 수 있기 때문에 적은 노드 접근으로도 질의 수행이 가능하며, 질의 범위의 크기에 관계없이 거의 일정한 성능을 보인다. 두 개의 우선순위 큐를 사용하며 질의 수행 공간을 최소화 하며, In Sorted Node 기법을 통해 기존 R-트리와 같은 팬아웃을 보장할 수 있다.

  • PDF

데이터웨어하우스를 기반으로 한 마케팅시스템 활용사례

  • 황명수
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 2002년도 추계 컨퍼런스: 기업경쟁력 강화를 위한 디지털 컨텐츠 및 정보기술 컨퍼런스
    • /
    • pp.529-543
    • /
    • 2002
  • 미국 마케팅협회 (AMA)의 정의전문위원회가 1985년에 만든 마케팅의 정의를 보면, "마케팅이란 개인이나 조직의 목표를 만족시키는 교환을 창조하기 위한 아이디어ㆍ상품ㆍ서비스에 대해 개념 정립, 가격 설정, 프로모션, 유통을 계획하여 실행하는 프로세스이다" 라고 정의한다. 다시 말하면, 상품이나 서비스를 어떻게 만들어서 어떻게 판매 할 것인가에 대한 방법론이라고 할 수 있다. (중략)

  • PDF

초기 데이타 웨어하우스 모델링을 지원하기 위한 사례기반 추론의 응용 (A case-based reasoning application to support initial data warehouse modeling)

  • 이재식;전용준
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 1996년도 추계학술대회발표논문집; 고려대학교, 서울; 26 Oct. 1996
    • /
    • pp.271-274
    • /
    • 1996
  • Since the primary purpose of information Engineering focuses on transaction or operation processing, various information needs acquired in Information Strategy Planning phase are not properly utilized from the viewpoint of decision support systems development. In this research, we suggest a case-based reasoning application that supports initial Data Warehouse Modeling by expanding the activities in Information Strategy Planning.

  • PDF

계층 최대 R-트리를 이용한 범위 상위-$\kappa$ 질의의 효율적인 수행 (Efficient Execution of Range $Top-\kappa$ Queries using a Hierarchical Max R-Tree)

  • 홍석진;이상준;이석호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권2호
    • /
    • pp.132-139
    • /
    • 2004
  • 범위 상위-$\kappa$ 질의는 질의 범위 내의 다차원 데이타 중 값 애트리뷰트를 기준으로 상위 k개의 레코드를 반환하는 질의로 공간 데이타베이스와 데이타 웨어하우스에서 분석을 위해 많이 사용되는 유용한 질의 형태이다. 이 논문에서는 계층 최대 R-트리의 선택적인 탐색을 통해 범위 상위-k 질의를 효과적으로 수행하는 기법을 제시한다. 이 기법은 단말 노드의 일부만을 접근하여 질의를 수행할 수 있으며, 질의 범위의 크기에 관계없이 거의 일정한 성능을 보인다. 또한 이 기법은 우선순위 큐를 효율적으로 관리함으로써 큐의 유지비용을 최소화하며, 기존 R-트리와 같은 팬아웃을 보장할 수 있다.

데이타 큐브에서 세분화된 뷰 실체화 기법 (Fine Granule View Materialization in Data Cubes)

  • 김민정;정연동;박웅제;김명호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권4호
    • /
    • pp.587-595
    • /
    • 2001
  • 일반적으로 뷰라고 불리는 데이타 큐브의 일부를 실체화하여 저장하는 방법은 데이타 웨어하우스에서 많이 사용되는 기술이다. 유는 집계 함수로 정의되는 질의의 결과이다. 본 논문에서는 세분화된 뷰의 개념을 소개한다. 세분화된 뷰란 각 타원별로 정해진 구간에서의 집계 함수 결과이다. 이때 각 차원 별로 나누는 구간은 질의의 접근 형태를 기준으로 설정된다. 세분화된 뷰의 표현 및 선택을 위하여 AND-OR 큐브 그래프와 4ND-OR 최소 비용 그래프를 정의한다. 그리고, 이 구조체들을 이용하여 세분 화된 뷰 실체화 기법을 제안한다. 실험을 통해 제안하는 방법의 성능을 평가한다.

  • PDF