• 제목/요약/키워드: 데이타 웨어하우스

검색결과 45건 처리시간 0.025초

공간 데이타 큐브의 선택적 실체화에 관한 연구 (A Study on the Selective Materialization of Spatial Data Cube)

  • 이기영
    • 한국컴퓨터정보학회논문지
    • /
    • 제4권4호
    • /
    • pp.69-76
    • /
    • 1999
  • 최근에 공간 데이타 웨어하우스에서 자주 사용되어지고 질의 응답 시간이 많이 걸리는 복잡한 공간 집계 질의들은 미리 그 결과를 계산하여 실체화시키는 방법들이 연구되고 있다. 본 논문에서는 기존의 선택적 실체화 알고리즘에 대한 개선 방안으로 공간 뷰의 공간 측정에 대한 공간 연산의 계산 시간과 접근 빈도를 고려하여 선택적 실체화에 대한 방법을 제시하고 개선된 선택적 실체화 알고리즘을 제안한다.

  • PDF

웹 기반 데이타웨어하우스 질의 도구의 구현 (Web-based Query Reporting Tool for Data Warehouses)

  • 박유림
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.235-237
    • /
    • 2003
  • 데이터베이스에 저장된 수많은 자료들을 사용자의 질의에 맞추어 웹상에서 표현해주는 것이 바로 리포팅 툴의 역할이다. 그에 관한 연구들로 인해서 EASY BASE, ReportShop 과 같은 여러 리포팅 툴들이 상용화되고 있다. 하지만 사용자가 보다 쉽고 직관적으로 XML문서를 작성하고 관리할 수 있는 툴들은 미흡한게 사실이다. 이 논문에서는 리포팅 툴의 기본이 되는 쿼리 결과를 웹상에서 표현해주는 xml 을 설계하였다.

  • PDF

관계 DBMS의 실체뷰 기능을 이용한 XML 실체뷰 지원 (Supporting XML Materialized Views Using Materialized Views of RDBMS)

  • 김승훈;강현철
    • 한국전자거래학회지
    • /
    • 제11권4호
    • /
    • pp.33-48
    • /
    • 2006
  • XML이 웹상에서 데이타 교환의 표준으로 등장한 이래 웹 환경에서 e-Commerce와 같은 웹 기반 비즈니스 응용을 효율적으로 지원하기 위해 XML 웨어하우스 기술이 요구되고 있다. 관계 DMBS가 XML웨어하우스의 저장소로 사용될 경우, XML웨어하우스의 XML실체뷰는 관계 DBMS의 관계 실체뷰를 이용하여 제공할 수 있다. XML 문서가 관계 튜플로 저장되기 때문에 XML 실체뷰를 정의하는 XML 질의는 SQL로 변경된다. 만일 변경된 SQL문으로 관계 실체뷰를 정의하면, XML실체뷰는 해당 관계 실체뷰를 구성하는 튜플들에 대한 XML 태깅만으로 얻어질 수 있다. 이런 기법의 가장 큰 장점은, 소스 XML 문서가 변경될 때마다 XML 태깅을 제외한 XML 실체뷰의 일관성 유지를 관계 DBMS가 수행해준다는 것이다. 본 논문에서는 이러한 XML 실체뷰 기법을 제시하고 Windows 2000 Professional 환경에서 실체뷰 기능을 갖춘 상용 관계 DBMS를 사용하여 Java로 구현하였다. 성능 실험은 웹상의 e-Commerce 벤치마크인 TPC-W의 XML 문서를 대상으로 수행하였다. 실험 결과 본 논문이 제시한 XML 실체뷰 기법 이 매우 효율적 인 것으로 나타났다.

  • PDF

선택 프레디키트를 포함하는 시간 집계의 효율적 처리 (Efficient Processing of Temporal Aggregation including Selection Predicates)

  • 강성탁;정연돈;김명호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권3호
    • /
    • pp.218-230
    • /
    • 2008
  • 시간지원 데이타베이스 시스템에서의 시간 집계 연산은 일반적인 집계 연산의 확장으로써, 집계의 범위 조건에 '시간'을 포함한다. 시간 집계 연산은 이력 데이타 웨어하우스, 전화 기록 관리(CDR) 등에 유용하다. 본 논문에서는 질의 조건에 여러 개의 선택 프레디키트들을 포함하는 시간 집계 연산을 효율적으로 처리하기 위한 자료 구조인 ITA-tree를 제안하고, 이를 이용한 시간 집계 처리 기법을 제안한다. ITA-tree에서는 레코드의 시간 구간을 T-value라는 하나의 값으로 변환한 후, $B^+$-tree와 비슷하게 이 값을 이용하여 색인을 생성한다. 또한, 많은 레코드가 동일한 T-value 값을 가지게 되는 핫-스팟 문제를 위해 개선된 ITA-tree인 eITA-tree를 제안한다. 본 논문에서는 제안된 기법들의 성능을 분석과 실험을 통해 비교한다.

프로젝트 환경요인을 고려한 Data Warehouse 구축방법의 선택모형 (A Model to Decide the Approach to Build Data Warehouse considering Project′s Environmental Factors)

  • 노규성;윤재희
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1999년도 춘계공동학술대회: 지식경영과 지식공학
    • /
    • pp.403-413
    • /
    • 1999
  • Today's businesses are experiencing intensive global competition and the most accelerating pace of change ever. Competitors have sprung up that were not even on the business's radar. This environment impacts all decisions and strategies as business try to dominate their market or their industry merely to survive. So recently most of organizations are considering on building the data warehouse system to pursuit the business intelligence. We need the proper model to guide the approach to plan building data warehouse system when we want to plan it in considering the organizational status. Therefore we suggest a model to decide the approach to build data warehouse considering the project's environmental factors. First we review Ronald S. Swift(1998)'s five environmental factors that we have to consider when planing to build data warehouse. Then we propose a model to decide DW approach by the degree of those factors to be measured. DW approaches in this model are classified in conservative approach, technological approach, increasing approach. enterprise- wide approach, and ideal approach.

  • PDF

ER 도형의 연결 위상구조를 이용한 스타 스키마 추출 알고리즘 (A Star Schema Extraction Algorithm Using Connection Topologies of ER Diagrams)

  • 신성현;김진호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.136-138
    • /
    • 2002
  • 관계형 OLAP 시스템에서는 다차원 분석에 사용될 데이터를 하나의 사실과 여러 개의 차원 테이블로 구성된 스타 스키마로 표현한다. 사실 테이블은 측정치의 속성을 포함하며, 차원 테이블들은 이러한 사실 테이블에서 중심으로 뻗어져 나온 형태로써, 측정치에 대한 정보를 제공한다. 방대한 크기의 OLTP 소스 데이타베이스로부터 사실과 차원 테이블로 구성된 스타 스키마 설계하기 위해서는 풍부한 경험과 많은 시간을 필요로 한다. 따라서 스타 스키마를 효과적으로 설계하기 위한 체계적인 설계 방법이 필요하다. 본 논문에서는 소스 데이터베이스들에 대한 개념적 모델인 ER 도형을 이용하여 여러 개의 사실 엔터티를 추출하는 알고리즘과 이를 통해 자동적으로 스타 스키마를 설계하는 알고리즘을 제시하였다. 스타 스키마가 하나의 사실 테이블에 여러 개의 차원 테이블이 M:1의 관계로 연결되었다는 성질을 활용하여, 이 방법에서는 EH 도형이 연결된 위상 구조를 이용하여 각 엔터티에 연결된 M:1 관계의 개수에 근거하여 사실과 차원을 추출하는 방법을 제시하였다. 본 논문에는 이러한 방법을 통해 데이터 웨어하우스의 스타 스키마들 자동적으로 쉽게 설계하여 소요되는 시간과 노력을 줄일 수 있도록 하였다.

  • PDF

시공간 데이타웨어하우스를 위한 힐버트큐브 (Hilbert Cube for Spatio-Temporal Data Warehouses)

  • 최원익;이석호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권5호
    • /
    • pp.451-463
    • /
    • 2003
  • 최근 시공간 데이타에 대한 OLAP연산 효율을 증가시키기 위한 여러 가지 연구들이 행하여지고 있다. 이들 연구의 대부분은 다중트리구조에 기반하고 있다. 다중트리구조는 공간차원을 색인하기 위한 하나의 R-tree와 시간차원을 색인하기 위한 다수의 B-tree로 이루어져 있다. 하지만, 이러한 다중트리구조는 높은 유지비용과 불충분한 질의 처리 효율로 인해 현실적으로 시공간 OLAP연산에 적용하기에는 어려운 점이 있다. 본 논문에서는 이러한 문제를 근본적으로 개선하기 위한 접근 방법으로서 힐버트큐브(Hilbert Cube, H-Cube)를 제안하고 있다. H-Cube는 집계질의(aggregation query) 처리 효율을 높이기 위해 힐버트 곡선을 이용하여 셀들에게 완전순서(total-order)를 부여하고 있으며, 아울러 전통적인 누적합(prefix-sum) 기법을 함께 적용하고 있다. H-Cube는 대상공간을 일정한 크기의 셀로 나누고 그 셀들을 힐버트 값 순서로 저장한다. 이러한 셀들이 시간순서로 모여 규브형태를 이루게 된다. 또한 H-Cube는 시간의 흐름에 따라 변화되는 지역적인 데이타 편중에 대처하기 위해 적응적으로 셀을 정제한다. H-Cube는 정적인 공간 차원에서 움직이는 짐 객체에 초점을 두고 있는 적웅적이며, 완전순서화되어 있으며, 또한 누적합을 이용한 셀 기반의 색인구조이다. 본 논문에서는 H-Cube의 성능 평가를 위해서 다양한 실험을 하였으며, 그 결과로서 유지비용과 질의 처리 효율성면 모두에서 다중트리구조보다 높은 성능 향상이 있음을 보인다.

효율적인 ROLAP 큐브 생성 방법 (An Efficient ROLAP Cube Generation Scheme)

  • 김명;송지숙
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권2호
    • /
    • pp.99-109
    • /
    • 2002
  • ROLAP(Relational Online Analytical Processing)은 다차원적 데이타 분석을 위한 제반 기술로써, 전사적 데이타 웨어하우스로부터 고부가가치를 창출하는데 필수적인 기술이다. 질의처리 성능을 높이기 위해서 대부분의 ROLAP 시스템들은 집계 테이블들을 미리 계산해 둔다. 이를 큐브 생성이라고 하며, 이 과정에서 기존의 방법들은 데이타를 여러 차례 정렬해야 하고 이는 큐브 생성의 성능을 저하시키는 큰 요인이다. (1)은 MOLAP 큐브 생성 알고리즘을 통해 간접적으로 ROLAP 큐브를 생성하는 것이 훨씬 빠르다는 것을 보였다. 본 연구에서도 MOLAP 큐브 생성 알고리즘을 사용한 신속하고 확장적인 ROLAP 큐브 생성 알고리즘을 제시하였다. 분석할 입력 사실 테이블을 적절하게 조각내어 메모리 효율을 높였고, 집계 테이블들을 최소 부모 집계 테이블로부터 생성하도록 하여 큐브 생성 시간을 단축하였다. 제안한 방법의 효율성은 실험을 통해 검증하였다.

시간지원 데이타베이스에서 다차원 시간 집계 연산의 효율적인 처리 기법 (On Efficient Processing of Multidimensional Temporal Aggregates In Temporal Databases)

  • 강성탁;정연돈;김명호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권6호
    • /
    • pp.429-440
    • /
    • 2002
  • 시간지원 데이타베이스 시스템은 자료의 과거 및 현재, 그리고 미래의 상태까지 관리함으로써, 사용자에게 시간에 따라 변화하는 자료에 대한 저장 및 질의 수단을 제공한다. 시간지원 데이터베이스에서의 집계 연산은 집계 연산과 질의에 시간 애트리뷰트를 고려하므로 기존의 집계 연산과는 큰 차이가 있다. 본 논문에서는 다차원 시간 집계 연산에 초점을 둔다. 다차원 시간 집계 연산은 시간 애트리뷰트 뿐만 아니라 하나 이상의 일반 애트리뷰트까지 고려한 시간 집계 연산으로 이력 데이타 웨어 하우스, 전화 기록 관리(CBR) 등에 유용하다. 본 논문에서는 다차원 시간 집계 연산을 효율적으로 처리하기 위한 자료 구조인 PTA-tree를 제안하고, 이를 이용한 시간 집계 처리 기법을 제안한다. 또한 본 논문에서는 제안된 PTA-tree를 이용한 기법과 기존의 SB-tree를 확장한 기법의 성능을 최악 경우 분석과 실험을 통해 비교한다.

애경백화점 DB 마케팅시스템 구축사례 (ACOMS : Aekyung Customer Oriented Marketing System)

  • 조재희;박성진
    • 정보기술과데이타베이스저널
    • /
    • 제6권1호
    • /
    • pp.123-127
    • /
    • 1999
  • 애경백화점은 백화점 업계 최초로 데이터웨어하우스를 구축하여 이를 기반으로 ACOMS라는 고객 지향적인 마케팅 정보시스템을 도입하였다. 현재로서는 기존고객 유지 및 신규고객 유치를 위해 이용되고 있으나, 이 시스템을 이용한 DB마케팅 전략개발은 앞으로 무한한 가능성을 보이고 있다. ACOMS는 마케팅기획팀에 의해 주도적으로 사용되고 있는데, 이제까지 예측치 못했던 다각적인 판매정보를 입수할 수 있게 됨으로써 더욱 참신한 마케팅 아이디어를 도출해 낼 수 있게 되었다. 이제 이들이 제출하는 마케팅 기획안은 경영진에 의해 신중하게 받아 들여지고 있으며, 따라서 예산이 많이 드는 기획안일지라도 채택되는 빈도가 높아지고 있다. 경영진은 마케팅 기획팀이 제안하는 기획안들이 다각적인 데이터 분석에 의해 수립된 사실을 알기 때문에 그 어느 때보다도 자신감있게 의사결정을 내리고 있다

  • PDF