• Title/Summary/Keyword: 데이타 웨어하우스

Search Result 45, Processing Time 0.024 seconds

SPEC: Space Efficient Cubes for Data Warehouses (SPEC : 데이타 웨어하우스를 위한 저장 공간 효율적인 큐브)

  • Chun Seok-Ju;Lee Seok-Lyong;Kang Heum-Geun;Chung Chin-Wan
    • Journal of KIISE:Databases
    • /
    • v.32 no.1
    • /
    • pp.1-11
    • /
    • 2005
  • An aggregation query computes aggregate information over a data cube in the query range specified by a user Existing methods based on the prefix-sum approach use an additional cube called the prefix-sum cube(PC), to store the cumulative sums of data, causing a high space overhead. This space overhead not only leads to extra costs for storage devices, but also causes additional propagations of updates and longer access time on physical devices. In this paper, we propose a new prefix-sum cube called 'SPEC' which drastically reduces the space of the PC in a large data warehouse. The SPEC decreases the update propagation caused by the dependency between values in cells of the PC. We develop an effective algorithm which finds dense sub-cubes from a large data cube. We perform an extensive experiment with respect to various dimensions of the data cube and query sizes, and examine the effectiveness and performance ot our proposed method. Experimental results show that the SPEC significantly reduces the space of the PC while maintaining a reasonable query performance.

Enhanced Metadata Model for Growing Data (데이터 웨어하우스의 성장에 따른 문제 해결을 위한 개선된 메타데이타 모델)

  • 박석
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10b
    • /
    • pp.386-388
    • /
    • 1998
  • 본 논문에서는 필드의 추가, 삭제에 의해 데이터 큐브의 확장과 서로 다른 시간구간의 뷰가 존재함을 밝히고 이에 따른 두 가지 문제점을 제안한다. 첫째 새로 추가된 필드에 따라 이전 데이터를 변화할 것인가\ulcorner 둘째 필드의 추가로 불필요해진 실체화된 뷰를 계속 유지할 것인가\ulcorner 이를 해결하기 위해 메타데이타를 통하여 데이터 큐브의 재구성이나 불필요한 뷰의 실체와 없이 다른 시간구간의 실체화된 뷰를 효과적으로 사용하는 기법을 제안한다. 본 논문에서 제안한 기법은 시간 축을 고려함으로써 데이터 큐브의 격자구조를 따라 의존관계의 뷰들을 부분적으로 사용하고 결과를 결합하는 방식이다. 성능평가를 통하여 데이터 웨어하우스의 변화 시 기존의 기법보다 좋은 질의처리 성능을 가짐을 보인다. 보다 빠른 질의처리를 위하여 데이터 큐브를 사용하고, 큐브를 구성하는 뷰들을 실체화 한다. 하지만 새로운 필드의 추가나 삭제와 같은 데이터 웨어하우스의 변화, 성장에 의해 구조변화 등의 문제가 발생하고, 이에 대하여 적절해 대응할 필요가 있다.

An Algorithm for Selecting Materialized Views based on Join Cost in Data Warehouse Environments (데이터 웨어하우스 환경에서 조인 비용을 기반으로 한 실체 뷰 선택 알고리즘)

  • Yun, Won-Sik;Sin, Dong-Cheon
    • Journal of KIISE:Databases
    • /
    • v.28 no.1
    • /
    • pp.31-41
    • /
    • 2001
  • 데이터 웨어하우스 환경에서 데이터 분석을 위한 OLAP 질의에 대한 응답 시간을 줄이기 위해 실체 뷰 도입을 고려할 수 있다. 데이터 웨어하우스 환경에서 실체 뷰는 차원 테이블 과 사실 테이블의 조인으로 구성되어 있는 조인 뷰로 이루어지므로 지인 비용은 실체 뷰 선택에 영항을 미치는 가장 중요한 요소이다. 본 논문에서는 실체 뷰의 차원 속성 레벨을 이용하여 조인 테이블 추적하는 방법을 정형화하고 조인 비용을 기반으로 한 실체 뷰 선택 알고리즘을 제안한다.

  • PDF

Design and Implementation of Medical Data Warehouse Architecture (의료용 데이터 웨어하우스 아키텍쳐의 설계 및 구현)

  • 김종호;김태훈;민성우;이희석
    • Proceedings of the Korea Database Society Conference
    • /
    • 1999.06a
    • /
    • pp.393-402
    • /
    • 1999
  • 과거와 다르게 최근의 병원들은 정보화로 인해서 상당한 양의 의료 데이터가 저장되어 있어서 이의 효과적인 이용에 관심을 가지고 있다. 그러나 기존 통합병원정보시스템 (Integrated Hospital Information System)은 아직까지 일반관리와 원무관리 중심에서 벗어나지 못하고 있다. 품질 좋은 의료 서비스를 제공하기 위해서 환자 중심의 진료 및 진료지원, 임상연구 등을 종합적으로 지원하기 위한 데이터 웨어하우스 (Data Warehouse)의 필요성이 대두되기 시작했다. 이에 본 연구는 병원 전체 차원에서 데이터 웨어하우스의 아키텍쳐를 설계하고 개발하는 데 주안점을 두었다. 특히, 임상 데이터 웨어하우스 (Clinical Data Warehouse)에 초점을 두었으며 이에 대한 프로토타입은 J 병원에 적용되어서 개발되었다.

  • PDF

A Study on the Development of Framework for Enhancing Data Quality in Data Warehouse Environments (데이터 웨어하우스 환경에서 데이터 품질의 향상을 위한 개념적 프레임워크의 개발에 관한 연구)

  • 정경수;김병곤;장상도
    • Proceedings of the Korea Database Society Conference
    • /
    • 1999.10a
    • /
    • pp.191-201
    • /
    • 1999
  • 데이터 웨어하우스와 데이터 품질에 관한 문헌연구를 통하여 데이터 웨어하우스 환경에서 데이터 품질의 향상을 위한 개념적 프레임워크를 개발하고자 하는 것이 본 연구의 목적이다. 데이터 웨어하우스 데이터 품질향상 활동을 지원하는 프레임워크를 개발하는 목적은 (1) 다양한 요구를 가진 사용자들이 웨어하우스 데이터에 접근하기 때문에, 사용자의 요구를 만족시키며 기업의 목적에 적합한 품질향상 활동을 지원하기 위해서이며, 다양한 기업활동을 가장 잘 지원할 수 있는 데이터 품질향상 지침을 관리자에게 제공하기 위해서 이다. (2) 웨어하우스 관리자의 데이터 품질향상 활동을 지원하기 위해서는 품질차원이나 데이터세트 등과같은 품질향상에 필요한 다양한 이슈를 관리자가 인식할 수 있도록 하기 위해서이다. (3) 데이터 웨어하우스 환경에서 데이터 품질 향상에 필요한 체계적이고 포괄적인 안목을 제공하기 위해서이다. 본 연구는 다음과 같은 단계로 수행하게 된다. 첫째, 데이터 웨어하우스의 개념과 데이터 웨어하우스의 구축단계 및 데이터 웨어하우스를 구성하는 프레임워크를 검토한다. 둘째, 데이터 웨어하우스 환경에서의 데이터 품질의 기준과 데이터 품질의 측정 및 데이터 품질의 향상 방안 등을 고찰한다. 셋째, 데이터 웨어하우스 환경에서 데이터 품질의 향상을 위한 개념적 프레임워크를 개발하기 위하여 데이터 웨어하우스 데이터 풀질 향상과 관련된 기업활동, 데이터 세트, 품질의 속성 및 차원 등을 정의한다. 마지막으로 데이터 웨어하우스 환경하에서 데이터 품질을 향상할 수 있는 3차원 구조의 개념적 프레임워크를 제안하며, 나아가 제안한 모형에 대하여 데이터 품질 향상을 위한 프로젝트 활동의 사례를 통하여 모형의 타당성을 개념적으로 설명한다.통하여 각각의 제품을 비교하였으며, 둘째 소프트웨어 종류별 평가로 제품을 응용소프트웨어, 응용개발도구, 시스템 소프트웨어로 분류하여 평균값으로 비교하였다. 셋째, 국내외 제품별 평가분석으로 전체 제품을 국내제품과 국외제품으로 분류하여 비교하였으며, 마지막으로 총괄분석을 통해 가중치를 적용하여 전 제품의 점수를 비교하였다. 여기에서는 각 제품의 평균점수에 대한 차이를 95%의 유의수준으로 T-Test를 실시하였다.uted to the society, and what the socioeconomic impacts are resulted from the program. It would be useful for the means of (ⅰ) fulfillment of public accountability to legitimate the program and to reveal the expenditure of pubic fund, and (ⅱ) managemental and strategical learning to give information necessary to improve the making. program and policy decision making, The objectives of the study are to develop the methodology of modeling the socioeconomic evaluation, and build up the practical socioeconomic evaluation model of the HAN projects including scientific and technological effects. Since the HAN projects cons

  • PDF

On the Data Mining and Security (데이터 탐사와 보안성)

  • 심갑식
    • Review of KIISC
    • /
    • v.7 no.4
    • /
    • pp.73-79
    • /
    • 1997
  • 웨어하우스나 다른 데이타베이스에 있는 데이터를 어떤 유용한 정보로 변환하는 기술은 데이터 탐사이다. 즉, 데이터 탐사는 데이터베이스의 많은 데이터에서 이전에는 몰랐던 정보를 추출하기 위해 일련의 적당한 질의들을 취하는 과정이다. 데이타 탐사 기술은 통계, 기계 이해(machine learning), 데이타베이스 관리, 병렬처리 (preallel processing)등을 포함한 다양한 기술들의 혼합이다. 본 연구에서는 데이터 탐사에서 기인될 보안 위협, 이런 위협을 처리하기 위한 기법, 보안 문제점을 처리할 도구로서 데이터 탐사의 이용 등을 알아볼 것이다.

  • PDF

A Cache Manager for Enhancing the Performance of Query Evaluation in Data Warehousing Environment (데이타웨어하우스 환경에서의 질의 처리 성능 향상을 위한 캐시 관리자)

  • 심준호
    • Journal of KIISE:Databases
    • /
    • v.30 no.4
    • /
    • pp.408-419
    • /
    • 2003
  • Data warehouses are usually dedicated to the processing of quires issued by decision support system(DSS). The response time of DSS queries is typically several orders of magnitude higher than the one of OLTP queries. Since DSS queries are often submitted interactively, techniques for reducing their response time are important. The caching of query results is one such technique particularly well suited to the DSS environment. In this paper, we present a cache manager for such an environment. Specifically, we define a canonical form of query. The cache manager looks up a query based on the exact query match or using a suggested query split process if the query is found is non-canonical form or in canonical form, respectively. It dynamically maintains the cache content by employing a profit function which reflects in an integrated manner the query execution cost, the size of query result, the reference rate, the maintenance cost of each result due to updates of their base tables, and the frequency of such updates. We performed the experimental evaluation and it positively shows the performance benefit of our cache manager.

Manintaining Join Materialized View For Data Warehouses using Referential Integrity (참조무결성을 이용한 데이터웨어하우스의 조인 실체뷰 관리)

  • Lee, U-Gi
    • Journal of KIISE:Databases
    • /
    • v.28 no.1
    • /
    • pp.42-47
    • /
    • 2001
  • 실체뷰는 대량의 데이터웨어하우스에서 질의처리를 효과적으로 수행하기위한 대안으로서, 그 핵심은 각 데이터 원천에서의 데이터변화에 대응한 복합적인 뷰의 효과적인 관리 문제이다. 본 연구에서는 우선 실체뷰 관리에 관한 기존의 연구들을 일별함에 있어서 즉, 갱신의 주체문제, 갱신객체, 및 갱신시간 문제의 세가지 관점에서 본 연구의 위치를 결정한 다음, 대수적 접근법으로 복합뷰 갱신문제가 복잡해지는 원인을 규명하였다. 그 해법으로서 참조무결성을 활용한 복합 조인뷰의 갱신 알고리즘을 제안하면서, 여러 가지 참조무결성 제약조건과 트랜잭션과 관련된 자체갱신적 새로운 해법을 제시했다.

  • PDF

A Strategy for Maintaining Client-based Web House (클라이언트 기반 웹하우스 유지 전략)

  • Lee, Hyuk-Min;Kim, Kyung-Chang
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11c
    • /
    • pp.1721-1724
    • /
    • 2002
  • 본 논문에서는 기존의 서버 기반 데이터 웨어하우스 유지 전략에 대한 문제점들을 해결하기 위해 클라이언트 기반 웹 하우스 유지 전략을 제시한다. 소스 시스템에서 데이터 갱신이 발생했을 경우 브라우져 모니터를 통해 자동적으로 웹하우스에 실시간 반영하도록 하여 모든 사용자 요청을 서버에서 처리하는 부담을 줄이고 사용자가 많더라도 웹하우스 시스템의 처리부담을 최소화할 수 있도록 클라이언트에서는 결과 데이타 재사용/질의 재생성을 사용하여 서버의 자원 사용을 최소화할 수 있도록 하였다. 모든 클라이언트 프로그램은 자동적으로 설치되고 관리되므로 프로그램이 변동되더라고 쉽게 유지될 수 있으며 소스 시스템에는 어떠한 처리 부담도, 어떠한 프로그램도 설치하지 않기 때문에 실제 비즈니스 현실에서 적용하기가 용이하다.

  • PDF