• Title/Summary/Keyword: 데이타 웨어하우스

Search Result 45, Processing Time 0.023 seconds

Explanation-based Data Mining in Data Warehouse (데이타 웨어하우스 환경에서의 설명기반 데이타 마이닝)

  • 김현수;이창호
    • Proceedings of the Korea Database Society Conference
    • /
    • 1999.06a
    • /
    • pp.115-123
    • /
    • 1999
  • 산업계 전반에 걸친 오랜 정보시스템 운용의 결과로 대용량의 데이타들이 축적되고 있다. 이러한 데이타로부터 유용한 지식을 추출하기 위해 여러 가지 데이타 마이닝 기법들이 연구되어왔다. 특히 데이타 웨어하우스의 등장은 이러한 데이타 마이닝에 있어 필요한 데이타 제공 환경을 제공해 주고 있다. 그러나 전문가의 적절한 판단과 해석을 거치지 않은 데이타 마이닝의 결과는 당연한 사실이거나, 사실과 다른 가짜이거나 또는 관련성이 없는(trivial, spurious and irrelevant) 내용만 무수히 쏟아낼 수 있다. 그러므로 데이타 마이닝의 결과가 비록 통계적 유의성을 가진다 하더라고 그 정당성과 유용성에 대한 검증과정과 방법론의 정립이 필요하다. 데이타 마이닝의 가장 어려운 점은 귀납적 오류를 없애기 위해 사람이 직접 그 결과를 해석하고 판단하며 아울러 새로운 탐색 방향을 제시해야 한다는 것이다. 본 논문의 목적은 이러한 데이타 마이닝에서 추출된 결과를 검증하고 아울러 새로운 지식 탐색 방향을 제시하는 방법론을 정립하는데 있다. 본 논문에서는 데이타 마이닝 기법 중 연관규칙탐사로 얻어진 결과를 설명가능성 여부의 판단을 통해 검증하는 기법을 제안하며, 이를 통해 얻어진 검증된 지식을 토대로 일반화를 통한 새로운 가설을 생성하여 데이타 웨어하우스로부터 연관규칙을 검증하는 일련의 아키텍쳐(architecture)를 제시하고자 한다. 먼저 데이타 마이닝 결과에 대한 설명의 필요성을 제시하고, 데이타 웨어하우스와 데이타 마이닝 기법들에 대한 간략한 설명과 연관규칙탐사에 대한 정의 및 방법을 보이고, 대상 영역에 대한 데이타 웨어하우스의 스키마를 보였다. 다음으로 도메인 지식(domain knowledge)과 연관규칙탐사를 통해 얻어진 결과를 표현하기 위한 지식표현 방법으로 Relational predicate Logic을 제안하였다. 연관규칙탐사로 얻어진 결과를 설명하기 위한 방법으로는 연관규칙탐사로 얻어진 연관규칙에 대해 Relational Predicate Logic으로 표현된 도메인 지식으로서 설명됨을 보이게 한다. 또한 이러한 설명(explanation)을 토대로 검증된 지식을 일반화하여 새로운 가설을 연역적으로 생성하고 이를 연관규칙탐사론 통해 검증한 후 새로운 지식을 얻는 반복적인 Explanation-based Data Mining Architecture를 제시하였다. 본 연구의 의의로는 데이타 마이닝을 통한 귀납적 지식생성에 있어 귀납적 오류의 발생을 고메인 지식을 통해 설명가능 함을 보임으로 검증하고 아울러 이러한 설명을 통해 연역적으로 새로운 가설지식을 생성시켜 이를 가설검증방식으로 검증함으로써 귀납적 접근과 연역적 접근의 통합 데이타 마이닝 접근을 제시하였다는데 있다.

  • PDF

Dense Sub-Cube Extraction Algorithm for a Multidimensional Large Sparse Data Cube (다차원 대용량 저밀도 데이타 큐브에 대한 고밀도 서브 큐브 추출 알고리즘)

  • Lee Seok-Lyong;Chun Seok-Ju;Chung Chin-Wan
    • Journal of KIISE:Databases
    • /
    • v.33 no.4
    • /
    • pp.353-362
    • /
    • 2006
  • A data warehouse is a data repository that enables users to store large volume of data and to analyze it effectively. In this research, we investigate an algorithm to establish a multidimensional data cube which is a powerful analysis tool for the contents of data warehouses and databases. There exists an inevitable retrieval overhead in a multidimensional data cube due to the sparsity of the cube. In this paper, we propose a dense sub-cube extraction algorithm that identifies dense regions from a large sparse data cube and constructs the sub-cubes based on the dense regions found. It reduces the retrieval overhead remarkably by retrieving those small dense sub-cubes instead of scanning a large sparse cube. The algorithm utilizes the bitmap and histogram based techniques to extract dense sub-cubes from the data cube, and its effectiveness is demonstrated via an experiment.

인터넷, 인트라넷과 연계되는 데이타웨어하우스 시스템의 구축방안

  • 박주석;김찬수
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 1996.10a
    • /
    • pp.73-77
    • /
    • 1996
  • 정보는 의사결정자들의 수주에 있을 때 기업에 있어 강력한 경쟁무기가 된다. 의사결정자들의 정보에 대한 이러한 필요성을 충족시키기 위해서 데이타는 운영시스템(Operational System)에서 추출되어 데이타웨어하우스에 저장된다. 데이타웨어하우스는 핵심 비지니스영역(key business dimension)에 의해 정리된 historical data를 저장한다. 이러한 의사결정자들을 위한 데이타웨어하우스 정보의 전달은 기존의 클라이언트/서버 시스템 하에서는 많은 지원을 요구한다. 즉 기존 클라이언트/서버 시스템 하에서는 사용자들의 접근을 위해 데이타가 추출되고 조직화되어지고 나면, 반드시 분석 소프트웨어가 각 사용자의 컴퓨터에 설치되어야 하고 외부의 사용자를 위한 새로운 운영자가 고용되어야 한다. 사용자의 다양한 요구 그리고 계속적 사용자의 교체는 사용자 지원에 있어 심각한 기업부담으로 작용한다. 또한 클라이언트/서버 시스템에서는 기업외부의 정보 이용자들에게 정보를 제공하는데 있어 장소적 한계점을 가지고 잇다. 인트라넷과 인터넷은 이러한 클라이언트/서버 시스템 환경의 문제에 대해 해답을 제시한다. 인트라넷은 데이타웨어하우스로의 접근을 간단히 할뿐만 아니라 의사결정자들의 정보의 공유와 상호분석의 새로운 단계를 제공한다. 그리고 인터넷은 기업 외부 어디에서나 기업이 제공하는 정보를 이용하고자 하는 사람들에게 접근의 편의성을 제공한다. 즉 데이타웨어하우스의 목표와 인트라넷, 인터넷의 목표는 데이타로의 손쉬운 접근이라는 점에서 동일하다. 이러한 점에 착안하여 인트라넷과 인터넷하에서 운용되는 데이타웨어하우스 시스템 구축을 위한 방안을 제시하고자 한다.다(학생군:8.16kg 작업자군:12.9kg). 심박수를 이용한 생리학적 연구에서는 평균 심박수가 거의 100 이하를 유지하므로써 피실험자들이 8시간 작업기준으로 보아 무리가 없는 최대허용 하중을 결정하였음을 보였다. 또한 각 운반작업에 대한 최대허용 하중을 예측하는 회귀모형을 제시하였다.아직 정립되어 있지 않은 분산 환경하에서의 관계형 데이타베이스의 데이타관리의 분류체계를 나름대로 정립하였다는데 그 의의가 있다. 또한 이것의 응용은 현재 분산데이타베이스 구축에 있어 나타나는 기술적인 문제점들을 어느정도 보완할 수 있다는 점에서 그 중요성이 있다.ence of a small(IxEpc),hot(Tex> SOK) core which contains two tempegatlue peaks at -15" east and north of MDS. The column density of HCaN is (1-3):n1014cm-2. Column density at distant position from MD5 is larger than that in the (:entral region. We have deduced that this hot-core has a mass of 10sR1 which i:s about an order of magnitude larger those obtained by previous studies.previous studies.업순서들의 상관관계를 고려하여 보다 개선된 해를 구하기 위한 연구가 요구된다. 또한, 준비작업비용을 발생시키는 작업장의 작업순서결정에 대해서도 연구를 행하여, 보완작업비용과 준비비용을 고려한 GMMAL 작업순서문제를 해

  • PDF

An Efficient Search Space Generation Technique for Optimal Materialized Views Selection in Data Warehouse Environment (데이타 웨어하우스 환경에서 최적 실체뷰 구성을 위한 효율적인 탐색공간 생성 기법)

  • Lee Tae-Hee;Chang Jae-young;Lee Sang-goo
    • Journal of KIISE:Databases
    • /
    • v.31 no.6
    • /
    • pp.585-595
    • /
    • 2004
  • A query processing is a critical issue in data warehouse environment since queries on data warehouses often involve hundreds of complex operations over large volumes of data. Data warehouses therefore build a large number of materialized views to increase the system performance. Which views to materialized is an important factor on the view maintenance cost as well as the query performance. The goal of materialized view selection problem is to select an optimal set of views that minimizes total query response time in addition to the view maintenance cost. In this paper, we present an efficient solution for the materialized view selection problem. Although the optimal selection of materialized views is NP-hard problem, we developed a feasible solution by utilizing the characteristics of relational operators such as join, selection, and grouping.

A Study on the Effective Spatial Data Warehouse (효율적인 공간 데이타 웨어하우스에 관한 연구)

  • 이기영
    • Journal of the Korea Society of Computer and Information
    • /
    • v.3 no.4
    • /
    • pp.126-131
    • /
    • 1998
  • Spatial data warehouse, whose importance is being increased, is composed of huge amounts of historical spatial data for organizational decision making and it also allows users to obtain useful geospatial information through analyzing and summmarizing spatial data. In this paper, we survey effective spatial multidimensional model which is based on virtual scenario for spatial data warehouse modelling. Therefore, we describe spatial multidimensional analytical query which provide multiple analytical functions according tom user's requests.

  • PDF

A New Data Warehousing System Architecture Supporting High Performance View Maintenance (고성능 뷰 관리르 지원하는 새로운 데이터 웨어하우징 시스템 구조)

  • Kim, Jeom-Su;Lee, Do-Heon;Lee, Dong-Ik
    • Journal of KIISE:Software and Applications
    • /
    • v.26 no.10
    • /
    • pp.1156-1166
    • /
    • 1999
  • 의사결정 시스템은 전사적인 의사결정과 전략적 정보수집을 위해 거대한 량의 정보를 빠른 시간내에 제공할 것을 요구한다. 데이타 웨어하우스는 이러한 정보를 신속히 제공하기 위해 여러 지역 데이타베이스로부터 필요한 정보를 사전에 추출하고 가공 및 통합하여 별도의 저장공간에 저장한다. 일반적으로, 웨어하우스 내의 정보는 지역 데이타베이스에 저장된 정보에 대한 실체화된 뷰로서 간주하며 지역 데이타의 변경에 따라 일관성을 유지하도록 반영해야 한다. 본 논문에서는 일관성을 유지하기 위해 정보 공유가 가능한 데이타 웨어하우스 시스템의 구조와 비-보상 실체 뷰 관리 기법을 제안한다. 본 논문에서 제안한 데이타 웨어하우스 시스템의 구조는 지역 데이타베이스에서 추출된 정보를 관리하는 별도의 지역 정보 관리자를 두어 뷰 관리자들 간의 정보 공유가 가능하게 한다. 비-보상 실체 뷰 관리 기법은 지역 데이타 변경 사건에 따른 뷰 관리 시 다른 사건에 의해 영향을 받지 않도록 하기 때문에 기본의 사전 보상이나 나중 보상 기법과는 달리 추가적인 질의 처리를 요구하지 않는 기법이다.Abstract A decision support system(DSS) commonly requires fast access to tremendous volume of information. A data warehouse is a database storing the information that is extracted, filtered and integrated from several relevant local databases to reply upon aggregated queries. The information stored in the data warehouse can be regarded as materialized views. The materialized view has to be modified according to the change of the corresponding local databases to preserve the data consistency. In this paper, we propose a data warehousing system architecture allowing information sharing (DAWINS), and a non-compensating materialized view maintenance algorithm(NCA). DAWINS architecture allows relevant information to be shared by individual view managers with local data manager for each local database. Unlikely to the pre- or post-compensating algorithms, which are required to remove the effects of some events to other view in the process of view maintenance, NCA does not require any additional query processing, since a local data manager in DAWINS already maintains the effects of update events occurring in local systems.

중대형 컴퓨터를 위한 데이터 웨어하우스 구축도구 개발

  • 이국철;이춘열;안연식;안효성;공세호;김용희
    • Proceedings of the Korea Database Society Conference
    • /
    • 1998.09a
    • /
    • pp.433-447
    • /
    • 1998
  • 데이터 웨어하우스는 일상업무 처리를 위한 운영 데이터(Operational Data)의 관리를 목적으로 구현되는 전통적인 데이터베이스 시스템에 대응하는 새로운 개념으로서, 업무분석 및 의사결정을 위한 '정보 데이터(Informational Data)'를 효과적으로 제공하는 것을 목적으로 하고 있다. 최근 가트너그룹의 조사에 의하면, 데이터베이스 보유기업중 대부분이 향후 5년 이내에 데이터 웨어하우스를 구축할 것으로 전망하고 있어 국내외적으로 급격한 수요증가가 예상되고 있다. 데이터 웨어하우스에 대한 수요 증대와 더불어, 국내 연구 기관에서도 독자적인 데이터 웨어하우스 관리 시스템 또는 구현 도구들을 개발하기 시작하고 있으나, 주로 UNIX 시스템을 대상으로 하고 있다.(중략)

  • PDF

An Efficient Incremental View Maintenance in Data Warehouses (데이타 웨어하우스에서 효과적인 점진적 뷰 관리)

  • Lee, Ki-Yong;Kim, Myoung-Ho
    • Journal of KIISE:Databases
    • /
    • v.27 no.2
    • /
    • pp.175-184
    • /
    • 2000
  • A data warehouse is an integrated and summarized collection of data that can efficiently support decision making process. The summarized data at the data warehouse is often stored in materialized views. These materialized views need to be updated when source data change. Since the propagation of updates to the views may impose a significant overhead, it is very important to update the warehouse views efficiently. Though various strategies have been proposed to maintain views in the past, they typically require too much accesses to the data sources when the changes of multiple data sources have to be reflected in the view. In this paper we propose an efficient view update strategy that uses relatively small number of accesses to the data sources. We also show the performance advantage of our method over other existing methods through experiments using TPC-D data and queries.

  • PDF

Implementing Metadata-based Security Prototype System for Medical Data Warehouse (의료용 데이터 웨어하우스를 위한 메타데이터 기반의 보안 프로토타입 시스템 구현)

  • 김종호;김태훈;송해용;홍수희;박진두;민성우;이희석
    • Proceedings of the Korea Database Society Conference
    • /
    • 1999.10a
    • /
    • pp.113-118
    • /
    • 1999
  • 본 연구는 통합병원정보시스템 (Integrated Hospital Information System) 에서 의료용 데이터 웨어하우스 (Medical Data Warehouse) 부분의 보안 프로토타입 시스템을 메타데이터 기반으로 설계하고 구현하는 데 주안점을 두었다. 특히, 의료용 데이터 웨어하우스 중에서도 임상 데이터 웨어하우스 (Clinical Data Warehouse) 에 초점을 두었으며 이에 대한 프로토타입은 ㅈ 병원에 적용되어서 개발되었다.

  • PDF

Implementing A Data Warehouse Metadata: A Case (데이터 웨어하우스 메타데이터 구축사례)

  • 조남철;손명호;김태훈;이희석
    • Proceedings of the Korea Database Society Conference
    • /
    • 1999.06a
    • /
    • pp.383-392
    • /
    • 1999
  • 오늘날의 의사결정을 지원하는 시스탬에 있어서 데이터 웨어하우스가 널리 활용되고 있다. 이러한 데이터웨어 하우스를 개발하는데 있어서 메타 데이터가 필수적인 요소로 활용되고 있다. 한편. 메타 데이터 연합 (Meta Data Coalition)에서 제정한 Metadata Interchange Specification (MDIS)는 이러한 메타 데이터의 표준으로 널리 활용되고 있다. 본 연구는 이러한 표준을 기반으로 한 메타 데이터 스키마를 제시하고 있다. 실제적인 개발에서 이러한 표준은 핵심웨어하우스 계층, 적용 계층, 사용자 탐험 계층 및 비즈니스 계층으로 구성되어 있다. 이러한 메타 데이터 스키마를 적용한 실제 시스템의 프로토타입을 본 연구에서 구현해 보았다.

  • PDF