• Title/Summary/Keyword: Data-Warehouse

Search Result 348, Processing Time 0.025 seconds

Building Hierarchical Bitmap Indices in Space Constrained Environments (저장 공간이 제약된 환경에서 계층적 비트맵 인덱스 생성에 관한 연구)

  • Kim, Jong Wook
    • Journal of Digital Contents Society
    • /
    • v.16 no.1
    • /
    • pp.33-41
    • /
    • 2015
  • Since bitmap indices are useful for OLAP queries over low-cardinality data columns, they are frequently used in data warehouses. In many data warehouse applications, the domain of a column tends to be hierarchical, such as categorical data and geographical data. When the domain of a column is hierarchical, hierarchical bitmap index is able to significantly improve the performance of queries with conditions on that column. This strategy, however, has a limitation in that when a large scale hierarchy is used, building a bimamp for each distinct node leads to a large space overhead. Thus, in this paper, we introduce the way to build hierarchical bitmap index on an attribute whose domain is organized into a large-scale hierarchy in space-constrained environments. Especially, in order to figure out space overhead of hierarchical bitmap indices, we propose the cut-selection strategy which divides the entire hierarchy into two exclusive regions.

A Meta-Analysis of Influencing Collagen Intake on Skin Utilizing Big Data (빅데이터 분석을 활용한 콜라겐 섭취가 피부에 미치는 영향에 관한 메타분석)

  • Jin, Chan-Yong;Yu, Ok-Kyeong;Nam, Soo-Tai
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.20 no.11
    • /
    • pp.2033-2038
    • /
    • 2016
  • Big data analysis, in the large amount of data stored as the data warehouse which it refers the process of discovering meaningful new correlations, patterns, trends and creating new values. The important issue of a meta-analysis is not the significance test, the effect size of the predictor variable on the criterion variable. We reviewed a total of 236 samples among 6 studies published on the topic related Collagen intake on skin between 2000 and 2016 in Korea. The results of the study are summarized as follows. First, we concluded that the path between before and after of Sebum (SB) had the largest effect size of (r = .416) Therefore, the effect of the Collagen intake intervention showed an explanatory power of 17 (%) about. Next, the path between before and after of Moisture (MS) had the higher the effect size of (r = .318). Thus, we present the theoretical and practical implications of these results.

Explanation-based Data Mining in Data Warehouse (데이타 웨어하우스 환경에서의 설명기반 데이타 마이닝)

  • 김현수;이창호
    • Proceedings of the Korea Database Society Conference
    • /
    • 1999.06a
    • /
    • pp.115-123
    • /
    • 1999
  • 산업계 전반에 걸친 오랜 정보시스템 운용의 결과로 대용량의 데이타들이 축적되고 있다. 이러한 데이타로부터 유용한 지식을 추출하기 위해 여러 가지 데이타 마이닝 기법들이 연구되어왔다. 특히 데이타 웨어하우스의 등장은 이러한 데이타 마이닝에 있어 필요한 데이타 제공 환경을 제공해 주고 있다. 그러나 전문가의 적절한 판단과 해석을 거치지 않은 데이타 마이닝의 결과는 당연한 사실이거나, 사실과 다른 가짜이거나 또는 관련성이 없는(trivial, spurious and irrelevant) 내용만 무수히 쏟아낼 수 있다. 그러므로 데이타 마이닝의 결과가 비록 통계적 유의성을 가진다 하더라고 그 정당성과 유용성에 대한 검증과정과 방법론의 정립이 필요하다. 데이타 마이닝의 가장 어려운 점은 귀납적 오류를 없애기 위해 사람이 직접 그 결과를 해석하고 판단하며 아울러 새로운 탐색 방향을 제시해야 한다는 것이다. 본 논문의 목적은 이러한 데이타 마이닝에서 추출된 결과를 검증하고 아울러 새로운 지식 탐색 방향을 제시하는 방법론을 정립하는데 있다. 본 논문에서는 데이타 마이닝 기법 중 연관규칙탐사로 얻어진 결과를 설명가능성 여부의 판단을 통해 검증하는 기법을 제안하며, 이를 통해 얻어진 검증된 지식을 토대로 일반화를 통한 새로운 가설을 생성하여 데이타 웨어하우스로부터 연관규칙을 검증하는 일련의 아키텍쳐(architecture)를 제시하고자 한다. 먼저 데이타 마이닝 결과에 대한 설명의 필요성을 제시하고, 데이타 웨어하우스와 데이타 마이닝 기법들에 대한 간략한 설명과 연관규칙탐사에 대한 정의 및 방법을 보이고, 대상 영역에 대한 데이타 웨어하우스의 스키마를 보였다. 다음으로 도메인 지식(domain knowledge)과 연관규칙탐사를 통해 얻어진 결과를 표현하기 위한 지식표현 방법으로 Relational predicate Logic을 제안하였다. 연관규칙탐사로 얻어진 결과를 설명하기 위한 방법으로는 연관규칙탐사로 얻어진 연관규칙에 대해 Relational Predicate Logic으로 표현된 도메인 지식으로서 설명됨을 보이게 한다. 또한 이러한 설명(explanation)을 토대로 검증된 지식을 일반화하여 새로운 가설을 연역적으로 생성하고 이를 연관규칙탐사론 통해 검증한 후 새로운 지식을 얻는 반복적인 Explanation-based Data Mining Architecture를 제시하였다. 본 연구의 의의로는 데이타 마이닝을 통한 귀납적 지식생성에 있어 귀납적 오류의 발생을 고메인 지식을 통해 설명가능 함을 보임으로 검증하고 아울러 이러한 설명을 통해 연역적으로 새로운 가설지식을 생성시켜 이를 가설검증방식으로 검증함으로써 귀납적 접근과 연역적 접근의 통합 데이타 마이닝 접근을 제시하였다는데 있다.

  • PDF

Plan of Information System for Combined Treatment of the Oriental and the Western Medicine (한.양방 협진 정보시스템 구축방안 연구)

  • Yea, Sang-Jun;Jang, Hyun-Chul;Kim, Chul;Kim, Jin-Hyun;Kim, Sang-Kyun;Song, Mi-Young
    • Journal of Society of Preventive Korean Medicine
    • /
    • v.13 no.3
    • /
    • pp.19-28
    • /
    • 2009
  • Background : Recently, Medical Act was amended to encourage the induction of combined treatment between Oriental Medicine doctors and Western doctors. As yet, the information infra for combined treatment has not been studied. Objectives : This study aimed to design the architecture of information system for combined treatment of the Oriental and the Western Medicine. Methods : First, we defined the information of combined treatment through the analysis of research trends from the inside and outside of the country. Because the data compatibility is very important, the definition of information must be ahead of anything else. Second, we designed the architecture of information system based on the prior definition. Results : We classified the information for combined treatment by subject such as law, clinic, research, manpower, facilities, and education. In this paper information system examined in three aspects. First the infra layer is organized as hardware, netware, and security. Second is data warehouse layer for the storing, filtering, and extraction of data. Third is service layer which is related to data transmission. And Finally all information for combined treatment is provided through the portal system for medical consumer, political planner, and R&D researcher. Conclusion : In this paper, we studied the essential factors of combined treatment information in the view point of information system. But the detailed design and implementation of information system must be followed to effect this results.

  • PDF

On Efficient Processing of Multidimensional Temporal Aggregates In Temporal Databases (시간지원 데이타베이스에서 다차원 시간 집계 연산의 효율적인 처리 기법)

  • 강성탁;정연돈;김명호
    • Journal of KIISE:Databases
    • /
    • v.29 no.6
    • /
    • pp.429-440
    • /
    • 2002
  • Temporal databases manage time-evolving data. They provide built-in supports for efficient recording and querying of temporal data. The temporal aggregate in temporal databases is an extension of the conventional aggregate to include time concept on the domain and range of aggregation. This paper focuses on multidimensional temporal aggregation. In a multidimensional temporal aggregate, we use one or more general attributes as well as a time attribute on the range of aggregation, thus it is a useful operation for historical data warehouse, Call Data Records(CDR), etc. In this paper, we propose a structure for multidimensional temporal aggregation, called PTA-tree, and an aggregate processing method based on the PTA-tree. Through analyses and performance experiments, we also compare the PTA-tree with the simple extension of SB-tree that was proposed for temporal aggregation.

Enterprise GIS Implementation Plan at Local Government: from Data Centric to Service Centric Architecture (지방자치단체의 Enterprise GIS 고도화전략: 데이터중심에서 서비스중심 아키텍처로)

  • Kang, Young-Ok
    • Spatial Information Research
    • /
    • v.15 no.3
    • /
    • pp.347-362
    • /
    • 2007
  • GIS has been rapidly developed since 1995 when the Ministry of Construction and Transportation started the First National GIS Construction Project and built large scale topographic map at local governments level. From that time local governments have been built several application system such as road management system, waterworks management system, sewer management system, underground facilities management system, and urban planning information system, etc. However, the construction of GIS application system at different department level brings the problem of data sharing and overlapping database construction. To overcome this environment Enterprise GIS concepts has been introduced. In case of Seoul Metropolitan government Spatial Data Warehouse have been constructed. However, Seoul Metropolitan government still have the problem of inactive use of GIS system and adaption to the rapidly changing information environment. This study aims to present Strategic plan to uggrade Enterprise GIS concenpt from data centric to service centric architecture at local government level.

  • PDF

A Cache Manager for Enhancing the Performance of Query Evaluation in Data Warehousing Environment (데이타웨어하우스 환경에서의 질의 처리 성능 향상을 위한 캐시 관리자)

  • 심준호
    • Journal of KIISE:Databases
    • /
    • v.30 no.4
    • /
    • pp.408-419
    • /
    • 2003
  • Data warehouses are usually dedicated to the processing of quires issued by decision support system(DSS). The response time of DSS queries is typically several orders of magnitude higher than the one of OLTP queries. Since DSS queries are often submitted interactively, techniques for reducing their response time are important. The caching of query results is one such technique particularly well suited to the DSS environment. In this paper, we present a cache manager for such an environment. Specifically, we define a canonical form of query. The cache manager looks up a query based on the exact query match or using a suggested query split process if the query is found is non-canonical form or in canonical form, respectively. It dynamically maintains the cache content by employing a profit function which reflects in an integrated manner the query execution cost, the size of query result, the reference rate, the maintenance cost of each result due to updates of their base tables, and the frequency of such updates. We performed the experimental evaluation and it positively shows the performance benefit of our cache manager.

네트웍 기반 그룹의사결정지원시스템의 정보공유와 사용자관리를 위한 설계

  • 이동호
    • Proceedings of the Korea Association of Information Systems Conference
    • /
    • 1997.10a
    • /
    • pp.165-181
    • /
    • 1997
  • 경영환경과 조직의 분사화의 정도가 증가함에 따라서 의사결정지원시스템 (Decision Support System)에 있어서도 분산화 된 시스템의 요구가 증가되고 있다. 이러한 관점에서 본 연구는 분산화 된 환경인 네트웍을 기반으로 하는 의사결정지원시스템을 대상 으로 사용자간의 정보공유와 사용자의 참여의 효과적인 관리를 위한 기능적 설계를 제시한 다. 정보의 공유는 의사결정지원시스템과 그룹의사결정지원시스템을 차별화 하는 가장 큰 특징이다. 이러한 정보의 공유는 과업을 수행하는 그룹단위(WorkGroup)로 이루어지는 것이 바람직하며, 그룹의 구성원들간의 의사소통과 정보를 저장하는 자료저장소(Data Warehouse)와 서버(Server)의 구축, 보다 사용하기 쉬운 그래픽 사용자 인터페이스 (Graphic User Interface)를 포함하는 전자우편(Electronic Mail), 의사결정에 참여한 사용자 에게 의사결정결과에 대한 구체적인 피드백(Feedback)을 제공할 수 있는 시스템의 구축과 같은 방법을 통해서 보다 효과적인 관리가 이루어질 수 있게 된다. 사용자의 관리는 의사결 정지원시스템이 효과를 결정하는데 중요한 요소의 하나로써 보다 많은 참여는 그륩시너지효 과(Group Synergy Effect)를 가능하게 한다. 또한 완전한 익명성(Anonymity)의 확보는 기존 의 물리적인 제한을 가진 의사결정실 GDSS의 불완전한 익명성을 충분히 대체할 수 있을 것이다. 의사결정과정의 지원에 있어서도 사용자에게 회의의 기록을 자동적으로 제공하는 것과 병행하여 회의 중에 자신이 기록해야 할 사항을 추가적으로 기록할 수 있는 모듈 (Module)을 제공하는 것이 보다 효과적일 것이다. 물론 이러한 모듈은 앞서 언급한 정보의 공유의 관점에서 본다면 참여자 자신의 피드백에 도움을 주며, 또한 유사한 수준의 다른 참 여자에게 있어서 문제에 대한 인식을 다른 사용자와의 비교를 통하여 일정수준으로 동질화 시킬 수 있게 된다.

  • PDF

Knowledge Discovery Process In Internet For Effective Knowledge Creation : Application To Stock Market (효과적인 지식창출을 위한 인터넷 상의 지식채굴과정 : 주식시장에의 응용)

  • 김경재;홍태호;한인구
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 1999.03a
    • /
    • pp.105-113
    • /
    • 1999
  • 최근 데이터와 데이터베이스의 폭발적 증가에 따라 무한한 데이터 속에서 정보나 지식을 찾고자하는 지식채굴과정(Knowledge discovery process)에 대한 관심이 높아지고 있다. 특히 기업 내외부 데이터베이스 뿐만 아니라 데이터웨어하우스(data warehouse)를 기반으로 하는 OLAP 환경에서의 데이터와 인터넷을 통한 웹(web)에서의 정보 등 정보원의 다양화와 첨단화에 따라 다양한 환경 하에서의 지식 채굴과정이 요구되고 있다. 본 연구에서는 인터넷 상의 지식을 효과적으로 채굴하기 위한 지식채굴과정을 제안한다. 제안된 지식채굴과정은 명시지(explicit knowledge)외에 암묵지(tacit knowledge)를 지식채굴과정에 반영하기 위해 선행지식베이스(prior knowledge base)와 선행지식관리시스템(prior knowledge management system)을 이용한다. 선행지식관리시스템은 퍼지인식도(fuzzy cognitive map)를 이용하여 선행지식베이스를 구축하여 이를 통해 웹에서 찾고자 하는 유용한 정보를 정의하고 추출된 정보를 지식변환시스템(knowledge transformation system)을 통해 통합적인 추론과정에 사용할 수 있는 형태로 변환한다. 제안된 연구모형의 유용성을 검증하기 위하여 재무자료에 선행지식을 제외한 자료와 선행지식을 포함한 자료를 사례기반추론 (case-based reasoning)을 이용하여 실험한 결과, 제안된 지식채굴과정이 유용한 것으로 나타났다.

  • PDF

Applying Genetic Algorithm for Can-Order Policies in the Joint Replenishment Problem

  • Nagasawa, Keisuke;Irohara, Takashi;Matoba, Yosuke;Liu, Shuling
    • Industrial Engineering and Management Systems
    • /
    • v.14 no.1
    • /
    • pp.1-10
    • /
    • 2015
  • In this paper, we consider multi-item inventory management. When managing a multi-item inventory, we coordinate replenishment orders of items supplied by the same supplier. The associated problem is called the joint replenishment problem (JRP). One often-used approach to the JRP is to apply a can-order policy. Under a can-order policy, some items are re-ordered when their inventory level drops to or below their re-order level, and any other item with an inventory level at or below its can-order level can be included in this order. In the present paper, we propose a method for finding the optimal parameter of a can-order policy, the can-order level, for each item in a lost-sales model. The main objectives in our model are minimizing the number of ordering, inventory, and shortage (i.e., lost-sales) respectively, compared with the conventional JRP, in which the objective is to minimize total cost. In order to solve this multi-objective optimization problem, we apply a genetic algorithm. In a numerical experiment using actual shipment data, we simulate the proposed model and compare the results with those of other methods.