• Title/Summary/Keyword: 집계함수

Search Result 51, Processing Time 0.027 seconds

Efficient Processin of Queries with Joints and Aggregate Functions in ROLAP Data Warehousing Environment (관계형 OLAP 데이터 웨어하우징 환경에서 조인과 집계함수를 포함하는 질의의 효율적인 처리)

  • Kim, Jin-Ho;Kim, Yun-Ho;Kim, Sang-Wook
    • Journal of the Institute of Electronics Engineers of Korea CI
    • /
    • v.39 no.5
    • /
    • pp.1-10
    • /
    • 2002
  • Efficient processing of expensive queries that include joins and/or aggregate functions is crucial in data warehousing environment since there reside enormous volume of data. In this paper, we propose a new method for processing of queries that have both of joins and aggregate functions. The proposed method first performs grouping of the dimension table and then processes join by using the bitmap join index. This makes only the fact table accessed for processing aggregate functions, and thus resolves the serious performance degradation of the existing method. For showing the superiority of the proposed method, we suggest the cost models for the proposed and existing ones, and perform extensive simulations based on the TPC-H benchmark.

Aggregate Cubetree : Cubetree for Efficient Execution of Range-Aggregate Query (집계큐브리트리 :효율적인 범위-집계 질의의 수행을 위한 큐브트리)

  • 홍석진;송병호;이석호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.163-165
    • /
    • 2001
  • 데이터웨어하우스 환경에서는 범위-집계 질의를 효율적으로 수행하기 위해 데이터큐브로 저장뷰를 구성한다. 큐브트리란 이러한 저장뷰를 R-Tree형태로 구성하는 기법으로, 효율적인 데이터 접근성을 제공하지만 범위-집계 질의 범위 내의 모든노드를 접근해야 하는 단점이 있다. 이 논문에서는 중간노드의 MBR에 자식 노드 레코드들의 집단함수 값을 저장하여, 질의 범위에 포함되는 중간노드의 경우 단말노드를 접근하지 않고 효율적으로 범위-집계 질의를 수행할 수 있는 집계큐브트리를 제안하였다. 집계큐브트리는 기존의 큐브트리에 비해, 항상 적은 수의 노드 접근으로 질의를 수행하며 질의 범위의 크기가 커질수록 좋은 성능을 보인다.

  • PDF

An Technique for the Active Rule Condition (능동규칙의 조건부 처리 기법)

  • 이기욱
    • Journal of the Korea Society of Computer and Information
    • /
    • v.3 no.4
    • /
    • pp.49-54
    • /
    • 1998
  • AS it takes a considerable time for database operations for processing the condition part of active rule, the operations have an important effect on the efficiency of active database system. The processing time of operations should be minimized in order to improve the efficiency of system. The previous works are limited to basic database operations and the partial aggregate functions. In this paper, the processing technique using the structuralization and the state table of relations is suggested. The processing time for basic database operations can be reduced with the structuralization of relations to classification tree and the introduction of deletion information table. With the introduction of binary search tree and relation state table, the aggregate function which has a big of processing cost can be processed effectively and the function of the active database system can be maximized.

  • PDF

A Performance Evaluation of Temporalaggregate Query Processing (시간지원 집계 질의 처리의 성능 평가)

  • Lee, Jong-Yun;Kim, Dong-Ho;Lee, In-Hong;Ryu, Keun-Ho
    • The Transactions of the Korea Information Processing Society
    • /
    • v.5 no.7
    • /
    • pp.1671-1679
    • /
    • 1998
  • Temporal databases support an efficient hist0rical representation and operation for an object in the real world. Especiallv, temporal aggregates generate In additional by information by means of computations from objects that is valid at past as well as current time. It is one of important areas to serve to users as various type of aggregates as possible so that they enhance the overall system performance and efficiency. In this paper, we not only introduce temporal aggregate tree strategy as an efficient processing technique for given temporal aggregate query, but also analyze the ovemll processing cost and then evaluate its perfomlance.

  • PDF

Design of an Inference Control Process in OLAP Data Cubes (OLAP 데이터 큐브에서의 추론통제 프로세스 설계)

  • Lee, Duck-Sung;Choi, In-Soo
    • Journal of the Korea Society of Computer and Information
    • /
    • v.14 no.5
    • /
    • pp.183-193
    • /
    • 2009
  • Both On-Line Analytical Processing (OLAF) data cubes and Statistical Databases (SDBs) deal with multidimensional data sets. and both are concerned with statistical summarizations over the dimensions of the data sets. However, there is a distinction between the two that can be made. While SDBs are usually derived from other base data, OLAF data cubes often represent directly the base data. In other word, the base data of SDBs are the macro-data, whereas the core cubiod data in OLAF data cubes are the micro-data. The base table in OLAF is used to populate the data cube with values of the measure attribute, and each record in the base tables is used to populate a cell of the core cuboid. The fact that OLAF data cubes mostly represent the micro-data may make some records be absent in the base table. Some cells of the core cuboid remain empty, if corresponding records are absent in the base table. Wang and others proposed a method for securing OLAF data cubes against privacy breaches. They assert that the proposed method does not depend on specific types of aggregation functions. In this paper, however, it is found that their assertion on aggregate functions is wrong whenever any cell of the core cuboid remains empty. The objective of this study is to design an inference control process in OLAF data cubes which rectifying Wang's error.

A Design of Protocol Management System for Aggregating Messages based on Certification between Vehicles (차량간 인증 기반 메시지 집계 프로토콜 관리시스템 설계)

  • Lee, ByungKwan;Jeong, EunHee
    • Journal of Korea Society of Industrial Information Systems
    • /
    • v.18 no.4
    • /
    • pp.43-51
    • /
    • 2013
  • This paper proposes the design of protocol management system for aggregationg messages based on certification between vehicles which not only prevents the messages between vehicles from being forged and altered by Sybil attack by authenticating the them, and but also provides the efficient communication by aggregating the redundant vehicle messages which frequently happens when communicating. For this, the proposed system proposes the SKLC(Session Key Local Certificate) design which is a local certificate based on a session key, and the MAP(Message Aggregation Protocol) design which aggregates the redundant vehicle messages. Therefore, when the proposed system checks the certificate of vehicle, it provides the reliable information securely by verifying the integrity of vehicle with a hash function operation, and improves communication efficiency by reducing the processing time.

Vehicle Loss Assessment in Inundation Area using Raster GIS Operation (Raster GIS 연산을 활용한 침수구역 내 차량피해 적용 방안)

  • Kim, Gil Ho;Choi, Cheon Kyu;Hong, Seung Jin;Kim, Kyung Tak
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2018.05a
    • /
    • pp.453-453
    • /
    • 2018
  • 2017년 12월 기준 우리나라에 등록된 자동차는 약 2,200만 이상으로, 그 증가율은 매년 증가하는 추세이다. 이러한 최근 차량대수 및 고자산인 외산차 보유율 증가는 자연재난에서 노출과 관련한 위험도를 증가시키는 주요인이 되며, 홍수발생 시 상당한 규모의 경제적 피해를 야기한다. 현재 국가연구개발사업으로 진행 중인 행정안전부(2017) 연구는 위험지역 내 차량의 공간적 분포와 차량유형별 침수심에 따른 취약성을 고려하여 어떠한 홍수사상으로부터 예상되는 차량 피해액을 추정하는 방법을 제시한 바 있다. 여기서는 어떠한 집계구 내에서 동일한 침수심 구간을 가지는 면(polygon)을 분석단위로 하고 있는 데, 이를 편의성 차원에서 벡터자료에 기반 한 연산과정을 수행할 경우 정의된 침수구역도(재해정보)의 고유 정보가 훼손되거나, 세분화된 침수심 구간에 따른 손상률 관계를 사용할 수 없는 문제점이 있다. 이에 본 연구에서는 격자 기반의 침수구역도와 인벤토리 지도로부터 Raster GIS 공간연산을 활용한 차량피해 산정절차를 제시하였고, 이를 신천수계 하천기본계획(경기도, 2011)에서 계획된 치수사업에 적용하여 홍수빈도별 사업시행 전후 상황에 적용하였다. 이 과정에서 침수구역도는 인벤토리 상의 집계구 면적을 고려하여 $5m{\times}5m$ 크기로 제작하였고, 동일한 격자크기로 변환된 인벤토리는 변환 전후 면적을 기준으로 할 때 거의 오차가 없는 것으로 확인되었다. 그리고 Raster 공간연산으로부터 침수편입률을 결정하는 과정에서 집계구 넘버 및 침수심 정보를 확인하기 위한 자료별 전처리 과정을 제시하였고, 여기서 집계구 넘버는 인벤토리 정보와 침수심 정보는 손상함수와 연계된다. 본 연구에서 제시한 결과는 향후 실무에서 직접 적용하는 데 활용하기 위하여 방법론과 함께 가이드라인 문서로 정리할 계획이다.

  • PDF

A Study on Temporal Data Model and Aggregate Function (시간지원 데이터 모델 및 집계함수에 관한 연구)

  • 이인홍;문홍진;조동영;이완권;조현준
    • The Journal of Information Technology and Database
    • /
    • v.4 no.1
    • /
    • pp.19-30
    • /
    • 1997
  • 시간지원 데이터 모델은 시간 의미를 데이터 모델에 추가하여 시간에 따라 변화된 정보를 처리할 수 있는 데이터 모델이다. 시간지원 데이터 모델은 실세계에서 사건이 발생한 시간인 유효시간을 지원하는 데이터 모델과 데이터가 수록된 시간을 지원하는 거래시간 데이터 모델 그리고 거래시간과 유효시간을 모두 지원하는 이원시간 데이터 모델이 있다. 대부분이 시간지원 데이터 모델은 관계형 모델을 확장하여 시간지원 데이터를 처리할 수 있도록 설계된다. 시간지원 데이터 모델의 두 부류는 시간을 결합하는 단위에 따라 튜플 타임스탬프와 속성 타임스탬프의 두 가지 형식이 있다. 본 논문은 데이터 모델에서 시간 추가를 위한 기본적인 시간 개념과 시간지원 데이터 모델을 위한 고려사항을 나타낸다. 그리고 시간지원 데이터 모델을 지원시간에 따라 비교하였으며, 유효시간이 지원되는 시간지원 집계에 적합한 데이터 모델을 제안하였다.

  • PDF

Development of Time-based Safety Performance Function for Freeways (세부 집계단위별 교통 특성을 반영한 고속도로 안전성능함수 개발)

  • Kang, Kawon;Park, Juneyoung;Lee, Kiyoung;Park, Joonggyu;Song, Changjun
    • The Journal of The Korea Institute of Intelligent Transport Systems
    • /
    • v.20 no.6
    • /
    • pp.203-213
    • /
    • 2021
  • A vehicle crash occurs due to various factors such as the geometry of the road section, traffic, and driver characteristics. A safety performance function has been used in many studies to estimate the relationship between vehicle crash and road factors statistically. And depends on the purpose of the analysis, various characteristic variables have been used. And various characteristic variables have been used in the studies depending on the purpose of analysis. The existing domestic studies generally reflect the average characteristics of the sections by quantifying the traffic volume in macro aggregate units such as the ADT, but this has a limitation that it cannot reflect the real-time changing traffic characteristics. Therefore, the need for research on effective aggregation units that can flexibly reflect the characteristics of the traffic environment arises. In this paper, we develop a safety performance function that can reflect the traffic characteristics in detail with an aggregate unit for one hour in addition to the daily model used in the previous studies. As part of the present study, we also perform a comparison and evaluation between models. The safety performance function for daily and hourly units is developed using a negative binomial regression model with the number of accidents as a dependent variable. In addition, the optimal negative binomial regression model for each of the hourly and daily models was selected, and their prediction performances were compared. The model and evaluation results presented in this paper can be used to determine the risk factors for accidents in the highway section considering the dynamic characteristics. In addition, the model and evaluation results can also be used as the basis for evaluating the availability and transferability of the hourly model.