• 제목/요약/키워드: cubing

검색결과 8건 처리시간 0.023초

H*-tree/H*-cubing: 데이터 스트림의 OLAP를 위한 향상된 데이터 큐브 구조 및 큐빙 기법 (H*-tree/H*-cubing-cubing: Improved Data Cube Structure and Cubing Method for OLAP on Data Stream)

  • 심상예;이연;이동욱;김경배;배해영
    • 정보처리학회논문지D
    • /
    • 제16D권4호
    • /
    • pp.475-486
    • /
    • 2009
  • 데이터 큐브는 다차원 데이터 분석 및 멀티레벨 데이터 분석에 많이 사용되고 있는 중요한 데이터 구조이다. 최근 데이터 스트림의 온라인 분석에 대한 수요가 증가하면서 스트림 큐브, Flow 큐브, S-큐브 등의 다양한 데이터 큐브 구조와 기법이 제안되었다. 그러나 기존 기법들은 데이터 큐브 생성 시 고비용이 요구되는 단점을 가지고 있어 효과적인 데이터 구조, 질의 방법 및 알고리즘에 대한 연구가 필요하다. 스트림 큐브 기법에서는 H-큐빙 기법을 사용하여 큐보이드를 선택하고, 계산된 셀들을 인기 패스에 있는 큐보이드들로 구성된 H-트리에 저장한다. 그러나 스트림 큐브 기법에서는 H-트리에 데이터를 비순차적으로 삽입하기 때문에 H-큐빙 기법을 사용하여 질의를 처리할 때 제한성을 갖고 있다. 본 논문에서는 데이터의 트리 구조의 각 층에 대한 인덱스를 구축하여 스트림 데이터에 대한 빠른 삽입 연산을 지원하는 $H^*$-tree 구조와, popular-path에 존재하지 않는 큐보이드를 빨리 계산하여 스트림 데이터에 대한 빠른 애드 혹 질의 응답을 지원하는 $H^*$-cubing 기법을 제안한다. 성능평가를 통하여 제안한 $H^*$-tree 기법은 보다 적은 큐브 구축 시간을 지원하며, $H^*$-cubing 기법이 stream cube 기법보다 빠른 애드 혹질의 응답 시간을 소요하며, 보다 적은메모리를 사용함을 보여준다.

다차원 순차패턴 마이닝을 위한 효율적 알고리즘 (An Efficient Algorithm for Multi-dimensional Sequential Pattern Mining)

  • 이순신;김은주;김명원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.214-216
    • /
    • 2004
  • 순차패턴 마이닝은 데이터들 속에서 어떤 순차 관계가 들어 있는 패턴을 찾는 것이다. 순차 패턴은 다양한 분야에서 중요하게 쓰인다. 예를 들어, 소비자가 구입한 물품들 간의 순차적인 관계성은 다음에 구입할 물건을 예측하는데 쓰일 수 있다. 또한 방문 웹 페이지의 순차 패턴은 사용자가 방문하고자 하는 다음 페이지를 예측하는데 중요할 수 있다. 본 논문에서는 다차원 순차패턴을 마이닝하는 새로운 효율적인 알고리즘의 구현에 대해 설명한다 다차원 순차 패턴 마이닝은 속성-값(attribute-value) 기술을 포함하는 순차 패턴의 연관 규칙을 찾는 것이다. 다음의 두 가지의 현존하는 효율적 알고리즘을 융합하였다. 순차패턴 마이닝을 위한 PrefixSpan 알고리즘과 비 순차패턴 마이닝을 위한 StarCubing 알고리즘. 새로운 알고리즘은 다차원 데이터를 마이닝 하는 StarCubing알고리즘의 효율성을 이용하므로 다차원 순차 데이터를 마이닝 하는데 효율적일 것이다. 실험결과는 제안한 알고리즘이 특히 작은 최소지지도와 작은 cardinality에서 Seq-Dim과 Dim-Seq 같은 현존하는 알고리즘보다 나은 성능임을 보여준다.

  • PDF

시공간 질의 클러스터링: 데이터 큐빙 기법 (Spatio-temporal Query Clustering: A Data Cubing Approach)

  • 심상예;백성하;배해영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.287-288
    • /
    • 2009
  • Multi-query optimization (MQO) is a critical research issue in the real-time data stream management system (DSMS). We propose to address this problem in the ubiquitous GIS (u-GIS) environment, focusing on grouping 'similar' spatio-temporal queries incrementally into N clusters so that they can be processed virtually as N queries. By minimizing N, the overlaps in the data requirements of the raw queries can be avoided, which implies the reducing of the total disk I/O cost. In this paper, we define the spatio-temporal query clustering problem and give a data cubing approach (Q-cube), which is expected to be implemented in the cloud computing paradigm.

공간 데이터 웨어하우스에서 해쉬 테이블을 이용한 데이터큐브의 생성 기법 (Data Cube Generation Method Using Hash Table in Spatial Data Warehouse)

  • 이연;김형선;유병섭;이재동;배해영
    • 한국멀티미디어학회논문지
    • /
    • 제9권11호
    • /
    • pp.1381-1394
    • /
    • 2006
  • 축적된 데이터를 기반으로 의사결정을 지원하는 데이터 웨어하우스에서 빠른 응답을 제공하기 위하여 데이터큐브 생성기법에 대한 많은 연구가 진행되었다. 대표적으로 다차원 배열을 사용한 기법과 hyper-tree를 기반으로 하는 H-cubing 기법이 연구되었다. 하지만 전자는 다차원 집계 연산에 필요한 모든 데이터를 배열로 저장하여 데이터의 양이 많아질수록 메모리 사용이 증가하였으며 후자는 hyper-tree를 기반으로 모든 튜플을 트리로 구축하여 트리 구축비용이 증가하였다. 본 논문에서는 데이터 웨어하우스에서 해쉬 테이블을 이용한 효율적인 데이터큐브 생성 기법을 제안한다. 제안 기법은 데이터큐브 생성 시 가중치 맵핑 테이블과 레코드 해쉬 테이블을 사용하여 다차원 데이터의 저장될 레코드 순서를 빠르게 찾아 저장한다. 따라서 데이터큐브의 생성속도가 향상되며 해쉬 테이블 만을 유지하여 메모리 사용량이 감소한다. 이는 성능평가를 통해 기존 기법보다 데이터의 빠른 검색과 데이터큐브 생성 요청에 빠른 응답을 보였다.

  • PDF

수분 함량이 이탈리안 라이그라스 큐브의 물리적 및 화학적 성상에 미치는 영향 (Effect of Moisture Content on Physical and Chemical Characteristics of Italian Ryegrass Cube)

  • 문병헌;박형수;신종서;박병기;김종근
    • 한국초지조사료학회지
    • /
    • 제36권1호
    • /
    • pp.34-40
    • /
    • 2016
  • 본 시험은 가공 조사료 이용확대를 위해 압축 방법과 수분 함량이 이탈리안 라이그라스 큐브의 물리적 및 화학적 성상에 미치는 영향을 구명하기 위하여 수행되었다. 이탈리안 라이그라스 큐브 제작을 위해 평판 다이형 큐브 기계를 직접 제작하였으며 이탈리안 라이그라스의 수분 함량을 15, 20, 25 및 35%로 조절하여 큐브를 제조하여 품질을 조사하였다. 수분 함량이 15~20%에서는 간헐적인 균열이 일어났으며 가루 발생량도 10~16%로 다른 처리보다 낮게 나타났다. 경도에 있어서도 15% 수분 함량에서 159 kg/f로 가장 높게 나타났으며 30% 수분 함량에서는 70 kg/f로 가장 낮았다. 그러나 전기 부하량과 큐브의 표면 온도는 수분 함량이 낮은 곳에서 더 높게 나타났다. 수분 함량에 따른 큐브의 일반 조성분은 조제전에 비하여 조단백질과 조지방 함량은 높아졌으며 조섬유, ADF, NDF 함량은 감소하는 것으로 나타났다. 조회분 함량은 수분 함량 30%를 제외하고는 큐브 조제 전후간에 차이를 보이지는 않았다. 수분 함량에 있어서는 수분이 많아질수록 조단백질 함량이 증가되는 경향을 보였으며 조섬유, 조회분 함량은 처리간에 차이가 나타나지 않았다. NDF 및 ADF 함량은 30% 수분 함량에서 가장 낮게 나타났다. 이상의 결과를 종합하여 볼 때 이탈리안 라이그라스 큐브 조제를 위한 적정 수분함량은 15~20% 내외로 추정되며 이로 인해 사료적 가치가 향상되는 것으로 나타났다.

데이터 웨어하우스에서 해쉬 테이블을 이용한 효율적인 데이터 큐브 생성 기법 (Efficient Creation of Data Cube Using Hash Table in Data Warehouse)

  • 김형선;유병섭;이재동;배해영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.211-213
    • /
    • 2005
  • 데이터 웨어하우스는 축적된 대량의 데이터를 분석하여 의사결정을 지원하는 시스템이다. 의사결정을 위한 대량의 데이터 분석은 많은 비용을 요구하므로, 질의 처리 성능을 높이고 의사 결정자에게 빠른 응답을 제공하는 효율적인 데이터 큐브 생성 기법이 연구되었다. 기존 기법으로는 Multiway Array 기법과 H-Cubing 기법이 있다. Multiway Array 기법은 다차원 집계 연산에 필요한 모든 데이터를 배열로 저장하는 것으로 데이터의 양이 많아질수록 메모리 사용이 증가한다. H-Cubing 기법은 Hyper-Tree를 기반으로 튜플을 트리로 구축하므로 모든 튜플을 트리로 구축해야 하는 비용이 증가한다. 본 논문에서는 데이터 웨어하우스에서 해쉬 테이블을 이용한 효율적인 데이터 큐브 생성 기법을 제안한다. 제안 기법은 데이터 큐브 생성 시 필드 해쉬 테이블과 레코드 해쉬 테이블을 사용한다. 필드 해쉬 테이블은 저장될 레코드 순서 계산을 위하여 각 필드에 대해 레벨 값을 해쉬 테이블로 관리한다. 레코드 해쉬 테이블은 데이터 큐브 테이블에 저장될 레코드의 순서와 데이터 큐브 테이블에 저장하기 위한 임시 레코드의 위치를 관리한다. 필드 해쉬 테이블을 이용하여 다차원 데이터의 저장될 레코드 순서를 빠르게 찾아 저장함으로서 데이터 큐브의 생성속도가 향상된다. 또한 해쉬 테이블 만을 유지하면 되므로 메모리 사용량이 감소한다. 따라서 해쉬 테이블의 사용으로 데이터의 빠른 검색과 데이터 큐브 생성 요청에 빠른 응답이 가능하다.

  • PDF

스테레오 영상 인식에 기반한 3D 물체의 부피계측방법 (A Stereo Image Recognition-Based Method for measuring the volume of 3D Object)

  • 정윤수;이해원;김진석;원종운
    • 정보처리학회논문지B
    • /
    • 제9B권2호
    • /
    • pp.237-244
    • /
    • 2002
  • 본 논문에서는 스테레오 영상 인식에 기반한 직육면체형 물체의 부피를 계측하는 한 방법이 제안된다. 제안된 방범은 두 대의 CCD(charge coupled device)카메라로부터 획득된 영상에 대하여 관심영역추출, 특징 추출, 그리고 스테레오 정합에 기반한 꼭지점 인식의 과정을 통하여 3D 물체의 부피를 계측한다. 제안된 방법은 3D 물체의 특징을 나타내는 꼭지점 후보들을 영상처리과정을 통해 추출한 후, 이들 꼭지점들에 대해서만 스테레오 정합을 수행함으로써 고속의 부피 계측이 가능한 이점이 있다. 실험을 통하여, 본 논문에서 제안한 방법이 직육면체형 물체의 고속 부피계측에 효과적으로 사용될 수 있음이 보여진다.

한대의 카메라에 기반한 직육면체의 부피 계측 방법 (A Single Camera based Method for Cubing Rectangular Parallelepiped Objects)

  • 원종운;정윤수;김우섭;유광훈;이용준;박길흠
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제8권5호
    • /
    • pp.562-573
    • /
    • 2002
  • 본 논문에서는 소포 및 택배와 같은 패키지(package)의 효과적인 취급(handling)을 위한 직육면체의 부피 계측 방법을 제안한다. 제안된 방법은 한대의 카메라와 직육면체의 특성을 이용하여 실시간으로 부피 계측을 수행한다. 부피 계측을 위한 전처리 과정에서, 제안된 방법은 직육면체의 외곽 선분 정보를 검출하고, 이러한 선분들의 교차점을 3D 물체의 꼭지점으로 추출/인식하여, 물체의 부피를 계산한다. 제안된 방법은 선분 정보를 이용하여 꼭지점을 추출함으로써, 꼭지점을 직접 추출하는 경우에 비하여 카메라의 블러링 효과에 비교적 강인한 특성을 나타내며, 물체의 방향을 고려함으로써 견실한 부피계측 결과를 나타낸다. 실험의 결과를 통하여 제안된 방법이 직육면체 물체의 실시간 부피 계산에 효과적으로 사용될 수 있음이 보여진다.