• 제목/요약/키워드: Multidimensional Indexing

검색결과 30건 처리시간 0.022초

다차원 범위 질의를 위한 순차 색인 기법 (A Sequential Indexing Method for Multidimensional Range Queries)

  • 차광호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권3호
    • /
    • pp.254-262
    • /
    • 2005
  • 이 논문은 다차원 범위 질의를 위한 순차 색인 기법인 세그먼트-페이지 색인(SP-색인)이라는 새로운 색인 기법을 제안한다. SP-색인의 목표는 (1) 다차원 색인 기법에서의 범위 질의의 성능 향상, (2) 과도한 색인의 재구성 없이 색인의 클러스터링이라는 두 가지로 요약된다. 오랜 동안의 데이타베이스 연구 결과로 다양한 다차원 색인 기법이 개발 되었지만, 대부분의 연구가 데이타 레벨의 클러스터링에 초점을 맞추었고, 색인 자체의 클러스터링에는 거의 관심을 두지 않았다. 따라서 대부분의 관련된 색인 노드가 디스크에 분산되고, 질의 처리 시에 많은 무작위 디스크 접근이 발생한다. SP-색인은 관련된 노드를 연속적인 디스크 페이지로 구성되는 하나의 세그먼트에 저장하여 노드들의 분산을 피하고, 세그먼트 내에서의 순차 접근을 통해 질의 처리 성능을 높인다. 실험 결과에 따르면 SP-색인은 페이지 기반의 전통적인 색인기법에 비해 수행 시간 면에서 수 배의 성능 향상을 보이고, 단순히 큰 페이지를 사용에 따른 디스크 대역폭 낭비를 줄인다.

MD-TIX: XML 질의의 효율적 처리를 위한 다차원 타입상속 색인기법 (MD-TIX: Multidimensional Type Inheritance Indexing for Efficient Execution of XML Queries)

  • 이종학
    • 한국멀티미디어학회논문지
    • /
    • 제10권9호
    • /
    • pp.1093-1105
    • /
    • 2007
  • 본 논문에서는 XML 데이터베이스의 색인구조로 다차원 화일구조를 이용하는 다차원 타입상속 색인기법인 MD-TIX를 제안한다. 일차원 색인구조를 이용하는 기존의 XML 데이터베이스 색인기법에서는 타입상속계층과 중첩요소가 포함된 복합 형태의 질의들에 대한 처리를 잘 지원하지 못한다. MD-TIX에서는 XML 데이터베이스의 중첩요소에 대한 색인기법을 위하여 이차원 타입상속 계층 색인기법(2D-THI)을 다차원으로 확장하여 사용한다. 2D-THI는 타입상속 계층의 단순요소에 대한 색인기법으로 킷값 도메인과 타입식별자 도메인으로 구성된 이차원 도메인 공간상에서 요소들의 클러스터링을 다루는 색인기법이다. 본 논문의 MD-TIX에서는 색인된 중첩요소를 표현하는 경로상의 각 타입상속 계층마다 하나의 타입식별자 도메인을 할당하여 구성된 다차원 도메인 공간상에서 색인 엔트리들의 클러스터링을 다룬다. 따라서 HD-TIX에서는 기존의 색인기법에서 지원하기 어려운 질의의 대상 범위가 타입상속 계층상의 임의의 타입들로 제한되거나, 질의에 포함된 복합요소들의 도메인이 타입상속 계층상의 임의의 타입들로 제한되는 경우에도 잘 지원할 수 있다.

  • PDF

다차원 파일구조를 이용한 객체지향 데이터베이스의 중포속성 색인기법 (Indexing Techniques or Nested Attributes of OODB Using a Multidimensional Index Structure)

  • 이종학
    • 한국정보처리학회논문지
    • /
    • 제7권8호
    • /
    • pp.2298-2309
    • /
    • 2000
  • 본 논문에서는 객체지향 데이터베이스의 중포속성에 대한 색인기법으로 다차원 색인구조를 이용하는 다차원 중포속성 색인기법은 MD-NAI를 제안한다. 중포석성에 대한 기존의 색인기법들은 중포된 객체에 대한 기존의 색인기법들은 B+-tree와 같은 일차원 색인구조를 이용함으로써, 클래스 계층과 중포속성이 포함된 복합 형태의 질의들에 대한 처리를 잘 지원하지 못한다. MD-NAI에서는 객체지향 데이터베이스의 클래스 계층에 대한 색인기법인 이차원 클래스 계층 색인기법(2D-CHI)을 다차원으로 확장한다. 2D-CHI는 키 속성 도메인과 클래스 식별자 도메인으로 구성된 이차원 도메인 공간상에서 객체들의 클러스터링을 다루는 색인기법이다. 본 논문의 MD-NAI에서는 색인된 중포속성을 표현하는 경로상의 각 클래스 계층마다 하나의 클래스 식별자 도메인을 할당하여 구성된 다차원 도메인 공간상에서 색인 엔트리들의 클러스터링을 다룬다. 따라서, MD-NAI에서는 기존의 색인기법에서 지원하기 어려운 질의의 대상 범위 클래스 계층상의 임의의 클래스들로 제한되거나, 질의에 포함된 복합속성들의 도메인이 클래스 계층상의 임의의 클래스들로 제한되는 경우에도 잘 지원할 수 있다.

  • PDF

다차원 데이터 및 동적 이용자 선호도를 위한 색인 구조의 연구 (An Index Structure for Efficiently Handling Dynamic User Preferences and Multidimensional Data)

  • 최종혁;류관희;나스리디노프 아지즈
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제7권7호
    • /
    • pp.925-934
    • /
    • 2017
  • 다차원 색인 구조 중 대표적인 것은 R-tree에 기초한 색인으로써 공간 정보 등에 있어 강력한 성능을 보인다. 하지만 R-tree의 경우 차원의 수가 증가하거나 이용자 선호에 따라 부분 차원만을 이용하는 경우, 색인을 생성하는 시간이 크게 증가하고 생성된 색인의 효율성이 감소하는 문제를 갖고 있다. 따라서 지속적으로 차원이 증가하고 있는 최근의 다차원 데이터에는 해당 방법들은 적합하지 않다. 본 논문에서는 이런 문제를 해결하기 위해 해시 색인에 기반한 새로운 다차원 색인 구조인 다차원 해시 색인을 제안한다. 다차원 해시 색인은 해시 함수를 통해 데이터들을 유클리드 공간의 버킷들로 분류하여 색인을 생성하고 이후 탐색이 요청되었을 때 이용자 선호도에 따라 선택된 부분 차원의 공간을 탐색할 수 있는 해시 탐색 트리를 생성하여 효과적인 탐색을 수행한다. 실험 결과, 해당 기법은 R-tree와 비교하여 색인 생성에 있어 매우 큰 성능의 향상과 함께 탐색에서도 유사한 탐색 성능을 보이는 것을 확인할 수 있었다.

Singular Value Decomposition 기반 고차원 인덱스 구조 (A High-Dimensional Index Structure Based on Singular Value Decomposition)

  • 김상욱
    • 산업기술연구
    • /
    • 제20권B호
    • /
    • pp.213-218
    • /
    • 2000
  • The nearest neighbor query is an important operation widely used in multimedia databases for finding the object that is most similar to a given query object. Most of techniques for processing nearest neighbor queries employ multidimensional indexes for effective indexing of objects. However, the performance of previous multidimensional indexes, which use N-dimensional rectangles or spheres for representing the capsule of the object cluster, deteriorates seriously as the number of dimensions gets higher. This paper proposes a new index structure based singular value decomposition resolving this problem and the query processing method using it. We also verify the superiority of our approach through performance evaluation by performing extensive experiments.

  • PDF

An Efficient Indexing Structure for Multidimensional Categorical Range Aggregation Query

  • Yang, Jian;Zhao, Chongchong;Li, Chao;Xing, Chunxiao
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권2호
    • /
    • pp.597-618
    • /
    • 2019
  • Categorical range aggregation, which is conceptually equivalent to running a range aggregation query separately on multiple datasets, returns the query result on each dataset. The challenge is when the number of dataset is as large as hundreds or thousands, it takes a lot of computation time and I/O. In previous work, only a single dimension of the range restriction has been solved, and in practice, more applications are being used to calculate multiple range restriction statistics. We proposed MCRI-Tree, an index structure designed to solve multi-dimensional categorical range aggregation queries, which can utilize main memory to maximize the efficiency of CRA queries. Specifically, the MCRI-Tree answers any query in $O(nk^{n-1})$ I/Os (where n is the number of dimensions, and k denotes the maximum number of pages covered in one dimension among all the n dimensions during a query). The practical efficiency of our technique is demonstrated with extensive experiments.

Content-Based Indexing and Retrieval in Large Image Databases

  • Cha, Guang-Ho;Chung, Chin-Wan
    • Journal of Electrical Engineering and information Science
    • /
    • 제1권2호
    • /
    • pp.134-144
    • /
    • 1996
  • In this paper, we propose a new access method, called the HG-tree, to support indexing and retrieval by image content in large image databases. Image content is represented by a point in a multidimensional feature space. The types of queries considered are the range query and the nearest-neighbor query, both in a multidimensional space. Our goals are twofold: increasing the storage utilization and decreasing the area covered by the directory regions of the index tree. The high storage utilization and the small directory area reduce the number of nodes that have to be touched during the query processing. The first goal is achieved by absorbing splitting if possible, and when splitting is necessary, converting two nodes to three. The second goal is achieved by maintaining the area occupied by the directory region minimally on the directory nodes. We note that there is a trade-off between the two design goals, but the HG-tree is so flexible that it can control the trade-off. We present the design of our access method and associated algorithms. In addition, we report the results of a series of tests, comparing the proposed access method with the buddy-tree, which is one of the most successful point access methods for a multidimensional space. The results show the superiority of our method.

  • PDF

MPEG-7 시각 정보 기술자의 특성을 반영한 효율적인 멀티미디어 데이타 비트맵 인덱싱 방법 (An Efficient Bitmap Indexing Method for Multimedia Data Reflecting the Characteristics of MPEG-7 Visual Descriptors)

  • 정진국;낭종호
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제32권1호
    • /
    • pp.9-20
    • /
    • 2005
  • 최근 멀티미디어 정보를 기술하기 위한 표준인 MPEG-7이 제안되어 이미지/동영상 검색 시스템과 간은 응용분야에서 사용되기 시작하였다. 그러나 MPEG-7 시각 정보 기술자들은 대부분 고차원으로 표현이 되고, 고차원에서 발생되는 문제인 "Curse of dimensionality" 때문에 기존의 인덱싱 방법(예를 들면 트리 구조를 이용하는 다차원 인덱싱 방법, 차원을 줄이는 방법, 양자화 등의 압축 기법을 이용하는 방법 등)으로는 효율적인 검색을 할 수 없다. 본 논문에서는 MPEG-7 시각 정보 기술자들의 특징을 반영한 효율적인 인덱싱 방법을 제안한다. 제안된 방법에서는 기술자를 속성 히스토그램으로 변형하고 히스토그램의 자 빈 값을 이진 형태로 표현하여 비트열을 생성하며, 이러한 비트열들을 이용하여 비트맵 인덱스를 구성한다. 질의 오브젝트가 입력되면 비트맵 인덱스를 이용하여 결과에 포함될 가능성이 있는 후보 오브젝트 리스트를 생성하게 되는데 즉, 각 오브젝트의 인덱스와 질의 오브젝트의 비트열에 대한 XOR(Exclusive OR) 연산을 수행하여서 후보 오브젝트 리스트를 생성한다. 그리고 이 리스트에 있는 오브젝트들에 대해서만 L1-norm과 같은, 기술자를 위해 사용되는 비교 연산식을 수행하여 최종 결과 오브젝트들을 사용자에게 보여주게 된다. 본 논문에서 제안하는 알고리즘은 단순한 비트 연산을 통해 검색 결과에 포함될 가능성이 있는 오브젝트들을 추출해낼 수 있기 때문에 빠른 시간 내에 검색을 마칠 수 있도록 해준다. 실험에 의하면 제안한 방법을 이용하는 경우, 90% 이상의 정확도를 유지하면서 검색 시간에서는 순차 검색에 비해 15배 이상의 속도 향상을 보임을 알 수 있었다.

GC-트리 : 이미지 데이타베이스를 위한 계층 색인 구조 (GC-Tree: A Hierarchical Index Structure for Image Databases)

  • 차광호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권1호
    • /
    • pp.13-22
    • /
    • 2004
  • 멀티미디어 데이타의 사용이 증가함에 따라 고차원 이미지 데이타에 대한 효율적인 색인과 검색 기법이 크게 요구되고 있다. 그러나 많은 노력에도 불구하고 현재의 다차원 색인 기법들은 고차원 데이타 공간에서 만족할 만한 성능을 보여주지 못하고 있다. 이러한 소위 차원의 저주를 해결하기 위해 최근에 차원을 줄이거나 근사 해를 구하는 둥의 접근법이 시도되고 있지만 이러한 방법들은 근본적으로 정확도의 상실이라는 문제를 갖고 있다. 정확도의 보존을 위해 VA-file, LPC-file둥과 같이 벡터 근사에 기반 한 기법들이 최근에 개발되었다. 그러나 이 기법은 검색 성능이 색인 파일의 크기에 큰 영향을 받으며, 한번에 큰 검색 공간을 줄이는 계층 색인 구조의 장점을 상실한다. 본 논문에서는 이미지 데이터베이스에서 유사성 질의를 위한 새로운 계층 색인 구조인 GC-트리를 제안한다. GC-트리는 밀도 함수에 기초하여 데이타 공간을 적응적으로 분할하고, 색인 구조를 동적으로 생성한다. 이러한 특성을 갖는 GC-트리는 군집화 된 고차원 이미지 데이타 검색에 훌륭한 성능을 나타낸다.

지리정보시스템에서 공간 색인기법에 관한 연구 (A Study on the Spatial Indexing Scheme in Geographic Information System)

  • 황병연
    • Spatial Information Research
    • /
    • 제6권2호
    • /
    • pp.125-132
    • /
    • 1998
  • 지리정보시스템을 위한 공간 데이터베이스는 공간 데이터의 특성에 의해 다차원의 대용량 데이터를 다루기 때문에 공간 질의의 I/O성능이 매우 중요한 역할을 한다. 따라서 본 논문에서는 공간 질의의 I/O성능을 높이기 위해서 복잡한 공간 객체들을 다루는 대표적인 접근기법들인 Z-변형을 이용한 B 트리, KDB트리, R트리, MAX트리에 대해 기술하였다. 또한, 다양한 실제 데이터와 질의 집합을 사용해서 여러 공간 색인 기법들의 성능을 측정하였다. 벤치마크 실험을 해본 결과, MAX 트리는 삽입, 영역 질의, 공간 조인 둥의 연산에 대해 다른 색인 기법들보다 상대적으로 좋은 성능을 나타냈다. MAX 트리는 향후 GIS의 하부 저장시스템을 구성하는 색인기법으로 사용될 것으로 기대된다.

  • PDF