• 제목/요약/키워드: 분할 색인

검색결과 1,057건 처리시간 0.024초

이동체 데이터베이스를 위한 R-tree 기반 색인구조에서 궤적 클러스터를 사용한 분할 정책 (Splitting policies using trajectory clusters in R-tree based index structures for moving objects databases)

  • 김진곤;전봉기;홍봉희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.37-39
    • /
    • 2003
  • 이동체 데이터베이스를 위한 과거 궤적 색인으로 R-tree계열이 많이 사용된다. 그러나 R-tree계열의 색인은 공간 근접성만을 고려하였기 때문에 동일 궤적을 검색하기에는 많은 노드 접근이 필요하다. 이동체 색인의 검색에서 영역 질의와 궤적 질의는 공간 근접성과 궤적 연결성과 같이 상반된 특징으로 인하여 함께 고려되지 않았다. 이동체 색인에서 영역 질의의 성능개선을 위해서는 노드 간의 심한 중복과 사장 공간(Dead Space)을 줄여야 하고, 궤적 질의의 성능 개선을 위해서는 이동체의 궤적 보존이 이루어져야 한다. 이와 같은 요구 조건을 만족하기 위해, 이 논문에서는 R-tree 기반의 색인 구조에서 새로운 분할 정책을 제안한다. 제안하는 색인 구조의 노드 분할 정책은 궤적 클러스터링을 위한 동일 궤적을 그룹화해서 분할하는 공간 축 분할 정책과 공간 활용도를 높이는 시간 축 분할 정책을 제안한다. 본 논문에서는 R-tree기반의 색인 구조에서 변경된 분할 정책을 구현하고, 실험 평가를 수행한다. 이 성능 평가를 통해서 검색성능이 우수함을 보인다.

  • PDF

이동체의 위치 색인을 위한 궤적 클러스터링 기반의 분할 정책 (Splitting policies based on clustering trajectories for indexing positions of moving objects)

  • 김진곤;전봉기;홍봉희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.773-775
    • /
    • 2003
  • 이동성을 갖는 장치들의 위치 정보를 관리하기 위하여 이동체 데이터베이스에 관한 연구가 필요하게 되었다. 이동체 색인의 검색에서 영역 질의와 궤적 질의는 공간 근접성과 궤적 연결성과 같이 상반된 특징으로 인하여 함께 고려되지 않았다. 이동체 색인에서 영역 질의의 성능개선을 위해서는 노드간의 심한 중복과 사장 공간(Dead space)을 줄여야 하고, 궤적 질의의 성능 개선을 위해서는 이동체의 궤적 보전이 이루어져야 한다. 이와 같은 요구 조건을 만족하기 위해, 이 논문에서는 R-tree를 기반의 색인 구조에서 새로운 분할 정책을 제안한다. 제시하는 색인 구조에서 단말 노드의 엔트리는 궤적이며, 비단말 노드의 엔트리는 자식 노드이다. 단말 노드 분할 정책에서 동일 궤적을 그룹화해서 분할 하는 공간 축 분할 정책과 공간 활용도를 높이는 시간 축 분할 정책을 제안한다. 시간 축 분할 후 사장영역이 클 경우에는 다중 분할을 수행하여 사장 공간을 줄이고 노드간의 중복을 최소화한다. 비 단말 노드 분할 정책에서는 같은 궤적을 저장하는 노드들을 연결 노드(Connected Node)라고 정의하고, 엔트리의 궤적 연결성을 기준으로 분할한다.

  • PDF

이동체 색인을 위한 KDB-Tree 의 분할 정책 (Splitting Policies of KDB-Tree for indexing of Moving Objects)

  • 이창헌;임덕성;홍봉희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.19-21
    • /
    • 2002
  • 최근 이동통신 및 GPS 기술의 발달로 위치기반서비스 요구가 점점 증가하고 있고, 대용량의 위치데이터가 저장되는 위치기반서비스의 구현을 위한 이동체외 저장 및 검색에 관한 연구가 활발하다. 이동체의 위치 정보를 점으로 모델링하여 색인 할 경우 KDB-Tree의 성능이 우수하다. 그러나 KDB-Tree는 시공간에서의 이동체 위치데이터 색인을 고려할 경우 시간 도메인의 특성으로 인해 성능 저하의 문제를 발생시킨다. 본 논문에서는 이동체 위치데이터의 색인을 위한 KDB-Tree의 사용에서 시간 도메인의 특성을 반영한 분할 도메인 선정 방법과 분할 정책을 제시한다. 새로운 분할 정책은 색인의 공간활용도를 높이고 색인의 크기를 작게 하여 검색의 성능을 높인 최근 시간 분할 기법과 LD(Last Division) 분할 정책이다. 본 논문에서는 KDB-Tree의 변경된 분할 정책을 구현하고 성능평가론 수행한다. 이 성능 평가 실험을 통해서 변경된 분할 정책을 사용한 KDB-Tree에서 공간활용도가 높고 검색 성능이 우수함을 보인다.

  • PDF

RFID 미들웨어에서 이벤트 필터링을 위한 질의 색인 기법 (A Query Indexing Method for Filtering Event Data in RFID Middleware Systems)

  • 석수욱;박재관;홍봉희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.19-21
    • /
    • 2005
  • EPCglobal은 RFID와 관련된 다양한 분야의 표준화를 주도하고 있으며 응용 표준으로써 Tag 정보의 운용을 위한 미들웨어 표준인 ALE Specification을 제시하였다. ALE의 ECSpec은 애플리케이션이 미들웨어에 등록하는 이벤트 필터링을 위한 스펙으로써 일정 시간동안 반복적으로 수행되는 연속 질의와 유사한 특성을 가진다. ECSpec을 연속질의로 변환할 때 해당질의의 WHERE절이 가지는 Predicate는 매우 긴 길이를 가지는 Long Interval이 된다. 이러한 특성은 기존의 질의 색인들의 삽입과 검색 성능을 저하시키는 문제점을 가진다. 이 논문에서는 ECSpec을 연속 질의의 형태로 변환하고 해당 질의가 기지는 Predicate인 2D Interval의 특성을 반영한 새로운 질의 색인 구조로써 TLC-Index를 제안한다. 색인 구조는 그리드 방식의 큰 크기를 가지는 셀 분할 구조와 선분 모양의 가상 분할 구조를 병행하는 하이브리드 구조이다. 색인에서 Long Interval의 정의는 셀 분할 구조의 길이보다. 크거나 같은 길이를 가지는 interval이다. 제안하는 색인은 Long Interval을 큰 크기를 가지는 셀 분할 구조로 분할 삽입함으로써 저장 공간의 소모를 줄이고 삽입 성능을 향상시킨다. 또한 Short Interval들을 짧은 길이를 가지는 가상 분할 구조들로 분할 삽입함으로써 그리드 방식이 가질 수 있는 부분적 겹침을 제거하여 검색 성능을 향상시킨다.

  • PDF

다차원 데이터의 효과적인 유사도 검색을 위한 색인구조 (Index Structure for Efficient Similarity Search of Multi-Dimensional Data)

  • 복경수;허정필;유재수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.97-99
    • /
    • 2004
  • 본 논문에서는 다차원 데이터의 유사도 검색을 효과적으로 수행하기 위한 색인 구조를 제안한다. 제안하는 색인 구조는 차원의 저주 현상을 극복하기 위한 벡터 근사 기반의 색인 구조이다. 제안하는 색인 구조는 부모 노드를 기준으로 KDB-트리와 유사한 영역 분할 방식으로 분할하고 분할된 각 영역은 데이터의 분포 특성에 따라 동적 비트를 할당하여 벡터 근사화된 영역을 표현한다. 따라서, 하나의 노드 안에 않은 영역 정보를 저장하여 트리의 깊이를 줄일 수 있다. 또한 다차원의 특징 벡터 공간에 상대적인 비트를 할당하기 때문에 군집화되어 있는 데이터에 대해서 효과적이다 제안하는 색인 구조의 우수성을 보이기 위해 다양한 실험을 통하여 성능의 우수성을 입증한다.

  • PDF

이동 객체의 이동성을 고려한 공간 분할 색인 기법 (A Space Partitioning Based Indexing Scheme Considering, the Mobility of Moving Objects)

  • 복경수;유재수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권5호
    • /
    • pp.495-512
    • /
    • 2006
  • 최근 다양한 응용 분야에서 이동 객체의 현재 위치를 기반으로 미래 위치를 검색하기 위한 필요성이 증가되고 있다. 이와 함께, 대용량의 이동 객체를 빠르게 검색하기 위한 색인 구조의 필요성이 증가되고 있다. 기존에 제안된 색인 구조들은 이동 객체의 위치를 검색하는 과정에서 불필요한 노드의 확장을 유발시켜 검색 성능이 저하되는 문제점이 있다. 이러한 문제점을 해결하기 위해 본 논문에서는 객체의 이동성을 고려한 공간 분할 방식의 색인 구조를 제안한다. 제안하는 색인 구조는 노드의 오버플로우를 처리하기 위해 형제 노드와 병합 분할을 수행하고 형제 노드와 병합을 수행하여 오버플로우를 처리할 수 없을 경우에는 이동성을 고려하여 분할을 수행한다. 제안하는 색인 구조는 분할된 영역들 사이에 겹침 영역이 발생하지 않으며 속도, 이동 객체가 노드의 영역을 벗어나는 시간, 노드의 갱신 시간과 같은 파라미터를 고려하여 분할 위치를 판별한다. 중간 노드에서는 공간 분할 방식의 색인 구조에서 발생하는 연속 분할을 방지하기 위한 분할 위치를 판별한다. 제안하는 색인 구조의 우수성을 입증하기 위해 이동 객체에 대한 검색 성능을 비교 분석한다. 성능 평가 결과 제안하는 색인 구조는 현재 위치 검색에 대해서는 $17%{\sim}264%$ 그리고 미래 위치 검색에 대해서는 $107%{\sim}19l%$ 성능 향상을 나타낸다.

XML 데이타 색인을 위한 경로 분할 기법 (A Path Partitioning Technique for Indexing XML Data)

  • 김종익;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권3호
    • /
    • pp.320-330
    • /
    • 2004
  • XML에 대한 질의 언어는 데이타 그래프 내의 경로를 이용하여 질의를 표현한다. 특히, 경로에 패턴 (예를 들어, 정규식)을 사용함으로써, 데이타의 구조를 정확히 알지 못하더라도 질의가 가능하도록 한다. 이때, 패턴을 이용하는 질의는 데이타 그래프의 탐색범위를 크게 넓히게 된다. 기존의 XML색인 기법은 질의의 탐색범위를 줄이기 위해 데이타 그래프 내의 서로 동일한 경로들을 하나로 묶어 작은 크기의 색인 그래프를 생성하는 방법을 이용한다. 하지만 이러한 색인들은 많은 경우 색인의 크기가 데이터 그래프의 크기만큼 증가하게 되어 질의의 탐색범위를 줄이지 못하고, 따라서 효율적인 질의 처리를 보장하지 못한다. 본 논문에서는 데이타 내에 존재하는 모든 경로를 분할(partitioning)하고 질의 처리 시 질의에 맞는 분할 영역을 빠르게 찾아낼 수 있는 색인 그래프를 제안한다. 본 논문에서 제안하는 색인 그래프는 데이터 그래프의 크기와 상관없이 색인 그래프의 크기를 조절할 수 있다. 따라서 색인 그래프의 크기를 작게 구성함으로써 색인 그래프 탐색 비용을 크게 줄일 수 있다. 본 논문에서는, 실험을 통해 기존의 그래프 기반색인 기법들보다 본 논문의 색인 기법이 보다 효율적임을 보이고 색인의 크기 변화에 따른 성능 변화에 대해 알아본다.

다차원 색인구조 M-트리에서 노드 색인공간의 중첩을 최소화하기 위한 효율적인 분할 알고리즘 (An Efficient Split Algorithm to Minimize the Overlap between Node Index Spaces in Multi-dimensional Indexing Scheme M-tree)

  • 임상혁;김유성
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.124-126
    • /
    • 2003
  • 다차원 색인 기법 M-트리는 노드의 중심점과 객체간의 상대적 거리로 색인을 구성하고, 검색 공간에 포함되는 객체를 액세스하는 기법으로서 노드들은 페이지 단위로 구성되며 하위 엔트리들을 포함할 수 있는 반경, 즉 유사도 거리에 의해 노드의 영역이 표현되어진다. 그러나 이와 같은 노드의 영역 표현에 있어서 노드 색인공간의 중첩으로 인해 질의 시 검색 패스가 증가하고 이로 인해 거리계산과 디스크 입출력의 증가를 야기하는 문제를 갖는다. 본 논문에서는 M-트리에서 문제가 되고 있는 노드 색인 공간의 중첩을 최소화할 수 있는 노드 분할 정책을 제안한다. 기존의 M-트리와는 다르게 노드의 가상 중심점을 계산하여 그것을 라우팅 객체로 만들어 노드를 커버하는 영역을 최소화하고 노드 안의 엔트리를 재분배하여 밀도 높은 노드를 구성 하도록 한다. 제안된 분할 알고리즘의 효율성을 증명하기 위한 실험 결과 색인공간의 중첩이 줄고 이로 인해 거리계산과 디스크 입출력의 횟수가 줄어듦을 보였다.

  • PDF

이동 객체 궤적의 색인을 위한 개선된 분할 알고리즘 (An Improved Split Algorithm for Indexing of Moving Object Trajectories)

  • 전현준;박주현;박희숙;조우현
    • 정보처리학회논문지D
    • /
    • 제16D권2호
    • /
    • pp.161-168
    • /
    • 2009
  • 최근 GPS, 이동 전화, 무선 네트워크 등의 발달로 인해 넓은 공간상에서 시간의 흐름에 따라 변화하는 이동 객체에 대한 위치 정보를 수집하여 실생활에 활용하는 다양한 위치 기반 서비스의 사용이 늘어나고 있다. 그와 함께 대용량의 이동 객체를 빠르게 검색하기 위한 효율적인 색인 방법의 필요성이 대두 됨에 따라 관련된 많은 연구가 현재 진행 중이다. 본 논문에서는 이동 객체의 궤적에 대한 색인 과정에서 필요한 개선된 궤적 분할 방법을 제안한다. 궤적의 적절한 분할 위치를 찾아 근사치 영역을 나타내는 최소 경계 사각형(MBR)을 만드는 과정에서 평균적인 질의의 크기를 고려하여 형성되는 확장된 최소 경계 사각형(EMBR)의 영역을 이용한다. 이에 따라 EMBR의 총면적이 최소에 가까운 분할을 만들어내어 색인 구성 후 질의 수행 과정 동안에 불필요한 탐색 공간을 감소시키는 이점을 보이게 된다. 본 논문에서 제안하는 궤적 분할방법의 우수성을 입증하기 위해 최적의 궤적 분할 방법과 기존의 궤적 분할 방법을 구현하여 각각의 EMBR 면적을 비교 분석한다. 비교 결과 제안하는 궤적 분할 방법이 기존의 방법보다 최적의 분할에 더 가까운 EMBR의 총면적을 나타내는 것을 알 수 있었다.

대용량 센서 데이터 아카이빙을 위한 색인 분할 기법 (An Index Splitting Technique for Numerous Sensor Data Archiving)

  • 조대수
    • 한국공간정보시스템학회 논문지
    • /
    • 제9권1호
    • /
    • pp.31-43
    • /
    • 2007
  • 센서 데이터는 대용량이며 지속적으로 발생하는 특징이 있다. 따라서 대용량의 센서 데이터로부터 특정 데이터를 효과적으로 검색하기 위해서는 색인의 개발이 요구된다. 센서 데이터 색인은 데이터 아카이빙을 지원하기 위해서 일정한 시간이 지난 과거의 데이터를 효과적으로 삭제할 수 있어야 한다. 본 논문에서는 대용량 센서 데이터 아카이빙을 지원하기 위해 색인 분할 기법을 제안하고 구현하였다. 분할된 각각의 색인들은 가상색인으로 구성되어, 외부에서는 하나의 색인으로 보인다. 실험 결과 색인의 생성비용은 총 100,000번의 삽입 연산에 대해서 최대 8%의 성능 향상을 보였으며, 삽입되는 데이터의 개수가 많아질수록 성능이 더 향상됨을 보였다. 영역질의의 경우 각 질의영역이 적을수록, 시간도메인의 크기가 커질수록 큰 성능 향상을 보였다.

  • PDF