• Title/Summary/Keyword: 부하색인

Search Result 30, Processing Time 0.022 seconds

Parallel Distributed Spatial Join Method using R+ -tree In Distributed Spatial Database Systems (분산 공간 데이터베이스 시스템에서 R+-tree를 이용한 병렬 분산 공간 죠인 기법)

  • 김종현;김재홍;배해영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.67-69
    • /
    • 2002
  • 여러 사이트에서 구축된 공간 데이터를 효율적으로 관리 및 공유하기 위해서는 대용량의 정보를 처리할 수 있는 분산 공간 데이터베이스 시스템의 사용이 필수적이다. 이러한 분산 공간 데이터베이스 시스템상에서의 분산 공간 죠인 질의는 공간 데이터의 대용량성과 그 복잡성으로 인하여 공간 연산의 지펴져 부하와 네트워크상의 전송 부하를 발생시킨다. 이러한 문제를 해결하기 위해 세미죠인 기반의 공간 죠인 기법들이 제안되었으나 공간 죠인 연산을 특정 서버에서만 수행하여 병목현상을 발생시키기 때문에 결국 질의 처리시간이 증가된다. 본 논문은 이러한 분산 공간 데이터베이스 시스템에서 수행 비용이 많이 드는 원격 사이트간의 공간 죠인 연산에 대해 R+-tree 공간 색인을 사용하여 병렬적으로 수행하는 기법을 제안한다. 본 기법은 R+-tree 공간 색인을 이용하여 공간 죠인 연산의 대상이 되는 릴레이션들을 중첩이 없는 두개의 릴레이션들로 분할한 후 질의 수행에 참여하는 두 서버에 죠인 연산을 분배하고 병렬적으로 처리하여 결과들을 병합한 다음 클라이언트에게 전송만다. 본 기법은 릴레이션을 분할하여 각 서버에서 공간 죠인 연산을 병렬적으로 처리하므로 처리 비용을 절반으로 감소시키며. R+-tree의 영역에 해당하는 객체들만 죠인 연산에 참여하게 함으로써 네트워크 전송 비용을 감소시킨다

  • PDF

Minimal Propagation TB-tree for Efficient Indexing of Moving Objects Trajectories (효율적인 이동 객체 궤적 색인을 위한 최소 전파 TB-tree)

  • Ko, Ju-Il;Kim, Myung-Keun;Chung, Warn-Il;Kim, Jae-Hong;Bae, Hae-Young
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 2003.11a
    • /
    • pp.141-146
    • /
    • 2003
  • 시간이 흐름에 따라 연속적으로 위치를 변경하는 객체를 이동 객체(Moving Objects)라고 한다. 이러한 이동 객체의 대용량 위치 정보를 효율적으로 검색하기 위하여 색인이 필요하며, 대표적인 색인으로 TB-tree가 제안되었다. 그러나 전통적인 R-tree 기반의 TB-tree는 엄격한 궤적 보존 정책에 의해 레코드가 삽입될 때마다 해당 레코드의 선행자(predecessor)를 포함하는 단말 노드를 검색해야 하며, 레코드 삽입으로 인한 단말 노드 MBB의 변경을 중간 노드들의 MBB에도 반영해야 하는 갱신 부하를 가지고 있다. 본 논문에서는 대용량 이동 객체 궤적 정보의 효율적인 색인을 위한 최소 전파 TB-tree를 제안한다. 본 기법은 앞으로 삽입될 이동 객체의 궤적을 포함하는 예상된 MBB(EMBB: Expected Minimum Bounding Box)를 트리에 먼저 반영한 후 레코드가 삽입될 때마다 중간 노드의 MBB를 갱신하지 않고, 객체가 EMBB을 벗어났을 때 중간 노드의 MBB를 조정하여 TB-tree의 MBB조정 횟수를 줄이고, 또한 TB-tree에 별도의 테이블 구조를 둠으로써 레코드 삽입을 위한 단말 노드 검색 비용을 줄여 전체적인 TB-tree의 갱신 비용을 감소시킨다.

  • PDF

Phrase-based Indexing for Korean Information Retrieval System (한국어 정보검색 시스템을 위한 구 단위 색인)

  • 윤성희
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.5 no.1
    • /
    • pp.44-48
    • /
    • 2004
  • This paper proposes a phrase-based indexing system based on the phrase. the larger syntax unit than a single keyword. Early information retrieval systems with indexing system matching single keyword is simple and popular. But with single keyword matching it is very hard to represent the exact meaning of documents and the set of documents from retrieval is very large, therefore it can't satisfy the user of the information retrieval systems. Web documents include lots of syntactic errors, the natural language parser with high quality cannot be expected in Web. Partial trees, even not a full tree, from fully bottom-up parsing is still useful for extracting phrases, and they are much more discriminative than single keyword for index. It helps the information retrieval system enhance the efficiency and reduce the processing overhead, too.

  • PDF

Online Reorganization of B+ tree in a Scalable and Highly Available Database Cluster (확장 가능한 고가용 데이터베이스 클러스터에서 B+ 트리 색인의 온-라인 재조직 기법)

  • Lee, Chung-Ho;Bae, Hea-Young
    • The KIPS Transactions:PartD
    • /
    • v.9D no.5
    • /
    • pp.801-812
    • /
    • 2002
  • On-line reorganization in a shared nothing database cluster is crucial to the performance of the database system in a dynamic environment like WWW where the number of users grows rapidly and changing access patterns may exhibit high skew. In the existing method of on-line reorganization have a drawback that needs excessive data migrations in case more than two nodes within a cluster have overload at the same time. In this paper, we propose an advanced B$^{+}$ tree based on-line reorganization method that solves data skew on multi-nodes. Our method facilitates fast and efficient data migration by including spare nodes that are added to cluster through on-line scaling. Also we apply CSB$^{+}$ tree (Cache Sensitive B$^{+}$ tree) to our method instead of B$^{+}$ tree for fast select and update queries. We conducted performance study and implemented the method on Ultra Fault-Tolerant Database Cluster developed for high scalability and availability. Empirical results demonstrate that our proposed method is indeed effective and fast than the existing method. method.

Approximate Top-k Subgraph Matching Scheme Considering Data Reuse in Large Graph Stream Environments (대용량 그래프 스트림 환경에서 데이터 재사용을 고려한 근사 Top-k 서브 그래프 매칭 기법)

  • Choi, Do-Jin;Bok, Kyoung-Soo;Yoo, Jae-Soo
    • The Journal of the Korea Contents Association
    • /
    • v.20 no.8
    • /
    • pp.42-53
    • /
    • 2020
  • With the development of social network services, graph structures have been utilized to represent relationships among objects in various applications. Recently, a demand of subgraph matching in real-time graph streams has been increased. Therefore, an efficient approximate Top-k subgraph matching scheme for low latency in real-time graph streams is required. In this paper, we propose an approximate Top-k subgraph matching scheme considering data reuse in graph stream environments. The proposed scheme utilizes the distributed stream processing platform, called Storm to handle a large amount of stream data. We also utilize an existing data reuse scheme to decrease stream processing costs. We propose a distance based summary indexing technique to generate Top-k subgraph matching results. The proposed summary indexing technique costs very low since it only stores distances among vertices that are selected in advance. Finally, we provide k subgraph matching results to users by performing an approximate Top-k matching on the summary indexing. In order to show the superiority of the proposed scheme, we conduct various performance evaluations in diverse real world datasets.

Continuous Subgraph Matching Scheme Considering Edge Types and Weights (간선 유형 및 가중치를 고려한 연속 서브 그래프 매칭 기법)

  • Choi, do-jin;Bok, kyoung-soo;Lee, byoung-yup;Yoo, jae-soo
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2019.05a
    • /
    • pp.451-452
    • /
    • 2019
  • 논문 검색 서비스 응용에서는 공저자, 출판 정보 등을 표현하기 위해서 다양한 정점 레이블 (논문,저자) 및 간선 정보(주저자, 공저자)를 이용하여 그래프로 표현한다. 이와 함께 다양한 간선 특징 정보를 질의로 입력하는 연속 서브 그래프 매칭에 대한 요구가 존재한다. 본 논문에서는 간선의 다양한 특성을 지원하고 색인의 부하를 감소시킨 연속 서브 그래프 매칭 기법을 제안한다. 제안하는 기법은 거리 값과 질의 연관 정보만을 관리하여 간선의 다양한 특성을 지원하는 효율적인 서브 그래프 매칭을 수행한다.

  • PDF

Concurrency Control and Recovery Method of B+-Tree using Bulk Loading and Extended Lazy Deletion (일괄구성과 확장된 지연삭제를 이용한 B+-Tree의 동시성 제어 및 회복)

  • 김대일;김성희;조숙경;배해영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.128-130
    • /
    • 2000
  • B+-Tree는 데이트베이스 관리 시스템에서 대용량의 데이터를 관리하기 위해 가장 널리 사용되는 인덱스이다. 그런 기존의 B+-Tree는 데이터베이스의 초기 구성 및 재구성시 많은 비용이 들고, 또한 삭제 연산의 빈번한 발생시 색인 구조 변경연산의 발생빈도가 높아져 동시성이 떨어진다는 단점이 있다. 이러한 문제점을 해결하기 위해서 기존 대부분의 데이터베이스 관리시스템에서는 일괄구성과 지연삭제를 이용하고 있으나, 동시성 및 회복에 대한 처리가 미흡하여 실제 시스템에 적용하기에는 문제가 있다. 따라서 본 논문에서는 일괄구성과 지연삭제 방법을 적용한 B+-Tree에서의 동시성 및 회복기법을 제안한다. 제안된 기법은 일괄구성 시에 잠금의 부하와 연속적인 철회(Cascade Rollback)가 없고, 또한 지연 삭제기법을 확장함으로써 빈 페이지 리스트 관리에 대한 부하가 없으며, 삭제 연산에 대한 회복 시 논리적 복귀(Logical Undo)가 빨라지고 구현이 간단해진다는 장점이 있다.

  • PDF

A Grid-based Node Split Algorithm for Managing Current Location Data (현재 위치 데이타 관리를 위한 그리드 기반 노드 분할 알고리즘)

  • Lee, Seung-Won;Hong, Dong-Suk;Kang, Hong-Koo;Han, Ki-Joon
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 2005.11a
    • /
    • pp.67-73
    • /
    • 2005
  • 최근 이동체의 위치 데이타를 활용하는 위치 기반 서비스에 대한 관심이 급증하고 있다. 이러한 위치 기반 서비스에서 이용되는 대용량 위치 데이타를 효율적으로 관리하기 위한 아키텍처로서 클러스터 기반 분산 컴퓨팅 구조를 갖는 GALIS(Gracefully Aging Location Information System) 아키텍처가 제안되었다. GALIS는 비균등 2-단계 그리드를 사용하여 노드들의 부하 분산 및 색인을 수행한다. 하지만 비균등 2-단계 그리드의 분할 알고리즘은 이동체가 특정 지역에 편중되는 경우 불필요한 노드를 생성하는 문제를 가지고 있다. 따라서 본 논문에서는 이동체의 다양한 분포에 대하여 더욱 효율적인 노드 분할 알고리즘을 제시한다. 본 논문에서 제시한 노드 분할 알고리즘은 이동체의 현재 위치에 따른 공간적 분포를 고려하기 때문에 이동체가 특정 지역에 편중되는 경우에도 불필요한 노드를 생성하지 않고 효율적인 부하 분산을 수행할 수 있으며, 분산 시스템에서 중요시되는 균형 있는 부하 분산을 수행할 수 있다. 또한, 가상 노드 분할 시뮬레이터를 구현하여 다양한 이동체 데이타 분포 형태에 대해 실험하였으며, 이러한 실험을 통하여 기존의 알고리즘보다 더욱 효율적으로 노드를 분할하는 것을 검증하였다.

  • PDF

GDCS : Energy Efficient Grid based Data Centric Storage for Sensor Networks (GDCS : 센서네트워크를 위한 에너지 효율적인 그리드 기반 데이터 중심 저장 시스템)

  • Shin, Jae-Ryong;Yoo, Jae-Soo;Song, Seok-Il
    • The Journal of the Korea Contents Association
    • /
    • v.9 no.1
    • /
    • pp.98-105
    • /
    • 2009
  • In this paper, new data centric storage that is dynamically adapted to the change of work load is proposed. The proposed data centric storage distributes the load of hot spot area by using multilevel grid technique. Also, the proposed method is able to use existing routing protocol such as GPSR (Greedy Perimeter Stateless Routing) with small changes. Through simulation the proposed method enhances the lifetime of sensor networks over one of the state-of-the-art data centric storages. We implement the proposed method based on a operating system for sensor networks, and evaluate the performance through running based on a simulation tool.

A Design System for Group Management and Maintenance of Reliability In Hybrid P2P (Hybrid P2P의 그룹관리와 신뢰성을 위한 시스템 설계)

  • Lee, Seok-Hee;Hyun, Jeung-Sik;Lee, Tae-Hee;Cho, Sang
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04a
    • /
    • pp.412-414
    • /
    • 2002
  • 현재 많이 사용되고 있는 P2P개념으로는 순수 P2P와 변경 P2P구조가 있다[3]. 순수 P2P의 모델에는 Gnutella와 stella등의 형태가 존재하고 변형 P2P로는 무수히 많은 형태가 존재한다. 이 변형 P2P모델들 중파일 공유 모델들이 존재하는데 이 모델들은 파일의 공유를 위한 그룹 관리와 검색, 색인 등의 기능을 제공한다. 파일공유 모델의 Peer들에 대해 연결성 유지를 위한 많은 부하와 사용자에 있어서 그룹에 대한 형태의 문제점 그리고 서버의 Fail에 대한 비연결성에 관한 문제점을 해결하기 위해 본 논문에서는 라우팅 기법에서의 접근을 통해 과일공유모델에 계층적 구조를 적용하고 Backup시스템을 설계하여 사용자에 의한 효율적인 그룹관리와 연결의 신뢰성을 유지하기 위해 시스템을 설계하였다.

  • PDF