• 제목/요약/키워드: Query optimization

검색결과 124건 처리시간 0.027초

시공간 데이터베이스를 위한 히스토그램 기반 선택도 추정 기법 (Histogram-based Selectivity Estimation Method in Spatio-Temporal Databases)

  • 이종연;신병철
    • 정보처리학회논문지D
    • /
    • 제12D권1호
    • /
    • pp.43-50
    • /
    • 2005
  • 시공간 데이터베이스의 영역에는 그게 이동객체를 다루는 시계열 데이터베이스 영역과 이력객체를 다루는 서열 데이터베이스 영역으로 나뉜다. 최근에는 시공간 데이터베이스의 질의 최적화를 위한 선택도 추정 연구가 활발히 진행되었으나, 기존 연구는 주로 시계열 데이터베이스의 선택도 추정에 의한 질의 최적화에 중점을 두었고 서열 데이터베이스에 대한 질의 최적화 연구는 전무하였다. 따라서 본 논문에서는 시공간 데이터베이스의 질의 최적화를 위한 T-Minskew 히스토그램을 구축하고 이를 이용한 선택도 추정 기법을 제안한다. 또한 임계치 기법을 이용한 효과적인 히스토그램 유지 기법을 제안한다.

DNN 모델을 이용한 기계 학습 기반 k-최근접 질의 처리 최적화 기법 (k-NN Query Optimization Scheme Based on Machine Learning Using a DNN Model)

  • 위지원;최도진;이현병;임종태;임헌진;복경수;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제20권10호
    • /
    • pp.715-725
    • /
    • 2020
  • 본 논문에서는 고차원의 특징 벡터에서 질의와 가장 가까운 k개의 데이터를 찾는 k-최근접 질의 최적화 방법을 제안한다. k-최근접 질의는 k개의 데이터를 포함할 가능성이 있는 범위를 기반으로 범위 질의로 변환되어 처리하는 기법이다. 본 논문에서는 처리 비용을 감소시키고 검색 속도를 가속화 할 수 있는 최적의 범위를 도출하기 위해 k-최근접 질의 처리 시 DNN 모델을 이용한 최적화 기법을 제안한다. 제안하는 기법은 온라인 모듈과 오프라인 모듈로 구성된다. 온라인 모듈에서는 클라이언트로부터 요청을 받아 실제 질의를 처리한다. 오프라인 모듈에서는 과거 최적화 기법의 결과를 학습 로그로 사용한 DNN 모델로 최적의 범위를 도출하고 온라인 모듈로 전달한다. 제안하는 기법의 우수성 및 타당성의 입증을 위하여 다양한 성능 평가를 수행한다.

RFID 태그 개수 추정 방법 및 질의 시간 최소화 방안 (RFID Tag Number Estimation and Query Time Optimization Methods)

  • 우경문;김종권
    • 한국정보과학회논문지:정보통신
    • /
    • 제33권6호
    • /
    • pp.420-427
    • /
    • 2006
  • 무선인식(RFID) 시스템은 기존의 바코드 시스템을 대체할 뿐만 아니라 제조, 물류, 서비스 산업 등을 변화시킬 차세대 핵심 기술 중의 하나이다. RFID 시스템은 무선으로 초당 수 백개까지의 태그 정보를 인식할 수 있다. 태그 인식은 리더(reader)가 각 라운드 별로 정한 프레임 동안 태그들이 자신의 ID를 임의 전송함으로써 이루어진다. 태그 인식 시간을 감소시키려면 태그 수를 감안한 적절한 크기의 프레임을 할당해야 한다. 본 논문에서는 RFID 시스템에서 질의 시간을 최소화 할 수 있는 방법을 제안하였다. 먼저 태그 개수를 단순하면서도 효율적으로 추정하는 방법을 제안하고, 이를 이용하여 각 라운드 별로 최적 프레임 길이를 구하여 전체 질의 시간을 최소화하는 방법을 개발하였다. 기존에 제안된 방법과 성능 비교를 수행하여 본 논문에서 제안하는 태그 수 추정 방법이 기존 방법보다 더 정확하고 효율적임을 관찰하였고 최적 프레임 길이 결정 문제에 또한 간단한 Greedy방법이 복잡한 최적 프레임 계산기법과 비슷한 성능을 가진다는 것을 확인하였다.

그리드 데이터베이스에서 질의 전달 최적화를 위한 캐쉬 관리 기법 (Cache Management Method for Query Forwarding Optimization in the Grid Database)

  • 신숭선;장용일;이순조;배해영
    • 한국멀티미디어학회논문지
    • /
    • 제10권1호
    • /
    • pp.13-25
    • /
    • 2007
  • 그리드 데이터베이스에서는 질의 전달 최적화를 위해 캐쉬를 사용한다. 캐쉬에 빈번히 사용되는 데이터의 메타 정보를 메타 데이터베이스에서 가져와 캐싱하며, 캐싱된 정보를 통하여 질의 전달의 비용을 감소시킨다. 기존의 캐쉬 관리 기법은 질의 전달 시 복제본의 사용빈도를 고려하지 않은 데이터의 임의의 메타 정보를 캐싱하기 때문에 사용이 불균형적인 문제가 있다. 그리고, 원본 데이터가 변경되었을 경우에 기존의 메타정보를 가진 캐쉬를 통하여 질의가 타 노드로 잘못 전달되며 이러한 과정은 여러 노드에서 반복 수행되어 네트워크 비용을 증가시킨다. 따라서 기존의 캐쉬 관리 기법은 복제본의 사용비율 불균형과 타 노드로의 잘못된 질의 전달로 인한 네트워크 비용 증가 문제의 해결이 필요하다. 본 논문에서는 질의 전달 최적화를 위한 캐쉬 관리 기법을 제안한다. 제안 기법은 캐쉬 매니저라는 관리 프로세서를 사용하여 캐쉬를 관리한다. 캐쉬 매니저는 자주 사용되는 복제본이 저장된 노드의 사용빈도를 비교하여 적게 사용된 노드의 복제본 메타 정보를 캐싱함으로써 질의 전달을 최적화한다. 또한 캐쉬 매니저를 통해 타 노드로 잘못 전달되는 질의를 줄여 질의 처리 시간을 단축하고 네트워크 비용을 줄인다. 제안 기법은 성능평가를 통해 네트워크 비용과 처리시간이 감소되어 기존의 방식에 비하여 향상된 성능을 보인다.

  • PDF

Development of Query Transformation Method by Cost Optimization

  • Altayeva, Aigerim Bakatkaliyevna;Yoon, Youngmi;Cho, Young Im
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제16권1호
    • /
    • pp.36-43
    • /
    • 2016
  • The transformation time among queries in the database management system (DBMS) is responsible for the execution time of users' queries, because a conventional DBMS does not consider the transformation cost when queries are transformed for execution. To reduce the transformation time (cost reduction) during execution, we propose an optimal query transformation method by exploring queries from a cost-based point of view. This cost-based point of view means considering the cost whenever queries are transformed for execution. Toward that end, we explore and compare set off heuristic, linear, and exhaustive cost-based transformations. Further, we describe practical methods of cost-based transformation integration and some query transformation problems. Our results show that, some cost-based transformations significantly improve query execution time. For instance, linear and heuristic transformed queries work 43% and 74% better than exhaustive queries.

A Clustered Dwarf Structure to Speed up Queries on Data Cubes

  • Bao, Yubin;Leng, Fangling;Wang, Daling;Yu, Ge
    • Journal of Computing Science and Engineering
    • /
    • 제1권2호
    • /
    • pp.195-210
    • /
    • 2007
  • Dwarf is a highly compressed structure, which compresses the cube by eliminating the semantic redundancies while computing a data cube. Although it has high compression ratio, Dwarf is slower in querying and more difficult in updating due to its structure characteristics. We all know that the original intention of data cube is to speed up the query performance, so we propose two novel clustering methods for query optimization: the recursion clustering method which clusters the nodes in a recursive manner to speed up point queries and the hierarchical clustering method which clusters the nodes of the same dimension to speed up range queries. To facilitate the implementation, we design a partition strategy and a logical clustering mechanism. Experimental results show our methods can effectively improve the query performance on data cubes, and the recursion clustering method is suitable for both point queries and range queries.

지오센서 네트워크의 다중 공간질의 최적화를 위한 공간질의처리비용 예측 알고리즘 연구 (A Study on Cost Estimation of Spatial Query Processing for Multiple Spatial Query Optimization in GeoSensor Networks)

  • 김민수;장인성;이기준
    • Spatial Information Research
    • /
    • 제21권2호
    • /
    • pp.23-33
    • /
    • 2013
  • 최근 IoT (Internet of Things) 기술의 발전과 더불어 무선 환경에서 특정 영역에 위치하는 센서노드의 위치-센서정보를 에너지 효율적으로 수집하는 센서 네트워크 기반 공간질의처리에 대한 관심이 크게 증가하고 있다. 그리하여 센서노드에서 공간 필터링을 직접 수행하여 센서노드들 간의 통신 횟수를 감소시켜 에너지 소모를 최소화하는 다양한 공간질의처리 알고리즘 및 분산 공간색인방법들이 제안되어 왔다. 그러나 단일 공간질의처리 최적화에 중점을 두었던 기존 공간색인방법 및 알고리즘들은 IoT 환경에서 다수 사용자에 의하여 요청되는 다중 공간질의를 최적화하여 수행하기에는 한계가 있었다. 이에 본 논문에서는 센서 네트워크에서 다중 공간질의를 에너지 효율적으로 처리할 수 있는 최적화 알고리즘을 제안하고 있다. 제안된 다중 공간질의 최적화 알고리즘은 인접 영역에 주어지는 공간질의들을 통합하여 수행하는 '질의통합' 개념을 기본으로 하고 있다. 최적화 과정에서 질의들의 통합 또는 개별 수행에 대한 판단은 각 수행비용을 예측하여 결정하며, 본 논문에서는 질의처리 비용 예측 방법을 추가적으로 제안하고 있다. 끝으로, 성능평가에서는 GR-tree, SPIX, CPS의 공간색인방법에 대한 비교 실험을 통하여 제안된 알고리즘의 성능 분석결과를 제시하고 있다.

Optimization Driven MapReduce Framework for Indexing and Retrieval of Big Data

  • Abdalla, Hemn Barzan;Ahmed, Awder Mohammed;Al Sibahee, Mustafa A.
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권5호
    • /
    • pp.1886-1908
    • /
    • 2020
  • With the technical advances, the amount of big data is increasing day-by-day such that the traditional software tools face a burden in handling them. Additionally, the presence of the imbalance data in big data is a massive concern to the research industry. In order to assure the effective management of big data and to deal with the imbalanced data, this paper proposes a new indexing algorithm for retrieving big data in the MapReduce framework. In mappers, the data clustering is done based on the Sparse Fuzzy-c-means (Sparse FCM) algorithm. The reducer combines the clusters generated by the mapper and again performs data clustering with the Sparse FCM algorithm. The two-level query matching is performed for determining the requested data. The first level query matching is performed for determining the cluster, and the second level query matching is done for accessing the requested data. The ranking of data is performed using the proposed Monarch chaotic whale optimization algorithm (M-CWOA), which is designed by combining Monarch butterfly optimization (MBO) [22] and chaotic whale optimization algorithm (CWOA) [21]. Here, the Parametric Enabled-Similarity Measure (PESM) is adapted for matching the similarities between two datasets. The proposed M-CWOA outperformed other methods with maximal precision of 0.9237, recall of 0.9371, F1-score of 0.9223, respectively.

효율적인 센서 네트워크 관리를 위한 다중 연속질의 분할 (The Multiple Continuous Query Fragmentation for the Efficient Sensor Network Management)

  • 박정업;조명현;김학수;이동호;손진현
    • 정보처리학회논문지D
    • /
    • 제13D권7호
    • /
    • pp.867-878
    • /
    • 2006
  • 최근 센서네트워크에 관련된 많은 연구가 진행되고 있다. 특히, 센서의 전력 보전을 위한 많은 기술들이 개발되고 있는데, 본 논문에서는 센서 네트워크의 불필요한 전력 소비를 줄이는 다중 연속질의 최적화에 관련된 방법을 제시한다. 우리는 센서 네트워크에서 전송되는 데이터의 횟수나 전송량의 원천적 문제가 되는 다중 연속 질의의 중복성 문제를 해결하는 분할 알고리즘을 제안한다. 분할 알고리즘은 새롭게 생성된 사용자 질의와 기존의 질의 들 사이에 중첩 질의 영역을 제거하기 위해, 질의 인덱스 (QR-tree)를 통해 하나의 질의를 둘 이상의 질의로 분할하는 알고리즘이다. QR-트리는 효율적인 질의 분할을 위해, R*-트리를 본 논문의 구존에 맞게 개량한 것이다. 이러한 처리 결과, 우리는 센서 네트워크의 전체 에너지에서 약 20% 가량의 에너지를 보존할 수 있었다.

제약을 가진 최소근접을 찾는 이동질의의 효율적인 수행 (A Efficient Query Processing of Constrained Nearest Neighbor Search for Moving Query Point)

  • 반재훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (하)
    • /
    • pp.1429-1432
    • /
    • 2003
  • This paper addresses the problem of finding a constrained nearest neighbor for moving query point(we call it CNNMP) The Nearest neighbor problem is classified by existence of a constrained region, the number of query result and movement of query point and target. The problem assumes that the query point is not static, as 1-nearest neighbor problem, but varies its position over time to the constrained region. The parameters as NC, NCMBR, CQR and QL for the algorithm are also presented. We suggest the query optimization algorithm in consideration of topological relationship among them

  • PDF