• Title/Summary/Keyword: 조인 알고리즘

Search Result 939, Processing Time 0.029 seconds

Algorithms of Joins Using TB-Trees for Moving Object Trajectories (TB-Tree를 이용한 이동 객체 궤적에 대한 조인 알고리즘)

  • Lee, Jai-Ho;Nam, Kwnag-Woo;Park, Jong-Hyun
    • Annual Conference of KIPS
    • /
    • 2004.05a
    • /
    • pp.73-76
    • /
    • 2004
  • 이동 객체 데이터베이스 시스템에서 시공간 조인은 이동 객체들의 결합을 위한 중요한 연산이다. 시공간 조인 연산의 실행 시간은 이동 객체의 수가 증가함에 따라 기하급수적으로 증가한다. 그러므로 효과적인 시공간 조인 연산이 필수적이다. 본 논문에서는 처음으로 이동 객체의 궤적에 대한 정보를 잘 유지하고 있는 시공간 색인인 TB-Tree를 이용한 시공간 조인에 대한 알고리즘들을 제시하고 구현한 알고리즘에 대한 실험 결과를 제시한다. 먼저 기본적인 알고리즘과 CPU의 실행 성능 향상을 위한 알고리즘을 기술하고 이동 객체 생성기를 통해 생성된 데이터 집합에 대한 실험을 실시한 결과를 보여준다.

  • PDF

Efficient k-Nearest Neighbor Join Query Processing Algorithm using MapReduce (맵리듀스를 이용한 효율적인 k-NN 조인 질의처리 알고리즘)

  • Yun, Deulnyeok;Jang, Miyoung;Chang, Jaewoo
    • Annual Conference of KIPS
    • /
    • 2014.11a
    • /
    • pp.767-770
    • /
    • 2014
  • 대용량 데이터를 분석하기 위한 맵리듀스 기반 k-NN 조인 질의처리 알고리즘은 최근 데이터 마이닝 및 분석을 기반으로 하는 응용 분야에서 매우 중요하게 활용되고 있다. 그러나, 대표적인 연구인 보로노이 기반 k-NN 조인 질의처리 알고리즘은 보로노이 인덱스 구축 비용이 매우 크기 때문에 대용량 데이터에 적합하지 못하다. 아울러 보로노이 셀 정보를 저장하기 위해 사용하는 R-트리는 맵리듀스 환경의 분산 병렬 처리에 적합하지 않다. 따라서 본 논문에서는 새로운 그리드 인덱스 기반의 k-NN 조인 질의 처리 알고리즘을 제안한다. 첫째, 높은 인덱스 구축 비용 문제를 해결하기 위해, 데이터 분포를 고려한 동적 그리드 인덱스 생성 기법을 제안한다. 둘째, 맵리듀스 환경에서 효율적으로 k-NN 조인 질의를 수행하기 위해, 인접셀 정보를 시그니처로 활용하는 후보영역 탐색 및 필터링 알고리즘을 제안한다. 마지막으로 성능 평가를 통해 제안하는 기법이 질의 처리 시간 측면에서 기존 기법에 비해 최대 3배 높은 질의 처리 성능을 나타냄을 보인다.

A Comparative Study of PRAM-based Join Algorithms (PRAM 기반의 조인 알고리즘 성능 비교 연구)

  • Choi, Yongsung;On, Byung-Won;Choi, Gyu Sang;Lee, Ingyu
    • Journal of KIISE
    • /
    • v.42 no.3
    • /
    • pp.379-389
    • /
    • 2015
  • With the advent of non-volatile memories such as Phase Change Memory (PCM or PRAM) and Magneto Resistive RAM (MRAM), active studies have been carried out on how to replace Dynamic Random-Access Memory (DRAM) with PRAM. In this paper, we study both endurance and performance issues of existing join algorithms that are based on PRAM-based computer systems and have been widely used until now: Block Nested Loop Join, Sort-Merge Join, Grace Hash Join, and Hybrid Hash Join. Our experimental results show that the existing join algorithms need to be redesigned to improve both the endurance and performance of PRAMs. To the best of our knowledge, this is the first research to scientifically study the results of the four join algorithms running on PRAM-based systems. In this work, our main contribution is the modeling and implementation of a PRAM-based simulator for a comparative study of the existing join algorithms.

Binarization and Thinning Algorithm for Gray Image (회색조 영상의 이진화 및 세선화)

  • 유숙현;신병석;권희용
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.490-492
    • /
    • 2001
  • 세선화 알고리즘은 문자 인식에서 인식율을 높이기 위한 전처리과정으로 대상물체에 대하여 1픽셀 두께가 될 때까지 적용시키는 알고리즘으로 그 중요성과 필요성으로 인하여 수많은 논문들이 발표되었다. 본 논문에서는 인터넷 정보검색을 목적으로 하는 회색조(Gray) 영상에 대한 이진화 및 세선화 알고리즘을 제안한다. 제안된 알고리즘은 해당 픽셀과 이웃 화소 간의 픽셀값 차이를 이용하여 일정값을 증감시키는 방법으로, 이미지의 중심으로 픽셀이 응집하게 하는 과정을 통해 이진화 및 세선화를 시켰으며, 병렬 구현이 용이하다. 제안된 알고리즘의 성능평가는 회색조 영상에 대해 기존 알고리즘들을 적용한 결과와 비교, 분석하여 소개하였다.

  • PDF

Optimizing Eclat Algorithm by Using Virtual Join (가상 조인을 이용한 Eclat 알고리즘의 최적화)

  • Kim, Gye-Hyung;Kim, Min-Ho;Ramakrishna, R.S.
    • Annual Conference of KIPS
    • /
    • 2002.04b
    • /
    • pp.1195-1198
    • /
    • 2002
  • 본 논문에서는 데이터 마이닝의 중요한 기법 중 하나인 연관 규칙 발견을 위한 Eclat 알고리즘의 최적화를 위한 가상 조인을 제안하고자 한다. 연관 규칙 발견을 위한 알고리즘 중 특히 Eclat알고리즘은 효과적으로 다빈도 항목집합을 발견하는 알고리즘으로 알려져 있고, 가상 조인은 이러한 Eclat 알고리즘의 불필요한 교집합 연산을 미리 피함으로써 성능 향상을 얻을 수 있다. 이는 실험 결과를 통해서도 확인할 수 있다.

  • PDF

A Sampling-based Algorithm for Top-${\kappa}$ Similarity Joins (Top-${\kappa}$ 유사도 조인을 위한 샘플링 기반 알고리즘)

  • Park, Jong Soo
    • Journal of KIISE:Databases
    • /
    • v.41 no.4
    • /
    • pp.256-261
    • /
    • 2014
  • The problem of top-${\kappa}$ set similarity joins finds the top-${\kappa}$ pairs of records ranked by their similarities between two sets of input records. We propose an efficient algorithm to return top-${\kappa}$ similarity join pairs using a sampling technique. From a sample of the input records, we construct a histogram of set similarity joins, and then compute an estimated similarity threshold in the histogram for top-${\kappa}$ join pairs within the error bound of 95% confidence level based on statistical inference. Finally, the estimated threshold is applied to the traditional similarity join algorithm which uses the min-heap structure to get top-${\kappa}$ similarity joins. The experimental results show the good performance of the proposed algorithm on large real datasets.

Implementation and Performance Evaluation of Parallel Multi-way Spatial Join (병렬 다중 공간 조인 알고리즘의 구현 및 성능평가)

  • 류우석;김진덕;홍봉희
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10b
    • /
    • pp.123-125
    • /
    • 1998
  • 지리 정보 시스템이서 다중 공간 조인과 같은 많은 기하 계산을 필요로 하는 질의를 처리하기 위해서는 질의에 대한 병렬화 작업을 통해 실행 시간을 최소화 하는 것이 필수적이다. 다중 공간 조인은 정제에서 많은 시간을 소비하므로 여과와 정제를 분리하여 각각을 수행하는 것이 정제 시간을 단축하게 되고 따라서 좋은 성능을 나타낼 수 있다. 그러므로 다중 공간 조인을 병렬화 하기 위해서는 다중 공간 여과와 정제 각각에 대해 병렬 실행 계획을 세우는 것이 중요하다. 이 논문에서는 우선적으로 병렬 공간 여과를 수행하기 위한 두가지 알고리즘, 즉 blush tree을 사용한 다중 공간 여과와 pipelining을 사용한 다중 공간 여과의 병렬화를 비교한다. 그리고, 다중 공간 여과의 결과로서 생성되는 중간 결과 테이블에서 데이터의 중복에 따라 정제 성능의 저하가 발생되는데, 이를 효율적으로 제거하기 위한 두가지 그래프 생성 알고리즘을 제안하고 이를 비교한다. 그리고, 생성된 그래프에서 병렬 정제를 수행하기 위한 여러 가지 분할 알고리즘을 제안하고 이를 비교 평가한다. 이런 일련의 작업을 통해 우수한 성능의 병렬 다중 공간 조인 방법을 제안하고 성능 평가를 통해 최적의 병렬 수행 방법을 도출한다.

Dynamic Grid Space Partition Algorithms for Improve the Performance of Spatial Joins (공간 조인의 성능 향상을 위한 동적 그리드 공간 분할 알고리즘)

  • 박재형;정병수
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.174-176
    • /
    • 1999
  • 지리 정보 시스템에서 공간 객체들은 크기가 가변적이고 객체의 형태가 일정하지 않을 뿐만 아니라 공간 객체의 분포 또한 일정하지 않다. 공간 조인은 이러한 공간 객체들의 특성으로 인해 비용이 많이 들고, 공간 객체의 분포에 따라 특정 영역에서의 공간 조인 비용이 많이 들 수 있다. 이 논문에서는 공간 객체들의 분포에 따라 한 번의 Disk 접근으로 공간 객체들을 적재할 수 있는 크기로 셀을 동적 분할하는 알고리즘을 제안한다. 제안된 알고리즘을 수행한 후에 생성된 다양한 크기의 셀을 기반으로 공간 조인을 수행한다. 또한 정제 단계에서 공간 객체를 메모리로 적재하는 Disk I/O를 줄이기 위한 방법도 알아본다.

  • PDF

Grid-based Index Generation and k-nearest-neighbor Join Query-processing Algorithm using MapReduce (맵리듀스를 이용한 그리드 기반 인덱스 생성 및 k-NN 조인 질의 처리 알고리즘)

  • Jang, Miyoung;Chang, Jae Woo
    • Journal of KIISE
    • /
    • v.42 no.11
    • /
    • pp.1303-1313
    • /
    • 2015
  • MapReduce provides high levels of system scalability and fault tolerance for large-size data processing. A MapReduce-based k-nearest-neighbor(k-NN) join algorithm seeks to produce the k nearest-neighbors of each point of a dataset from another dataset. The algorithm has been considered important in bigdata analysis. However, the existing k-NN join query-processing algorithm suffers from a high index-construction cost that makes it unsuitable for the processing of bigdata. To solve the corresponding problems, we propose a new grid-based, k-NN join query-processing algorithm. Our algorithm retrieves only the neighboring data from a query cell and sends them to each MapReduce task, making it possible to improve the overhead data transmission and computation. Our performance analysis shows that our algorithm outperforms the existing scheme by up to seven-fold in terms of the query-processing time, while also achieving high extent of query-result accuracy.

An Algorithm for Selecting Materialized Views based on Join Cost in Data Warehouse Environments (데이터 웨어하우스 환경에서 조인 비용을 기반으로 한 실체 뷰 선택 알고리즘)

  • Yun, Won-Sik;Sin, Dong-Cheon
    • Journal of KIISE:Databases
    • /
    • v.28 no.1
    • /
    • pp.31-41
    • /
    • 2001
  • 데이터 웨어하우스 환경에서 데이터 분석을 위한 OLAP 질의에 대한 응답 시간을 줄이기 위해 실체 뷰 도입을 고려할 수 있다. 데이터 웨어하우스 환경에서 실체 뷰는 차원 테이블 과 사실 테이블의 조인으로 구성되어 있는 조인 뷰로 이루어지므로 지인 비용은 실체 뷰 선택에 영항을 미치는 가장 중요한 요소이다. 본 논문에서는 실체 뷰의 차원 속성 레벨을 이용하여 조인 테이블 추적하는 방법을 정형화하고 조인 비용을 기반으로 한 실체 뷰 선택 알고리즘을 제안한다.

  • PDF