• 제목/요약/키워드: Join Processing

검색결과 229건 처리시간 0.025초

고정 그리드를 이용한 병렬 공간 조인을 위한 비용 모델 (Cost Model for Parallel Spatial Joins using Fixed Grids)

  • 김진덕;홍봉희
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권4호
    • /
    • pp.665-676
    • /
    • 2001
  • 공간 데이타베이스에서 가장 비용이 큰 공간 연산자는 공간 조인이다. 공간 조인은 두개의 데이타 집합으로부터 공간적인 조건을 만족하는 두 객체 쌍의 집함을 구하는 것이다. 지난 수년동안 공간 조인의 순차 수행 시간은 많이 향상되었지만, 그 웅답시간은 사용자의 요구를 만족시키지 못하고 있다. 그래서 공간조 인의 병렬 수행에 대한 연구가 자연스럽게 대두되고 있다. 공간 데이타베이스 관리 시스템에서 공간 데이타 의 관리의 용이성 및 부분 지역 검색의 효율성 등을 위해 고정 크기의 격자 구조를 갖는 고정 그리드를 이용 할 수 있다. 그러나 지금가지 고정 그리드를 이용한 공간조인의 병렬 처리에 관한 연구는 거의 없다. 이 논문에서는 고정 그리드를 이용한 병렬 공간 조인 알고리즘의 성능을 예측하는 비용 모델을 제시하 였는데, 이는 최소 경계 사각형(Minimum Bounding Rectangle : MBR)의 비교 횟수. 디스크 접근 횟수,메시지 전송 횟수 등을 근거로 하였다. 실제 데이타 및 인위 데이타 집합을 이용한 실험은 제안한 비용 모델이 정확함을 보여주었다. 이 비용 모델은 복합 공간 질의의 비용을 예측할 필요가 있는 공간 질의 최 적화를 위한 유용한 도구가 될 것으로 기대된다.

  • PDF

색인된 XML 문서에서 레벨 정보를 이용한 효과적인 구조 조인 기법 (Efficient Structural Join Technique using the Level Information of Indexed XML Documents)

  • 이윤호;최일환;김종익;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권6호
    • /
    • pp.641-649
    • /
    • 2005
  • 오늘날 인터넷의 발달과 함께 XML이 많이 사용됨에 따라, XML 저장소와 질의 처리에 관한 연구가 활발하게 이뤄지고 있다. XML에서는 경로 질의를 사용하는데, 이러한 경로 질의를 효과적으로 처리하기 위하여 여러 가지 색인 기법들이 연구되었다. 최근에는 구조 조인 기법이 각광을 받고 있다. 구조 조인 기법은 엘리먼트들의 포함 관계를 살펴 질의를 처리한다. 특히 문서 전체에 대한 탐색을 하지 않고 해당하는 엘리먼트들의 역색인 리스트만을 비교하여 질의 처리를 수행하는 장점을 갖는다. 하지만 구조 조인 기법은 실제 질의 결과에 포함되지 않는 불필요한 엘리먼트들도 탐색해야 하는 비효율성을 가진다. 따라서 본 논문에서는 구조 조인 기법의 성능을 개선하는 레벨 구조 조인 기법을 제안한다. 제안하는 기법은 경로 질의 내 엘리먼트 사이의 관계 정보와 XML 문서 내의 엘리먼트들의 레벨 분포 정보를 이용한다. 이를 통해 구조 조인을 수행할 때, 비교되는 역색인 리스트 내의 모든 엘리먼트들이 아닌, 특정 레벨에 해당하는 엘리먼트들만을 이용하여 비교를 수행함으로써 질의 처리의 속도를 향상시킬 수 있다.

대용량 데이터 스트림을 처리하기 위한 효율적 이진 조인 처리 기법 (Efficient Binary Join Processing for Large Data Streams)

  • 박홍규;이원석
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2008년도 제38차 하계학술발표논문집 16권1호
    • /
    • pp.189-192
    • /
    • 2008
  • 최근에 제한된 데이터 셋보다 센서 데이터 처리, 웹 서버 로그나 전화 기록과 같은 다양한 트랜잭션 로그 분석등과 관련된 대용량 데이터 스트림을 실시간으로 처리하는 것에 많은 관심이 집중되고 있으며, 특히 데이터 스트림의 조인 처리에 대한 관심이 증가하고 있다. 본 논문에서는 조인 연산을 빠르게 처리하기 위한 효율적인 해시 구조와 조인 방법에 대해서 연구하고 다양한 환경에서 제안 방법을 검증한다.

  • PDF

감축 불가능한 유향그래프로부터 지배자 트리를 구성하기 위한 효과적인 알고리즘 (An Effective Algorithm for Constructing the Dominator Tree from Irreducible Directed Graphs)

  • 이대식;심손권;안희학
    • 한국정보처리학회논문지
    • /
    • 제7권8호
    • /
    • pp.2536-2542
    • /
    • 2000
  • 지배자 트리란 유향그래프에서 지배관계를 트리로 표현한 것이다. 임의의 유향그래프로부터 지배자 트리를 구성하기 위한 효과적인 알고리즘을 제시한다. 감축 가능한 흐름그래프는 지배자 계산을 한 후 지배자 트리로 감축된다. 감축 불가능한 흐름그래프는 정보 테이블의 연결가지 정보를 이용하여 지배자 연결그래프로 구성된다. 지배자 연결그래프에서 지배자 트리로 감축하기 위하여 효과적인 순차감축 알고리즘과 지연감축 알고리즘을 제안한다.

  • PDF

개선된 군집화 단계의 NofM 알고리즘을 이용한 훈련된 신경망으로부터의 규칙추출 (Rule extraction from trained neural network using NofM algorithm with improved clustering step)

  • 이한율;나종회;김문현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.581-584
    • /
    • 2001
  • 신경망이 만들어내는 출력에 대한 정보는 수치적으로 분산되어 신경망에 저장되므로, 인간이 직접 해석하기가 힘들다. 본 논문에서는 LRE(link rule extraction)기법인 NofM 알고리즘의 6단계 중에서 초기 단계인 가중치 군집화 단계를 개선하여 추출되는 규칙들의 전제부에 들어가는 규칙 조건들의 수를 조절함으로써, 추출된 규칙이 입력 특성에 대한 정보를 과잉 일반화하거나, 과잉 구체화하는 것을 피할 수 있음을 실험을 통해 보였다. 일반적으로 NofM 알고리즘에서 가중치들을 군집화한 때는 Join 알고리즘을 사용하는데, 본 논문에서는 Join 알고리즘의 Join condition을 0.05부터 0.25까지 0.05씩 점진적으로 확대하여 클러스터링을 하여줌으로써 신경망의 출력에 중요한 역할을 하는 가중치들을 효과적으로 군집화함을 보였다.

  • PDF

효율적인 Nested Loops Join을 위한 조인순서 선정 및 인덱스 구성에 관한 연구 (The Study of the Method that to Choice Efficient Nested Loops Join Order and the Index Design)

  • ;여정모
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 춘계학술발표대회
    • /
    • pp.877-880
    • /
    • 2013
  • 정보시스템의 기반이 되는 관계형 데이터베이스에서는 데이터의 양에 따라 성능 차이가 발생한다. 데이터베이스에 관한 여러 가지 기능에 대한 이해가 부족하여 많은 성능 저하 문제를 유발하는데, 그중에 조인 성능문제가 큰 비중을 차지하고 있다. 아주 드문 경우가 아니라면 대부분의 데이터 처리는 하나 이상의 테이블이 필요하기 때문이다. 조인을 정확하게 사용하면 성능 개선에 큰 이점을 가져 올 수 있다. 본 연구는 관계형 데이터베이스 기반의 가장 기본적인 조인방식인 Nested Loops Join 방식을 효율적으로 수행하기 위한 조인순서 선정 및 인덱스 구성에 관한 연구를 하였다. 연구 결과를 평가하기 위해서 SQL Trace을 추출한 후 성능을 비교함으로써 선정된 조인순서가 효율적인 것을 입증하였다. 또한 기존의 응답시간을 기준으로 성능평가방법보다 액세스한 데이터 블록 수를 기준으로 한 성능 평가방법이 더 근본적으로 조인 성능을 개선할 수 있음을 증명하였다. 차후에는 더 복잡한 조인 형태 및 다른 조인방식의 성능개선 방법에 관한 연구를 진행할 것이다.

데이터 스트림에서 다중 조인 연속질의의 효과적인 처리를 위한 전처리 기법 (Preprocessing Method for Handling Multi-Way Join Continuous Queries over Data Streams)

  • 서기언;이주일;이원석
    • 인터넷정보학회논문지
    • /
    • 제13권3호
    • /
    • pp.93-105
    • /
    • 2012
  • 데이터 스트림이란 빠르게 연속적으로 무한히 발생하는 데이터 집합을 의미한다. 최근 다양한 산업의 발달로 인해 이러한 스트림 데이터의 효율적인 처리를 위한 요구 사항들이 늘어나고 있다. 특히 많은 연산 비용을 요구하는 조인 연산의 효율적인 처리는 데이터 스트림 관리 시스템의 성능 향상에 많은 영향을 미친다. 본 논문에서는 다중 조인 연속질의의 효율적인 처리를 위하여 최종 질의 결과에 포함되지 않는 불필요한 중간 조인 결과들을 사전에 제거함으로써 조인 연산의 비용을 감소시키는 방법을 제안한다. 이를 위해 스트림 데이터의 모니터링을 위한 매트릭스 기반의 구조체를 제안하고, 제안된 구조체를 이용한 매트릭스 연산을 통하여 최종 조인 결과의 투플 수를 예측함과 동시에 불필요한 중간 결과들을 만들어내는 투플들을 찾아낸다. 이를 통해 해당 투플을 이용한 조인 연산의 수행 여부를 결정하여 최종 조인 결과를 만들지 않는 투플을 조인 연산에서 배제함으로써 효율적으로 다중 조인 연속 질의를 처리한다.

중앙값을 필터로 이용한 유사도 조인 알고리즘 (A Similarity Join Algorithm Using a Median as a Filter)

  • 박종수
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권2호
    • /
    • pp.71-76
    • /
    • 2015
  • 유사도 조인 처리에서 일반적인 기법은 생성-검증 구조를 사용하여, 첫 번째 생성 단계는 레코드들의 집합에서 후보 쌍들의 집합을 생성하고 두 번째 단계는 실제 유사도를 계산하여 각 후보 쌍을 검증한다. 검증 단계에서 후보 쌍들의 개수를 줄이기 위하여 본 논문에서는 각 후보 쌍의 한 레코드의 중앙값을 다른 레코드와 공통되는 토큰들의 개수가 적절하게 가질 수 있는지를 검사하는 필터로 사용한다. 중앙값 필터를 가지는 유사도 조인 알고리즘을 제안하고 제안된 알고리즘이 실세계 데이터집합에서 여러 실험을 통해 중앙값 필터를 갖지 않는 최근의 알고리즘들에 비해 실행시간에서 더 좋은 성능을 가진다는 것을 보여준다.

레벨 정보를 이용한 효과적인 구조 조인 기법 (Effective Structural Joins using Level Information)

  • 김종익
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권6호
    • /
    • pp.582-587
    • /
    • 2008
  • 구조 조인은 XML 경로 질의를 처리하기 위한 대표적인 방법 중의 하나이다. 최근의 연구에서는 B+트리 등에 색인된 가로 방향의 엘리먼트 분포 정보를 이용하여 조인 결과에 포함되지 않는 엘리먼트들을 조인 연산에서 배제하는 방법에 초점을 맞추고 있다. 하지만, 이러한 방법은 조인 연산 자체가 매우 복잡해지며 분포 정보를 위한 색인의 부담으로 항상 좋은 성능을 보장하지는 못한다. 본 논문에서는 레벨 정보를 이용하여 조인 결과에 참여하지 못하는 엘리먼트들을 효과적으로 걸러내는 구조 조인 기법을 제안한다. 제안하는 기법의 레벨 정보는 엘리먼트의 세로방향의 분포정보라는 점에서 기존의 기법과 차별화되며 조인 연산을 위한 별도의 색인을 필요로 하지 않는다는 장점을 가진다. 본 논문에서는 실험을 통하여 제안된 기법의 효율성을 보인다.

경로 포함 관계를 이용한 효율적인 XML 질의 처리기법 (An Efficient XML Query Processing Method using Path Containment Relationships)

  • 민경섭;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권2호
    • /
    • pp.183-194
    • /
    • 2004
  • XML 이 명실상부한 데이타 교환 표준 언어로서 자리 잡아 감에 따라, 효율적인 XML 질의 처리 지원에 대한 많은 연구가 진행되어 왔다. XML 질의 처리에서 가장 중요한 고려 사항은 ‘어떻게 XML 경로식을 효율적으로 처리할 것인가’ 하는 것이다. 기존의 몇몇 연구들은 질의를 구성하는 각 라벨들에 대응되는 모든 데이타에 대해 일련의 조인 연산을 수행하는 방식으로 결과를 생성하였다. 다른 몇몇 연구들은 질의에 포함된 경로를 찾기 위해 RDBMS의 문자열 비교 연산자를 사용하고 찾은 경로들에 대응되는 레코드를 추출하여 결과를 생성하였다. 본 연구에서 우리는 경로 포함 관계를 기반으로 한 새로운 질의 계획 생성 방식과 이를 지원하기 위한 두 개의 새로운 조인 연산자들을 제안하였다. 제안한 조인 연산자들은 질의에 속한 경로들과 관련된 데이타만을 입력 데이타로 사용하며, 매우 적은 비교 연산만을 수행한다. 그리고 파이프라인 기법을 적용하여 결과를 생성한다. 우리는 제안한 기법이 다른 이전 기법들에 비해 높은 성능을 보임을 분석과 실험을 통해 증명하였다.