• 제목/요약/키워드: 분할 색인

검색결과 1,057건 처리시간 0.031초

가상 디렉토리 확장 해시 색인: 확장 해싱에서의 새로운 디렉토리 구조를 이용한 저비용 해시 색인 (Virtual Directory Extendible Hash index: An Economic Hash Index Using New Directory Structure)

  • 박상근;박순영;김명근;배해영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (하)
    • /
    • pp.1493-1496
    • /
    • 2003
  • 데이터베이스 관계 연산자 중 프로젝션(projection)과 집단 연산(aggregate function)시 사용되는 GROUP BY절, 그리고 동등 조인(equi join)에 대한 질의 처리는 중복된 튜플 중복된 GROUP BY 필드, 조인 중 발생하는 임시결과에 대한 제거나 집단 연산, 임시 결과의 저장을 위해 정렬이나 해싱 기반 알고리즘을 적용하고 있다. 이 중 해싱 기반 알고리즘은 데이터에 대한 직접적인 접근 방법과 정렬비용이 없다는 장점으로 인해 자주 사용하게 된다. 그러나 이러한 해싱(extendible hashing)[1] 기반 알고리즘은 키 값이 저장되는 버켓(bucket) 페이지의 넘침(overflow)으로 인해 분할(split)이 발생하는 경우, 분할을 야기시킨 버켓 페이지에 대한 정보를 제외한 동일한 내용의 기존 디렉토리 구조를 배로 확장해야 하는 공간 확장과, 확장된 디렉토리 구조의 유지를 위해 많은 비용을 소모하게 된다. 본 논문에서는 다량의 데이터에 대한 접근 기법과 디렉토리 구조의 저장공간, 유지 비용 절감 및 중복 해시 값을 지니는 데이터를 처리하기위한 해시 색인인 가상 디렉토리 확장 해시 색인을 제안한다. 가상 디렉토리 확장 해시 색인은 디렉토리 구조를 다단계 구조로 유지함으로써, 넓은 저장 공간을 필요로 하는 다량의 데이터에 대한 접근경로 문제를 해결하였고, 가상 디렉토리 레벨이라는 새로운 구조를 통해, 기존 디렉토리 구조의 공간 낭비 및 유지 비용을 최소화 시켰으며, 버켓 페이지를 리스트(list) 구조로 유지함으로써 중복 해시 값에 의한 디렉토리 구조의 연쇄적 분할 문제를 해결하였다.

  • PDF

공간 데이터베이스에서 효율적인 여과를 위한 격자 분할 색인 기법 (Grid Decomposition Indexing Method for Efficient Filtering in Spatial Database)

  • 박정민;김성희;이순조;배해영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.31-33
    • /
    • 2001
  • 고비용의 공간 연산을 수행해야 하는 공간 질의 처리는 여과-정제의 2단계 처리가 일반적이다. 그러나, 2단계 색인 방법은 여과율이 좋지 못한 단점이 있으므로, 최근 다단계 여과 과정이 많이 연구되고 있다. 다단계 여과 과정은 1차 여과된 객체에 대하여 더욱 정밀한 필터를 적용함으로써 후부 객체 수를 줄이는 방법으로 접근하고 있으나, 여러 번의 여과 단계를 거치므로 수행 시간이 길어지고 추가 정보유지로 인한 저장 공간 낭비 등의 단점이 있다. 본 논문에서는 전체 공간 영역을 격자로 분할하고, 객체를 격자 위에 구성하는 2단계의 공간 색인 방법을 제안한다. 제안된 색인 방법은 Dead Space의 크기를 줄이고, 한 번의 여과 과정으로 높은 여과율을 갖는다.

  • PDF

의료 영상의 3차원 공간색인을 위한 비정상 영역의 정보 추출 (Information Extraction for 3D Spatial Indexing in Abnormal Region of Medical Images)

  • 조경은;송미영;조형제
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 춘계학술발표논문집(상)
    • /
    • pp.206-209
    • /
    • 2002
  • 의료 영상 처리 시스템에서는 영상들의 검색이 중요한 문제로 대두되고 있다. 그에 대한 해결 방법으로는 의료 영상 처리 시스템에 지능적인 내용 기반의 영상 검색 방법을 도입하는 것이다. 본 연구에서는 의료 영상에 적합한 분할 방법을 사용하여 뇌의 MR 영상에 대하여 내용기반 검색을 하기 위한 영상 특징 색인화 방법을 제안한다. 제안하는 색인화 방법은 뇌 MR 영상에서 뇌영역을 분할하고 특징들을 추출한 후 이 정보를 가지고 대상 영상의 그룹핑 정보를 유추하고, 각 대상 영상에서의 비정상 후보 영역 위치를 찾아내어 3차원 공간 색인을 하는 방법이다.

  • PDF

이동 객체 궤적의 최소경계사각형 영역을 효율적으로 분할하는 알고리즘에 관한 연구 (A Study on Efficient Split Algorithm for Minimum Bounding Box of Moving Object Trajectoty)

  • 박주현;조우현
    • 한국정보통신학회논문지
    • /
    • 제17권1호
    • /
    • pp.110-116
    • /
    • 2013
  • 최근, 무선 네트워크의 발달로 인해 이동 객체에 대한 위치 정보를 수집하여 실생활에 활용하는 다양한 위치 기반 서비스의 증가하고 있다. 그에 따라서, 이동 객체의 연속적인 위치를 효율적으로 검색하는 새로운 색인 구조가 필요하게 되었다. 본 논문에서는 이동 객체의 좌표 사이의 거리가 긴 경우 탐색 공간을 줄이기 위해 효율적으로 분할하는 방법을 제안한다. 궤적의 적절한 분할 위치를 찾아서 평균적인 질의의 크기를 고려하여 형성되는 확장된 최소 경계 사각형(EMBR)의 영역을 이용한다. 추정 분할 방법은 최소경계 사각형을 최소화하게끔 고안되었고 이를 실험하였다. 실험 결과 제안하는 추정 분할 방법이 기존의 방법에 비해서 EMBR의 면적을 더 효율적으로 줄여줌을 알 수 있었다.

RFID 태그 데이타의 연속질의 처리를 위한 질의 색인 (A Query Index for Processing Continuous Queries over RFID Tag Data)

  • 석수욱;박재관;홍봉희
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권2호
    • /
    • pp.166-178
    • /
    • 2007
  • RFID 기술 표준화를 추진하고 있는 EPCglobal의 ALE(Application Level Event)는 응용 애플리케이션과 RFID 미들웨어 사이의 인터페이스로서 ECSpec(Event Cycle Specification)과 ECReports(Event Cycle Reports)를 정의하고 있다. ECSpec은 애플리케이션이 원하는 태그 데이타에 대한 명세이며, ECReports는 ECSpec이 제시한 조건에 적합한 결과를 보고하기 위한 것이다. ECSpec은 애플리케이션이 미들웨어에 등록하는 이벤트 여과를 위한 명세로서 일정 시간 동안 반복적으로 수행되는 연속질의(continuous query)와 유사한 특성을 가진다. ECSpec을 연속질의로 변환할 때 해당 질의가 가지는 술어(Predicate)는 매우 긴 길이를 가지는 간격이 된다. 기존 질의색인들은 긴 간격 데이타에 의해 삽입과 검색 성능이 저하되는 문제점이 있다. 이 논문에서는 ECSpec을 연속질의의 형태로 변환하고 해당 질의가 가지는 술어인 2차원 간격의 특성을 반영한 새로운 질의 색인 구조로써 TLC-Index를 제안한다. 색인 구조는 그리드 방식의 큰 크기를 가지는 셀 분할 구조와 선분 모양의 가상 분할 구조를 병행하는 하이브리드 구조이다. TLC-index는 긴 간격을 큰 크기를 가지는 셀 분할 구조로 분할 삽입함으로써 저장 공간의 소모를 줄이고 삽입 성능을 향상 시킨다. 또한 짧은 간격들을 짧은 길이를 가지는 가상 분할 구조들로 분할 삽입함으로써 그리드 방식이 가질 수 있는 부분적 겹침을 제거하여 검색 성능을 향상시킨다.

구 분할을 이용한 명사구기반 색인의 성능향상 (Improvement of phrase-based indexing performance using phrase segmentation)

  • 이충희;김현진;장명길
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (상)
    • /
    • pp.585-588
    • /
    • 2002
  • 정보검색의 정확률을 높이는 것이 최근 정보검색 연구의 추세이며, 정확률을 높일 수 있는 방법 중 하나로 명사구단위 색인이 있다. 명사구 색인을 하는 방법에는 구문분석기를 이용하는 방법과 패턴 규칙을 이용하는 방법으로 나눌 수 있다. 구문분석기를 이용하여 전체 문장을 분석한 후 명사구단위 색인을 할 경우, 범용적으로 이용할 수 있지만 속도와 정확도가 떨어진다는 문제점이 있으며 패턴 규칙을 이용하는 경우는 속도는 빠르지만 정확도 및 확장성에 문제를 가지고 있다. 이런 문제들을 해결하기 위해 본 논문에서는 문장으로부터 명사구를 분할한 후, 분할된 명사구를 완전 구문 분석하여 색인하는 방법을 제안한다. 명사구는 속격어구와 관형형 명사구를 대상으로 하였고, 구 분할은 속격조사와 관형형어미를 중심으로 주변 형태소와 품사를 고려하는 규칙을 만들어 실행하였다. 실험대상은 짧은 문장, 중간문장, 긴 문장을 각각 25 개를 선정하여 실험하였고, 구 분할을 이용할 경우 평균 재현율은 86%, 평균 정확률은 74% 정도의 성능을 보였다. 긴 문장의 경우, 구 분할을 이용하지 않는 경우에 비해서 정확도 및 속도에서 월등한 성능향상이 있었다.

  • PDF

도로 상에서 움직이는 객체를 위한 교차점 도로 모델 기반의 효율적인 색인방식 (An Efficient Indexing Method for Network Constrained Moving Objects Based on Intersection-oriented Network Model)

  • 윤호원;서동민;복경수;유재수;조기형
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.397-400
    • /
    • 2006
  • 본 논문에서는 위치기반 서비스에서 도로 네트워크 상을 움직이는 객체들의 현재 위치를 효율적으로 갱신하는 색인기법을 제안한다. 효율적인 시공간 질의 처리를 위하여 도로를 적절하게 분할하여 색인하게 된다. 기존의 도로 분할 방식은 연결정보를 포함하지 않기 때문에 객체가 현재의 도로 영역을 벗어났을 때 색인구조를 처음부터 검색해야 하는 단점이 있다. 제안하는 기법은 도로를 분할할 때 교차점을 포함하도록 분할하여 연결 정보가 유지되도록 한다. 이로 인해 제안하는 알고리즘은 객체가 색인된 현재의 도로 영역을 벗어났을 때 연결 정보와 NN(Nearest Neighbor) 검색 기법을 이용하여 벗어난 도로를 바로 찾아갈 수 있으므로 향상된 갱신 성능을 보인다.

  • PDF

RFID 미들웨어를 위한 질의 색인 기법에 관한 연구 (A Study of Query Indexing Scheme for RFID Middleware)

  • 박재관;홍봉희
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 한국공간정보시스템학회 2005년도 추계학술대회
    • /
    • pp.155-160
    • /
    • 2005
  • 최근 이동체 또는 센서 데이터에 대한 연속 질의를 처리하기 위해 다양한 질의 색인 기법들이 연구되고 있다. 그러나 RFID 미들웨어는 이전 연구에서 고려되지 않은 특징이 존재한다. 첫째, 질의 색인에 삽입되는 질의는 Industry, Product, Serial의 세 부분으로 구성되며, 각 값은 범위 값으로 표현될 수 있기 때문에 색인 공간에서 비연속적인 간격의 조각들이 반복해서 나타난다. 둘째, TagID가 가지는 Industry, Product, Serial의 값은 포함관계를 가진다. 즉, 하나의 Industry에 여러 Product가 존재하며, 하나의 Product에 여러 Serial Item이 존재한다. 따라서 이러한 특징을 고려하지 못하는 기존의 질의 색인을 적용하면 다수의 질의 조각을 삽입하게 되어 색인의 성능이 급격히 저하되는 문제점이 있다. 이 논문에서는 RFID 미들웨어의 실시간 필터링 및 컬렉션을 위해서 Tag 스트림에 대한 질의 색인 기법을 제안한다. 이 논문은 ECSpec 필터링 범위의 3단계 계층구조 특징을 고려한 코드 분할(Code Segmented) 도메인을 제시하고 이를 위한 그리드 기반 색인 구조를 제안한다. 또한 ECSpec의 필터링 패턴 특징에 의해 나타나는 질의 조각의 반복 현상을 정의하고 이를 위한 질의 처리 기법을 제시한다.

  • PDF

이동 객체의 미래 위치 검색을 위한 시공간 색인 구조 (Spatio-Timporal Index Structure for Retrieving Future Positions of Moving Objects)

  • 서동민;복경수;유재수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (하)
    • /
    • pp.1395-1398
    • /
    • 2003
  • 최근 위치기반 기술의 급속한 발전으로 인하여 이동 객체를 효율적으로 관리하기 위한 색인 구조의 필요성이 증가하고 있다. 본 논문에서는 KDB-트리를 기반으로 하는 새로운 형태의 시공간 색인 구조인 TPKDB-트리 (Time Parameterized KDB-Tree)를 제안한다. 제안하는 색인 구조는 갱신 비용을 최소화 하여 이동 객체 검색의 효율성을 증가시키고 노드 내에 포함되어 있는 이동 객체의 변화를 시간에 대한 파라미터로 유지함으로서 효율적으로 이동 객체의 미래 위치 검색을 지원한다. 또한, 공간활용도를 최대화하기 위해 EFP 분할 (Enhanced First Division Splitting) 기법을 제안한다. 제안하는 색인 구조의 우수성을 입증하기 위해 실험을 통해 다른 색인 구조차의 성능 비교를 수행한다.

  • PDF

RFID태그 객체의 간격 데이터 색인 (Indexing of Interval Data of RFID Tag Objects)

  • 이기형;반재훈;김동현;홍봉희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.82-84
    • /
    • 2004
  • 최근 유비쿼터스 환경에서 객체에 태그를 장착하여 위치를 추적하는 응용분야가 늘어가고 있는 추세이며, 이러한 응용에서 빈번히 사용되는 질의는 객체의 위치를 찾는 find와 특정 위치의 객체를 찾는 look질의가 있다. 두 질의에서 처리되는 데이터는 시간과 공간을 포함한 다차원 대용량 데이터이며 과거 및 현재 상태의 검색을 지원해야 하므로 효율적인 질의 처리를 위해서는 태그 객체를 위한 새로운 데이터 모델과 색인이 필요하다. 본 논문에서는 태그 객체를 간격 데이터로 정의하고 과거 및 현재 데이터에서 find와 look질의를 처리할 수 있는 색인 구조를 제안한다. 제안하는 색인에서 노드에 오버플로우가 발생할 경우 새로운 단말 노드 분할 정책을 사용하여 분할하며 성능 평가를 통해서 기존 정책보다 우수함을 증명한다.

  • PDF