• 제목/요약/키워드: indexing structures

검색결과 80건 처리시간 0.02초

GPGPU를 이용한 Hilbert R-tree 벌크로딩 고속화 기법 (Fast Hilbert R-tree Bulk-loading Scheme using GPGPU)

  • 양시동;최원익
    • 정보과학회 논문지
    • /
    • 제41권10호
    • /
    • pp.792-798
    • /
    • 2014
  • R-tree는 공간 데이터베이스 분야에서 가장 널리 쓰이는 색인 구조이며 다양한 변형된 기법들이 제안되었다. 이 기법들 중 Hilbert R-tree는 공간 채움 곡선인 Hilbert 곡선을 이용해서 대용량의 데이터를 고비용의 분할 과정 없이 R-tree를 구성하는 기법이다. 하지만 기존의 CPU기반의 Hilbert R-tree는 대용량의 데이터를 처리할 때는 순차적인 접근으로 발생되는 고비용의 전처리 비용과 느린 구축시간으로 실제 응용에 적용되기에는 한계가 있다. 본 논문에서는 이러한 문제를 해결하기 위해 GPU를 이용해서 데이터의 Hilbert 매핑을 병렬화 하고 이를 통해서 최종적으로 GPU의 메모리에 Hilbert R-tree의 벌크로딩을 고속화하는 기법을 제안한다. GPU기반의 Hilbert R-tree는 inversed-cell 기법과 트리구조 패킹의 병렬화 기법을 통해서 벌크로딩의 성능을 향상시켰다. 실험 결과에서는 기존의 CPU 기반의 벌크로딩에 비해 최대 45배의 성능향상을 보여주었다.

비휘발성 메모리의 마모도 평준화를 위한 레드블랙 트리 (A Swapping Red-black Tree for Wear-leveling of Non-volatile Memory)

  • 정민성;이은지
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권6호
    • /
    • pp.139-144
    • /
    • 2019
  • 비휘발성 메모리는 높은 용량과 DRAM에 준하는 수준의 접근 성능을 제공하여 차세대 메모리 기술로 각광을 받고 있다. 최근 미국 반도체 시장을 중심으로 비휘발성 메모리가 상용화 되면서 그 활용 방법에 대한 관심은 더욱 고조되고 있다. 그러나 비휘발성 메모리는 쓰기 연산 시 셀이 마모되는 물리적 특성을 가지고 있어 마모 평준화를 수행하지 않으면 특정 셀의 과도한 마모로 메모리의 용량이 감소되는 현상이 발생할 수 있다. 본 논문은 현재 균형 이진 탐색 트리로 널리 사용되고 있는 레드-블랙 트리(Red-black tree)가 비휘발성 메모리 위에서 동작할 때 잦은 리밸런싱 동작이 트리의 상위 레벨 노드들의 빈번한 쓰기를 발생시켜 특정 셀의 마모를 가속화 시킨다는 것을 관찰하고, 이를 해결하기 위한 새로운 형태의 레드-블랙 트리를 제안한다. 실제 시스템에서 추출한 레드-블랙 트리 접근 트레이스를 활용한 성능평가에서 제안된 레드-블랙 트리는 기존 자료구조 대비 셀 간의 쓰기 횟수 편차를 최대 12.5% 감소시킴을 보여주었다.

계층적 그룹관리와 신뢰성을 위한 동적인 변형 P2P 시스템 설계 및 구현 (A Design and Implementation of Dynamic Hybrid P2P System with Hierarchical Group Management and Maintenance of Reliability)

  • 이석희;조상;김성열
    • 정보처리학회논문지D
    • /
    • 제11D권4호
    • /
    • pp.975-982
    • /
    • 2004
  • 현재 많이 사용되고 있는 P2P 개념으로는 순수 P2P와 변형 P2P 구조가 있다. 순수 P2P의 모델에는 Gnutella와 Ktella등의 형태가 존재하고 변형 P2P로는 무수히 많은 형태가 존재한다. 순수 P2P 모델의 경우에는 정보 공유에서 연결성을 장점으로 Gnutella의 형태를 응용한 형태로 많이 사용되고 있지만 정보를 검색하거나 제공하기 위해 많은 트래픽을 소모하게 된다. 이와는 달리 변형 P2P 모델들 중 정보 공유 모델들이 존재하는데 이 모델들은 사용자에게 효율적이고 빠른 검색과 색인을 제공하기 위해 기존의 서버/클라이언트 형태를 취하고 있지만 확장성에 있어서 제공하는 서버의 능력에 의존할 수 밖에 없다. 파일공유 모델의 Peer들에 대해 연결성 유지를 위한 많은 부하와 사용자에 있어서 그룹에 대한 형태의 문제점 그리고 서버의 Fail로 인한 비 연결성에 대한 문제점을 해결하기 위해 본 논문에서는 라우팅 프로토콜 기법에서의 접근과 계층적 구조를 적용하고 Backup 시스템을 포함해서 대규모 네트워크에서 효율적인 그룹관리와 동적인 서버의 지정으로 신뢰성을 유지하기 위한 시스템을 설계 구현하여 그 우수성을 검증하였다.

문자열 부분검색을 위한 색인기법의 설계 및 성능평가 (Design and Performance Evaluation of an Indexing Method for Partial String Searches)

  • 강승헌;유재수
    • 한국정보처리학회논문지
    • /
    • 제6권6호
    • /
    • pp.1458-1467
    • /
    • 1999
  • 신장해슁이나 B+-트리와 같은 기존의 색인구조들은 문자열의 부분검색을 지원하지 못하거나 부분검색에 제약점을 가지고 있다. 최근 웹 환경에서 동작하는 정보검색 엔진들이 사용하는 역파일의 빠른 검색성능을 가지면서 문자열 부분검색을 효율적으로 지원하는 색인기법을 제안한다. 제안된 색인기법은 기본적으로 역파일 구조이며, 2음절 단위의 패턴으로 색인을 구성함으로써 문자열 부분검색을 지원한다. 제안된 색인기법의 특성을 분석하기 위해 제안된 방법의 성능을 다양한 환경에서 실험을 통하여 비교하고 분석한다. 또한 성능평가를 위해 기존의 역파일 기법, 요약 파일 기법들과 제안하는 색인기법의 분석적 모델을 검색시간과 저장공간 측면에서 세시하고, 그 모델을 기반으로 그들의 성능을 비교한다. 분석적 비교모델을 통한 성능비교 결과, 제안된 부분검색을 위한 색인기법은 저장공간의 오버헤드는 크지만 기존 요약 파일 기법에 비해 검색성능을 상당히 향상시킨다.

  • PDF

TPKDB 트리 : 이동 객체의 효과적인 미래 위치 검색을 위한 색인구조 (TPKDB-tree : An Index Structure for Efficient Retrieval of Future Positions of Moving Objects)

  • 서동민;복경수;유재수;이병엽
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권6호
    • /
    • pp.624-640
    • /
    • 2004
  • 최근 위치 기반 기술에 대한 활용이 증가하면서 이동 객체를 효율적으로 관리하기 위한 색인구조의 필요성이 증가하고 있다. 본 논문에서는 미래 위치 검색 및 갱신 비용을 최소화하기 위한 새로운 시공간 색인 구조를 제안한다. 제안하는 색인 구조는 갱신 비용을 최소화하기 위해 이동 객체의 현재 위치를 직접 접근하기 위한 보조 색인 구조와 공간 분할 기반의 KDB-트리를 결합한 색인 구조이다. 제안하는 색인 구조에서는 이동 객체의 미래 위치 검색 및 갱신 비용을 줄이기 위해 KDB-트리의 중간 노드에 시간에 대한 파라미터를 유지한다. 또한 제안하는 색인 구조에서는 공간활용도 및 검색 효율을 극대화하기 위한 새로운 갱신 및 분할 기법을 제안한다. 제안하는 색인 구조의 우수성을 입증하기 위해 다양한 실험을 통해 성능 평가를 수행한다.

무선 방송을 위한 효과적인 XML 스트리밍 (Effective Streaming of XML Data for Wireless Broadcasting)

  • 박준표;박창섭;정연돈
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권1호
    • /
    • pp.50-62
    • /
    • 2009
  • 방송 기법을 통한 데이타의 전달은 대역폭 활용의 이점과 에너지 효율성, 확장성으로 인해 무선 모바일 환경에서 효과적인 방법으로 알려져 있다. 본 논문에서는 무선 방송 환경에서 트리 기반의 색인 구조를 사용하기 때문에 이동 사용자의 접근 시간이 증가하는 "질의 처리의 지연 문제"를 다루고 있다. 본 논문에서는 "질의 처리의 지연 문제"를 해결하기 위한 분산 색인 구조와 함께 XML 데이타의 에너지 및 접근 시간 효율적인 방송을 위한 클러스터링 방법을 제안한다. 먼저 분산 색인 구조를 구현하기 위해 엘리먼트의 태그 이름과 애트리뷰트, 그리고 텍스트와 색인 정보를 포함하고 있는 DIX 노드 구조를 제안한다. 모바일 사용자는 DIX 노드에 포함되어 있는 색인 정보를 통해 무선 XML 스트링에서 보다 짧은 지연 시간만으로 원하는 정보에 접근할 수 있다. 또한, 질의 처리를 위한 탐색 범위를 한정시킴으로써 질의 처리에 소요되는 접근 시간과 튜닝 시간을 단축시킬 수 있는 클러스터링 정책을 제안한다. 성능 평가 실험을 통해 제안 방법이 기존의 XML 데이타 방송 기법들에 비해 우수함을 확인할 수 있다.

시공간 데이타웨어하우스를 위한 힐버트큐브 (Hilbert Cube for Spatio-Temporal Data Warehouses)

  • 최원익;이석호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권5호
    • /
    • pp.451-463
    • /
    • 2003
  • 최근 시공간 데이타에 대한 OLAP연산 효율을 증가시키기 위한 여러 가지 연구들이 행하여지고 있다. 이들 연구의 대부분은 다중트리구조에 기반하고 있다. 다중트리구조는 공간차원을 색인하기 위한 하나의 R-tree와 시간차원을 색인하기 위한 다수의 B-tree로 이루어져 있다. 하지만, 이러한 다중트리구조는 높은 유지비용과 불충분한 질의 처리 효율로 인해 현실적으로 시공간 OLAP연산에 적용하기에는 어려운 점이 있다. 본 논문에서는 이러한 문제를 근본적으로 개선하기 위한 접근 방법으로서 힐버트큐브(Hilbert Cube, H-Cube)를 제안하고 있다. H-Cube는 집계질의(aggregation query) 처리 효율을 높이기 위해 힐버트 곡선을 이용하여 셀들에게 완전순서(total-order)를 부여하고 있으며, 아울러 전통적인 누적합(prefix-sum) 기법을 함께 적용하고 있다. H-Cube는 대상공간을 일정한 크기의 셀로 나누고 그 셀들을 힐버트 값 순서로 저장한다. 이러한 셀들이 시간순서로 모여 규브형태를 이루게 된다. 또한 H-Cube는 시간의 흐름에 따라 변화되는 지역적인 데이타 편중에 대처하기 위해 적응적으로 셀을 정제한다. H-Cube는 정적인 공간 차원에서 움직이는 짐 객체에 초점을 두고 있는 적웅적이며, 완전순서화되어 있으며, 또한 누적합을 이용한 셀 기반의 색인구조이다. 본 논문에서는 H-Cube의 성능 평가를 위해서 다양한 실험을 하였으며, 그 결과로서 유지비용과 질의 처리 효율성면 모두에서 다중트리구조보다 높은 성능 향상이 있음을 보인다.

자기 조직화 맵 기반 유사 검색 시스템 (SOM-Based $R^{*}-Tree$ for Similarity Retrieval)

  • 오창윤;임동주;오군석;배상현
    • 정보처리학회논문지D
    • /
    • 제8D권5호
    • /
    • pp.507-512
    • /
    • 2001
  • 특징 기반 유사성은 멀티미디어 데이터베이스 시스템에서 중요한 연구 쟁점이 되고 있다. 멀티미디어 데이터의 특징이 멀티미디어 객체들을 구별하는데 유용하다지만 특징 벡터의 차원의 수가 증가함에 따라 종래의 다차원 데이터 구조의 성능은 떨어지는 경향이 있다. $R^{*}-Tree$는 R-Tree의 가장 성공적인 병형으로 본 논문에서 고차원 특징 벡터를 위한 새로운 인덱싱 방법으로서 자기 조직화 맵 기반 $R^{*}-Tree$를 제안한다. 자기 조직화 맵 기잔 $R^{*}-Tree$는 고차원 데이터를 좀더 스칼라화해서 탐색할 수 있도록 SOM과 $R^{*}-Tree$를 결합하여 구축한 인덱싱 기법이다. 자기 조직 맵은 고차원 특징 벡터들로부터 2차원 공간으로의 맵핑을 제공한다. 그러나 맵을 위상 특징 맵이라 하고 인접 노느에서 서로 유사한 특징 벡터들을 모아서 입력데이터의 특징 공간들 속에 유사성을 보존하는데 위상 특징 맵의 각 노드는 코드북 벡터를 가지고 있다. 실험적으로 4만개의 이미지로부터 추출된 색깔 특징 벡터들을 이용하여 자기 조직화 맵 기반 $R^{*}-Tree$의 검색시간 비용과 자기 조직화 맵과 $R^{*}-Tree$의 검색 시간 비용을 비교한다. 그 결과 $R^{*}-Tree$를 구축하는데 필요한 노드 수와 검색 시간 비용이 감소됨으로써 자기 조직화 맵 기반 $R^{*}-Tree$는 자기 조직화 맵과 $R^{*}-Tree$보다 훨씬 우수한 성능을 나타냄이 입증되었다.

  • PDF

타임스탬프를 갖는 이벤트 시퀀스의 인덱스 기반 검색 (Index-based Searching on Timestamped Event Sequences)

  • 박상현;원정임;윤지희;김상욱
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권5호
    • /
    • pp.468-478
    • /
    • 2004
  • 시퀀스 데이타베이스로부터 원하는 질의 패턴과 일치하는 모든 서브 시퀀스를 검색하는 것은 데이타 마이닝이나 바이오 인포매틱스 등 응용 분야에서 필수적인 연산이다. 예를 들어, 특정한 이벤트가 발생할 때마다 이벤트의 유형과 발생 시각을 기록하는 네트웍 이벤트 관리 시스템에서 네트웍 이벤트들의 연관 관계를 발견하기 위한 전형적인 질의 형태는 다음과 같다: 'CiscoDCDLinkUp이 발생한 후 MLMStatusUP과 TCPConnectionClose가 각각 20초 이내와 40초 이내에 순차적으로 발생하는 모든 경우를 검색하라.' 본 논문에서는 대규모 이벤트 시퀀스 데이타베이스를 대상으로 하여 위와 같은 질의를 효율적으로 처리할 수 있는 인덱싱 방법을 제안한다. 기존의 방법들이 비효율적인 순차적 검색이나 페이지화 하기 어려운 인덱스 구조에 의존하는데 반하여, 제안하는 방법은 저장 및 검색 효율이 입증된 다차원 공간 인덱스를 사용하여 질의를 만족하는 모든 서브 시퀀스를 착오 기각(false dismissal) 없이 신속하게 검색한다. 다차원 공간 인덱스의 입력은 이벤트 시퀀스 데이타베이스 상의 슬라이딩 윈도우 내에서 각 이벤트 유형이 최초로 발생한 시각을 기록한 n 차원 벡터가 된다. 여기서 n은 발생 가능한 이벤트 유형의 수이다. n이 큰 경우는 차원 저주(dimensionality curse) 문제가 발생할 수 있으므로 차원 선택이나 이벤트유형 그루핑을 이용하여 차원을 축소한다. 실험 결과에 의하면 제안된 방법은 순차적 검색이나 ISO-Depth 인덱스 기법에 비하여 몇 배에서 몇 십 배의 성능 향상 효과를 갖는 것으로 나타났다. 것으로 나타났다.예측치가 비교적 유사한 것으로 나타났으며, 평균 절도오차도 10% 수준이었다.HNP 처리구에서 가장 많았던 것으로 나타났다. 지상부 식생에 대한 총 양분함량은(N+P+K+Ca+Mg) 리기다소 나무가 703kg/ha 그리고 낙엽송이 869kg/ha였다.여 주었다.능성을 시도하였고, 그 결과는 다음과 같다. 1. Cholesterol을 제거한 cheese의 제조에서 최적조건은 균질압력 1200psi(70kg$cm^2$), 균질온도 $70^{\circ}$, $\beta$-cyclodextrin 첨가량 2%였으며, 이때 우유의 cholesterol의 제거율이 86.05%로 가장 높게 나타났다. 2. Cholesterol을 제거한 cheese들의 수율은 모두 12.53%(control 10.54%) 이상으로 균질 처리가 cheese의 수율을 18.88%이상 향상시키는 것으로 나타났다. 3. 유지방 함량 23.80%인 control 치즈의 cholesterol 함량은 81.47mg/100g이었고, 균질압력 1200psi(91kg/$cm^2$)에 $\beta$-cyclodextrin 2%를 첨가한 cheese에서는 cholesterol 함량이 20.15mg/100g으로 cholesterol 제거율이 75.27%로 가장 높게 나타났다. 4. Meltability는 균질압력 1200psi(91kg/$cm^2$)에 $\beta$-cyclodextrin 1과 2%로 처리한 치즈에서 2.25cm(control 3.34cm)로 가장 낮았으며,

수집형 기록관의 전거제어시스템 분석 - 민주화운동기념사업회 사료관리시스템의 사례를 중심으로 - (Analysis of Authority Control System in Collecting Repository -from the case of Archival Management System in Korea Democracy Foundation-)

  • 이현정
    • 기록학연구
    • /
    • 제13호
    • /
    • pp.91-134
    • /
    • 2006
  • 일반적으로 사적(私的)영역에서 수집되는 기록물, 즉 매뉴스크립트는 물리적 상태가 불량하고 기록물의 전후 맥락과 생산이력에 대한 정보가 파편적으로 수집되는 경우가 대부분이다. 때문에 수집형 기록관에서는 다양한 경로로 수집되는 기록물에 대한 생산기관(생산자)명을 효과적으로 통제하고 기록물 생산배경을 이해할 때 핵심요소인 출처정보를 축적할 필요가 있다. 수집형 기록관에서 이러한 전거제어와 출처정보 관리는 수집부터 체계화되어야 하며, 이는 수집시 관리과정까지 고려하여 필요한 정보를 구축하는 것을 의미한다. 이 논문은 민주화운동기념사업회 사료관이 개발한 사료관리시스템 가운데 전거제어 방식을 소개함으로써 수집형 기록관의 전거제어 및 출처정보 축적의 필요성을 확인하고 기록물 전거시스템을 구축할 때 고려할 사항들을 제안하기 위한 것이다. 이를 위해 본 연구에서는 사료관리에서 전거제어의 필요성을 알아보고, 사료전거제어 기준과 실무절차, 구축과정에 대해 살펴보았다. 사료관 사료전거시스템의 특징은 수집, 등록, 기술 등 각 업무 흐름에 따라 전거를 제어하고 출처정보를 관리하여 이를 사료의 지적 관리와 검색도구로 이용한다는 것에 있다. 끝으로 이러한 전거관리 사례를 통해 국제표준인 ISAAR(CPF)를 준용하여 기관마다 적합한 형태로 기술요소를 재구성하고 전거파일 유형을 설정하여 표준적으로 관리해야 할 것을 제안함으로써 향후 수집형 기록관에서 기록물 전거시스템을 구축하는데 있어 참고할 수 있도록 하였다.