• 제목/요약/키워드: 데이터 인덱스 정보

검색결과 383건 처리시간 0.03초

관계형 XML 가지 패턴 질의를 위한 비트맵 인덱스와 질의 처리 기법 (Bitmap Indexes and Query Processing Strategies for Relational XML Twig Queries)

  • 이경하;문봉기;이규철
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제37권3호
    • /
    • pp.146-164
    • /
    • 2010
  • XML 데이터 량의 증가에 따라 DBMS를 이용한 XML 데이터의 저장 관리 기법들이 고안되었다. 하지만, 현재의 가지 패턴 질의 처리 알고리즘들은 XML 데이터를 태그 또는 임의 단위로 분할되고, 각 항목들이 특정 순서로 정렬된 역 리스트들을 입력으로 한다. 이러한 저장 기법의 불일치는 관계형 테이블에 나뉘어 저장되는 XML 데이터의 질의 처리에 이 알고리즘들의 적용을 어렵게 한다. 이 논문에서는 관계형 테이블에 저장된 XML 데이터에 대한 홀리스틱 가지 조인을 지원하기 위한 비트맵 인덱스와 이를 이용한 질의 처리 기법을 제안한다. 비트맵 인덱스는 많은 데이터베이스 시스템에서 지원하므로, 제안하는 인덱스와 가지 질의 처리 기법은 관계형 질의 처리 프레임워크에서 보다 이식이 용이하다. 제안하는 인덱스 기법은 압축을 통해 인덱스 크기를 줄이면서도 질의 처리시 압축해제가 불필요해 시간과 공간 효율적이다. 또한, 이 논문에서는 비트맵 인덱스만을 이용해 XML 노드들 간의 관계성을 식별함으로써, 가지 패턴 질의 처리를 레코드에 저장된 XML 데이터의 접근 없이 수행할 수 있는 혼합 인덱스를 제시한다.

왜곡 제거 시계열 서브시퀀스 매칭에서 빠른 인덱스 구성법 (Fast Index Construction in Distortion-Free Time-Series Subsequence Matching)

  • 길명선;김범수;문양세;김진호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(A)
    • /
    • pp.73-76
    • /
    • 2011
  • 본 논문에서는 기존 단일 인덱스 기반의 왜곡 제거 시계열 서브시퀀스 매칭의 인덱스 구성 알고리즘을 분석하여 보다 효율적인 인덱스 구성 알고리즘을 제안하였다. 기존 왜곡 제거 시계열 서브시퀀스 매칭의 단일 인덱스 구성 알고리즘은 대용량 시계열 데이터인 경우 왜곡 제거를 고려해야 되는 많은 윈도우로 인해 실제 인덱스 생성에 매우 많은 시간이 걸린다. 본 논문에서는 기존 선형 제거 서브시퀀스 매칭의 인덱스 구성 알고리즘을 예로서 인덱스를 구성하는 각 과정을 체계적으로 분석하여, 각 과정에서 필요한 연산 횟수를 줄이는 방법을 제안한다. 이를 위해, 저차원 변환하는 과정에서 발생하는 중복되는 연산들을 한 번씩 미리 수행하여 배열에 저장한 후 재사용하는 DF-버컷(DF-bucket)씨의 개념을 제시한다. 실험 결과, 저장 후 재사용 원칙에 따라 인덱스 구성의 효율성을 증대시킨 접근법이 그렇지 않은 접근법에 비해서 인덱스 구성 시간을 평균 32% 에서 55% 까지 줄인 것으로 나타났다.

플래시 메모리 상에서의 효율적인 동작을 위한 수정 B-트리 인덱스 (Modified B-Tree Index for Efficiency on the Flash-Memory Storage System)

  • 노홍찬;김승우;김우철;박상현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (C)
    • /
    • pp.12-17
    • /
    • 2006
  • 플래시 메모리는 기술 발전에 따른 빠른 용량 증가와 모바일 환경에 우수한 특성으로 인해 가까운 시일내에 하드 디스크를 대체할 대용량 저장 장치로서 주목 받고 있다. 이러한 흐름에 따라 플래시 메모리 사용이 증가하고 플래시 메모리에 저장하는 데이터의 양이 점차 많아지면서 플래시 메모리 상의 효율적인 인덱스 구조에 대한 필요성도 함께 증가하고 있다. 하지만 기존의 대표적인 인덱스 중 하나인 B-트리 인덱스를 플래시 메모리에 적용하기 위해서는 하드 디스크와 플래시 메모리 간의 다른 특성들 때문에 플래시 메모리에 맞게 인덱스 구조를 수정하는 작업이 필요하다. 본 연구에서는 이를 해결하기 위한 기존의 연구에 대해 소개하고 기존 연구의 한계점과 이를 개선한 인덱스 구조를 제안한다.

  • PDF

데이터베이스 백업 성능 향상을 위한 병렬 인덱스 스캔 기법 (Improving Performance of Database Backup via Parallel Index Scan)

  • 이민욱;한재현;손용석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.54-56
    • /
    • 2021
  • 데이터베이스 백업은 데이터베이스 데이터를 보존 및 복구하기 위해 사용되는 필수 기법이다. 이를 위해 데이터베이스 관리 시스템(Database Management System)에서는 백업 기능을 수행하는 응용을 제공한다. 하지만 이러한 백업 응용은 기존 HDD 의 특성을 고려하여 설계 및 구현되어있기 때문에 최근 주로 사용되고 있는 저장장치인 SSD 에서는 SSD 의 성능을 최대한 이끌어내지 못하고 있다. 예를 들어, 기존 백업 응용에서는 단일 스레드가 백업을 위한 데이터를 순차적으로 접근하고 풀 스캔 방식으로 백업을 수행한다. 따라서 본 연구에서는 SSD 의 병렬적 특성을 활용하여 백업 응용의 성능을 극대화시키는 것을 목표로 한다. 이를 위해 본 논문은 병렬 인덱스 스캔 기법을 제시한다. 제안한 기법은 기존 백업 기법과 달리 멀티 스레드를 활용하여 인덱스 스캔을 수행하고 병렬적으로 데이터에 접근하여 백업을 수행한다. 해당 기법은 기존 기법에 비해 최대 2.5 배 성능을 향상시켰다.

데이터 스트림 시스템에서 과거 공간질의 처리를 위한 고속 로딩 기법 (High-Performance Loading Method for Historical Spatial Query Processing in Data Stream System)

  • 신재완;백성하;이동욱;신승선;김경배;배해영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.397-400
    • /
    • 2008
  • 무한히 발생되는 실시간 데이터와 디스크에 저장된 히스토리컬 데이터를 동시에 처리하는 하이브리드 질의에 관한 연구가 활발히 이루어지고 있다. 하이브리드 질의는 디스크에 저장된 대용량의 공간 데이터 처리를 위해 빠른 디스크 입/출력을 요구한다. 이러한 데이터를 처리하기 위해 인덱스, 데이터 축소 기법등이 연구되었다. 데이터의 빠른 검색을 위한 인덱스 기법은 디스크에 분산 저장된 데이터에 대한 탐색 비용과 입/출력 비용을 줄이지 못한다. 또한, 샘플링을 통해 디스크 입/출력 시간 비용을 줄이는 데이터 축소 기법은 데이터의 정확성을 떨어뜨려 정확성을 요구하는 하이브리드 질의에서는 이용하기가 어렵다. 이논문에서는 디스크 입/출력 시간과 디스크 탐색 시간 비용을 줄이고, 정확성을 보장하는 과거 공간질의 처리를 위한 고속로딩 기법을 제아난다. 제안기법은 공간을 그리드 형태로 나누고 인접한 공간 데이터를 함께 관리함으로써 디스크 입/출력 비용을 줄 일 수 있다. 또한, 공간적으로 인접한 데이터를 물리적으로 인접한 곳에 저장하여 디스크 탐색시간 비용을 줄일 수 있다. 이렇게 저장된 데이터는 손실 없이 모두 저장되며, 정확성 또는 보장할 수 있다.

중복제거 파일시스템에서 서머리 기반 인덱싱 기법 (A Method of Summary based Indexing in De-duplication File System)

  • 이중수;안창원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.312-313
    • /
    • 2012
  • 중복제거 파일 시스템은 가상머신 이미지와 같이 서로 중복되는 데이터가 많은 파일에서 용량을 줄이기 위하여 많이 사용된다. 중복제거를 위하여 많은 경우 서머리 벡터와 인덱스를 함께 사용하고 있는데, 이는 메모리를 많이 소모하고 인덱스 구조에 따라 여러 번의 하드 디스크 접근을 해야 하는 한계가 있었다. 본 논문에서는 서머리 벡터를 인덱스 내에서 활용하고 하드디스크를 접근하는 횟수를 감소할 수 있는 인덱싱 기법을 제안한다.

데이터 추론에 의한 민감한 정보를 보호하기 위한 효율적인 데이터 출판 방법 (Efficient Data Publishing Method for Protecting Sensitive Information by Data Inference)

  • 고혜경
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제5권9호
    • /
    • pp.217-222
    • /
    • 2016
  • 최근의 통합 시스템 및 P2P에 대한 데이터베이스의 연구는 다양한 공유된 그룹 및 프로세스 데이터를 위한 새로운 방법들이 개발되었다. 본 논문에서는 XML 제약에 의해 유출될 수 있는 민감한 정보에 대한 사용자의 유추를 원칙적으로 차단하고 권한 부여가 되지 않은 사용자로부터 민감한 정보가 유출되지 않도록 암호화 방법을 이용하여 안전한 데이터 출판 프레임워크를 제안한다. 제안된 프레임워크에서는 XML 문서 내의 민감한 데이터의 각각의 노드는 따로 분리하여 암호화하고 암호화된 모든 데이터들은 본래의 문서로부터 분리되어 민감한 데이터의 각각의 노드는 따로 암호화된다. 암호화된 모든 데이터들은 원래의 문서로부터 분리하여 암호화된 구조 인덱스로 묶어 보호된 데이터를 출판한다. 실험 결과로 제안된 프레임워크는 익명의 사용자로부터 데이터 추론을 통한 사용자 정보 누설을 방지함을 보여준다.

브로드캐스트 환경에서 데이터 접근 빈도를 고려한 효과적인 인덱스 배치 기법 (An Efficient Index Allocation Scheme Considering Data Access Frequencies in Mobile Broadcast Environments)

  • 박지현;박광진;강상원;김종완;임석진;황종선
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.22-24
    • /
    • 2005
  • 이동 컴퓨팅 환경에서 통신 네트워크가 갖는 무선 채널 대역폭의 협소함과 이동 단말기의 에너지 제약으로 인해, 다수의 이동 클라이언트들에게 데이터를 전달할 때에는 다수의 클라이언트들의 동시 데이터 접근을 지원하는 브로드캐스트 방법을 사용함으로써 제약점들을 보완할 수 있다. 본 논문에서는 클라이언트의 에너지와 데이터에 대한 접근시간(access time)의 효율을 높이기 위해 데이터의 접근빈도(access frequency)를 고려한 브로드캐스트 방법과 브로드캐스트 인덱스를 추가하는 방법을 함께 반영한 OAF(Data Access Frequencies)브로드캐스팅 기법을 제안한다. DAF브로드캐스팅 기법은 데이터의 접근빈도를 고려한 인덱스를 교차하여 추가함으로써 접근빈도가 높은 데이터를 원하는 다수의 사용자에 대한 접근시간을 줄임으로써 모든 사용자의 평균 접근시간을 줄이는데 목적이 있다. 수학적 분석을 통해 DAF브로드캐스팅 기법을 평가하고 기존의 브로드캐스트 방법과 DAF브로드캐스팅 기법의 성능을 비교 분석한다.

  • PDF

실시간 모바일 GIS 응용 구축을 위한 주기억장치 데이터베이스 시스템 설계 및 구현 (Design and Implementation of a Main-Memory Database System for Real-time Mobile GIS Application)

  • 강은호;윤석우;김경창
    • 정보처리학회논문지D
    • /
    • 제11D권1호
    • /
    • pp.11-22
    • /
    • 2004
  • 최근 들어 계속되는 램 가격 하락으로 인해 대용량의 램을 사용하는 주기억장치 데이터베이스 시스템의 구축이 실현 가능하게 되었다. 주기억장치 데이터베이스는 여러 다양한 실시간 응용 분야를 위해 사용되며, 매년 CPU 속도가 60% 정도 증가되고, 메모리 속도가 10% 증가되는 현실에서, 케쉬 미스(Cache miss)를 얼마나 줄이느냐 하는 문제가 주기억장치 데이터베이스의 검색 성능 측면에서 가장 중요한 문제로 대두되고 있다. 본 논문에서는 이러한 환경을 고려한 실시간 모바일 GIS응용을 위한 주기억장치 데이터베이스 시스템을 설계 및 구현한다. 본 시스템은 크게 PDA를 사용하는 모바일 사용자를 위한 인터페이스 관리기와 가상 메모리 기법을 사용해 전체 데이터를 주기억장치에 상주시키며 관리하는 주기억 데이터 관리기, 공간 및 비 공간 질의를 처리하는 질의처리기, 새롭게 제시하는 공간 데이터를 위한 MR-트리 인덱스와 비 공간 데이터를 위한 T-트리 인덱스 구조를 관리하는 인덱스 관리기, 데이터를 디스크에 저장하기 위한 GIS 서버 인터페이스로 구성된다. 새롭게 제시하는 공간 인덱싱을 위한 MR-트리는 노트 분할이 발생될 경우, 입력 경로 상에 하나 이상의 빈 엔트리를 지니는 노드가 존재할 경우에만, 노드 분할을 상위로 전송한다. 그러므로 중간 노드들은 항상 100%에 가깝게 채워져 있게 된다. 본 논문의 실험 결과, 2차원의 MR-트리는 기존의 R-트리에 비해 2.4배 이상의 빠른 검색 속도를 나타냈다. 한편, 주 기억 데이터 관리기는 가상 메모리 제공을 위해 전체 벡터 데이터 및 MR-트리, T-트리, 데이터 객체 텍스트 정보를 페이지 단위로 분할하여 관리하고, 간접 주소 기법을 사용하여 디스크로부터의 재 로딩시 발생할 수 있는 문제점을 제거하였다.

CST-트리 인덱스의 빠른 구축

  • 이재원;이익훈;김현철;이상구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.94-96
    • /
    • 2004
  • 기술의 발달로 인하여 컴퓨터에 사용되는 메모리가 대용량화되고, 가격이 저렴해지면서 메인 메모리 데이터베이스 시스템이 주목을 받고 있다. 메인 메모리 데이터베이스 시스템은 디스크 기반 데이터베이스 시스템에 비해 디스크 접근을 줄임으로써, 좀 더 빠른 트랜잭션 처리를 보여주고 있다. 그러나 전원 차단과 같은 장애 발생 시, 메모리의 휘발성으로 인한 데이터 손실에 항상 대비를 해야 한다. 증권, 통신사와 같이 실시간 서비스가 이루어지고, 시스템 장애가 큰 손실로 이어지는 곳에서는 장애 발생 시 데이터의 빠른 복구를 필요로 하게 된다. 본 논문은 메인 메모리 데이터베이스 시스템에서 CST-트리(Cache Sensitive T-tree)보다 좋은 성능을 보이는 CST-트리(Cache Sensitive T-tree)에서 사용할 수 있는 인덱스의 빠른 구축 기법을 제안한다.

  • PDF