• 제목/요약/키워드: Query Index

검색결과 411건 처리시간 0.023초

UDF 기반 이동객체 질의 처리 설계 및 구현 (Design of Moving Object Query Processing Based on UDF)

  • 유기현;양평우;남광우
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권2호
    • /
    • pp.85-90
    • /
    • 2017
  • 최근 모바일 컴퓨팅 환경의 발달로 다양한 모바일 장비들이 보급되고 있다. 특히 GPS가 탑재된 모바일 장비들의 보급이 활발해지면서 위치정보를 이용한 다양한 응용서비스들이 생겨나고 있다. 이 논문에서는 연속적인 시간에서 획득한 이동객체 위치 정보들의 집합, 즉 이동객체의 궤적을 저장, 관리하기 위한 시스템 모델 및 대용량 이동객체 데이터를 빠르게 질의할 수 있는 UDF (User-Defined Functions) 기반 궤적 인덱스 기법과 질의 선 실체화 테이블 기법을 제안하고 실험을 통해 각 기법들의 성능을 비교 평가한다. 실험에서 질의 선 실체화 테이블 기법이 UDF 기반 궤적 인덱스 기법보다 실행시간에서 약 1.2배 빠른 결과를 보였다.

질의어 의미정보와 사용자 피드백을 이용한 웹 검색엔진의 성능향상 (Improving Performance of Web Search Engine using Query Word Senses and User Feedback)

  • 윤성희
    • 한국산학기술학회논문지
    • /
    • 제8권2호
    • /
    • pp.280-285
    • /
    • 2007
  • 본 논문에서는 웹 정보검색 시스템의 사용자 질의어와 색인에 기반한 검색 과정에서 나타나는 중의성을 해소하기 위해 질의어 의미정보와 사용자 피드백을 사용하여 검색 성능을 향상시키기는 방법을 제안한다. 의미 정보를 이용한 질의어 중의성 해소 과정은 결과 문서집합에서 의미적으로 무관한 많은 문서들을 배제함으로써 검색 정확도를 크게 높일 수 있는 매우 중요한 처리 과정이다. 검색의 색인어가 되는 명사 중심의 의미범주 분류를 이용하여 의미정보 지식베이스를 구축하고, 웹 문서들을 색인어와 사용되는 의미범주로 분류한다. 사용자의 질의 의미 선택과 정답문서에 대한 참조 행위를 피드백 정보로 웹 페이지의 순위 결정에 반영하여 검색시스템의 성능을 향상시킬 수 있다.

  • PDF

RFID 스트리밍 데이타의 연속질의를 위한 영역 스태빙 기법 (Range Stabbing Technique for Continuous Queries on RFID Streaming Data))

  • 박재관;홍봉희;이기한
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권2호
    • /
    • pp.112-122
    • /
    • 2009
  • RFID 표준 개발을 주도하고 있는 EPCglobal은 RFID 미들웨어에 관한 표준 인터페이스로써 ECSpec(Event Cycle Specification)과 ECReports(Event Cycle Reports)를 제시하였다. ECSpec은 애플리케이션이 원하는 태그 데이타에 대한 명세로써 일정 시간 동안 태그 이벤트에 대한 여과 및 수집을 반복적으로 처리하기 위한 연속질의(Continuous Query, CQ)이며 ECReports는 처리 결과에 대한 명세이다. 따라서 연속 질의 수행에 적합하도록 설계된 질의 색인(Query Index) 기법을 적용하여 ECSpec을 질의 색인의 데이타로써, 태그 이벤트를 질의 색인의 질의로써 수행하면 효율적이다. 하지만 RFID 물류환경에서는 유사한 또는 동일 상품군이 대량으로 이동하게 되고, 이때 상품에 부착된 태그가 RFID 리더에서 인식될 때 발생하는 이벤트가 짧은 기간 동안 다수 발생하게 되는데. 이를 개별적으로 처리하는 것은 비효율적이다. 이 논문에서는 ECSpec에서 지정하는 보고주기 기간 동안 태그 이벤트에 의한 질의를 수집하여 그룹을 구성하고 질의 색인에 영역 질의로써 수행하여 유사 검색 과정을 제거하는 기법을 제안한다. 이러한 질의 그룹 처리 기법을 위해, 일정기간 연속된 태그 이벤트를 효과적으로 수집하기 위한 큐의 구성 방법과 수집된 태그 이벤트로부터 영역 질의를 생성하기 위한 방법을 제안한다. 또한 실험을 통해 이러한 기법의 효율성을 확인한다.

이미지 시퀀스 데이터베이스에서 우선순위 큐와 접미어 트리를 이용한 효율적인 유사 서브시퀀스 검색의 설계 (A Design for Efficient Similar Subsequence Search with a Priority Queue and Suffix Tree in Image Sequence Databases)

  • 김인범
    • 한국컴퓨터산업학회논문지
    • /
    • 제4권4호
    • /
    • pp.613-624
    • /
    • 2003
  • 본 논문은 우선순위 큐와 접미어 트리로 색인 구조를 생성한 후. 이미지 시퀀스 데이터베이스에서 다차원 타임 워핑 거리 함수를 이용하여 유사한 이미지 서브시퀀스를 신속하고 정확하게 검색할 수 있는 방법을 제안한다. 본 논문에서 제안된 방법은 사전에 정의된 중요도에 따라 선별된 이미지 시퀀스로 구성된 우선순위 큐 색인의 이미지 서브시퀀스에 대한 유사성 거리 계산을 첫 단계로 시행하여 유사한 서브시퀀스집합을 얻고 만족할 결과를 얻지 못했을 경우에는 두 번째 단계로 나머지 유사 서브시퀀스에 대해 디스크 기반의 접미어 트리를 색인 구조체로 하여 유사한 서브시퀀스를 검색하는 것이다. 하한 거리 함수를 활용하여 질의 이미지 시퀀스와 유사한 이미지 서브시퀀스를 검색하는 과정에서 생성 가능한 오류를 방지 하면서 동시에 비 유사 이미지 서브시퀀스를 제거하도록 한다.

  • PDF

타임 워핑을 지원하는 효율적인 서브시퀀스 매칭 기법 (A Subsequence Matching Technique that Supports Time Warping Efficiently)

  • 박상현;김상욱;조준서;이헌길
    • 산업기술연구
    • /
    • 제21권A호
    • /
    • pp.167-179
    • /
    • 2001
  • This paper discusses an index-based subsequence matching that supports time warping in large sequence databases. Time warping enables finding sequences with similar patterns even when they are of different lengths. In earlier work, we suggested an efficient method for whole matching under time warping. This method constructs a multidimensional index on a set of feature vectors, which are invariant to time warping, from data sequences. For filtering at feature space, it also applies a lower-bound function, which consistently underestimates the time warping distance as well as satisfies the triangular inequality. In this paper, we incorporate the prefix-querying approach based on sliding windows into the earlier approach. For indexing, we extract a feature vector from every subsequence inside a sliding window and construct a multi-dimensional index using a feature vector as indexing attributes. For query precessing, we perform a series of index searches using the feature vectors of qualifying query prefixes. Our approach provides effective and scalable subsequence matching even with a large volume of a database. We also prove that our approach does not incur false dismissal. To verily the superiority of our method, we perform extensive experiments. The results reseal that our method achieves significant speedup with real-world S&P 500 stock data and with very large synthetic data.

  • PDF

Shannon의 정보이론과 문헌정보 (Shannon's Information Theory and Document Indexing)

  • 정영미
    • 한국문헌정보학회지
    • /
    • 제6권
    • /
    • pp.87-103
    • /
    • 1979
  • Information storage and retrieval is a part of general communication process. In the Shannon's information theory, information contained in a message is a measure of -uncertainty about information source and the amount of information is measured by entropy. Indexing is a process of reducing entropy of information source since document collection is divided into many smaller groups according to the subjects documents deal with. Significant concepts contained in every document are mapped into the set of all sets of index terms. Thus index itself is formed by paired sets of index terms and documents. Without indexing the entropy of document collection consisting of N documents is $log_2\;N$, whereas the average entropy of smaller groups $(W_1,\;W_2,...W_m)$ is as small $(as\;(\sum\limits^m_{i=1}\;H(W_i))/m$. Retrieval efficiency is a measure of information system's performance, which is largely affected by goodness of index. If all and only documents evaluated relevant to user's query can be retrieved, the information system is said $100\%$ efficient. Document file W may be potentially classified into two sets of relevant documents and non-relevant documents to a specific query. After retrieval, the document file W' is reclassified into four sets of relevant-retrieved, relevant-not retrieved, non-relevant-retrieved and non-relevant-not retrieved. It is shown in the paper that the difference in two entropies of document file Wand document file W' is a proper measure of retrieval efficiency.

  • PDF

GOPES: Group Order-Preserving Encryption Scheme Supporting Query Processing over Encrypted Data

  • Lee, Hyunjo;Song, Youngho;Chang, Jae-Woo
    • Journal of Information Processing Systems
    • /
    • 제14권5호
    • /
    • pp.1087-1101
    • /
    • 2018
  • As cloud computing has become a widespread technology, malicious attackers can obtain the private information of users that has leaked from the service provider in the outsourced databases. To resolve the problem, it is necessary to encrypt the database prior to outsourcing it to the service provider. However, the most existing data encryption schemes cannot process a query without decrypting the encrypted databases. Moreover, because the amount of the data is large, it takes too much time to decrypt all the data. For this, Programmable Order-Preserving Secure Index Scheme (POPIS) was proposed to hide the original data while performing query processing without decryption. However, POPIS is weak to both order matching attacks and data count attacks. To overcome the limitations, we propose a group order-preserving data encryption scheme (GOPES) that can support efficient query processing over the encrypted data. Since GOPES can preserve the order of each data group by generating the signatures of the encrypted data, it can provide a high degree of data privacy protection. Finally, it is shown that GOPES is better than the existing POPIS, with respect to both order matching attacks and data count attacks.

스케쥴링 기법을 이용한 분산 이동 객체 데이타베이스의 범위 질의 처리 (Range Query Processing of Distributed Moving Object Databases using Scheduling Technique)

  • 전세길;황재일;나연묵
    • 한국공간정보시스템학회 논문지
    • /
    • 제6권2호
    • /
    • pp.51-62
    • /
    • 2004
  • 최근 들어 이동 통신 서비스에서 이동하는 고객의 위치정보와 관련된 서비스가 중요한 서비스로 부각되고 있다. 이동 객체의 경우 갱신 연산이 많고 부하가 특정 지역에 집중되는 특징이 있다. 이러한 LBS 응용에서 시공간 영역질의는 중요한 서비스이다. 질의 처리 속도의 개선을 위해서 디스크 입출력 시간을 최대한 줄일 필요가 있다. 본 논문에서는 갱신연산을 최소화하기 위해 고안되어진 시공간 시스템 아키텍쳐로 GALIS의 비균등 2단계 격자 인덱스 구조를 적용한다. 질의 처리 처리율을 향상시키기 위해서 공간 관련성과 시간 관련성을 이용한 스케줄링 기법과 Time Zone 개념을 사용하여 시공간 개념이 결합된 질의 처리 기법을 제안한다. 제안된 방법의 성능 측정을 위해서 다른 질의 범위를 가지고 영역 질의의 결과를 보인다.

  • PDF

센서 네트워크 환경에서 질의 처리를 위한 노드 선정 기법의 설계 (Design of the Node Decision Scheme for Processing Queries on Sensor Network Environments)

  • 김동현
    • 한국정보통신학회논문지
    • /
    • 제16권10호
    • /
    • pp.2224-2229
    • /
    • 2012
  • 센서 데이터는 지속적으로 데이터 집합에 데이터가 삽입되기 때문에 데이터 검색을 위하여 연속 질의를 사용해야 한다. 연속 질의를 처리하기 위하여 각 센서 노드에서 질의 색인을 구축하고 질의 조건에 맞는 데이터를 전송하는 것이 필요하다. 그러나 모든 노드에 질의 조건을 전송하면 대량의 메시지가 발생하는 문제가 있다. 이 논문에서는 질의 조건 전송을 위한 메시지 횟수를 줄이기 위하여 센서노드선정 트리를 이용한 노드 선정 기법을 제안한다. 단말노드 엔트리는 각 센서 노드를 나타내며 센서 노드에서 발생하는 데이터의 영역을 정의한다. 질의가 발생하면 질의 조건과 겹치는 노드들이 선정되며 해당 노드로 질의 조건을 전송한다. 그리고 센서노드선정 트리를 구현하고 효율성을 실험하였다.

분산 이동 객체 데이터베이스의 효율적인 범위 질의 처리 (An Efficient Range Query Processing of Distributed Moving Object)

  • 전세길;우찬일
    • 대한전자공학회논문지TE
    • /
    • 제42권1호
    • /
    • pp.35-40
    • /
    • 2005
  • 최근 들어 이동 통신에서 이동하는 고객의 위치정보와 관련된 서비스가 중요하게 부각되고 있다. 이동 객체의 경우 갱신 연산이 많고 부하가 특정 지역에 집중되는 특징이 있다. 이러한 LBS 응용에서 시공간 영역질의는 중요한 부분이고, 질의 처리속도의 개선을 위해서 디스크 입출력 시간을 최대한 줄일 필요가 있다. 본 논문에서는 갱신연산을 최소화하기 위해 고안되어진 시공간 인덱스 구조로 비 균등 2단계 격자 인덱스 구조를 적용한다. 또한 질의 처리률 향상을 위해서 공간 관련성과 시간 관련성을 이용한 스케줄링 기법과 time zone 개념을 사용하여 시공간 개념이 결합된 질의 처리 기법을 제안한다. 다양한 질의 범위를 사용하여 실험한 결과 제안된 방법이 기존의 방법보다 우수함을 알 수 있었다.