• 제목/요약/키워드: Index search

검색결과 761건 처리시간 0.025초

다중 키워드 검색에 적합한 동등조인 연산 결과의 동적 관리 기법 (Dynamic Management of Equi-Join Results for Multi-Keyword Searches)

  • 임성채
    • 정보처리학회논문지A
    • /
    • 제17A권5호
    • /
    • pp.229-236
    • /
    • 2010
  • 인터넷이나 기업체 안에서 생성되는 문서의 수가 빠르게 증가하고 있고 이에 따라 효율적인 문서 검색 서비스의 중요성도 함께 커지고 있다. 이런 검색 환경에서 사용자의 검색 질의를 미리 예측할 수 없기 때문에 문서 내의 키워드를 자동 추출하여 색인어로 사용하는 전문검색(full-text search)이 일반적으로 적용된다. 전문검색을 위해 생성된 색인 파일의 크기는 문서 수 증가로 대용량화 되고, 이런 대용량 색인에 대한 다중 키워드 질의 처리에는 과도한 디스크 비용이 초래될 수 있다. 논문에서는 이런 비용 문제를 해결하기 위해 대용량 문서의 전문검색 시스템에서 다중 키워드 질의를 효율적으로 처리할 수 있게 하는 색인 파일 구조 및 관리 기법을 제안한다. 제안된 방법은 다중 키워드 검색에 적합한 것으로 알려진 역파일을 기본 색인 구조로 하며, 질의 처리의 조인 연산과 랭킹 연산에 적합하도록 색인 파일을 계층화한다. 이를 바탕으로 다중 키워드 질의를 구성할 확률이 높은 키워드 쌍에 대한 조인 연산 결과를 주기억장치 공간에 동적으로 저장함으로써 디스크 사용량을 크게 줄일 수 있다. 논문에서는 제안된 기법의 우수성을 보이기 위해 디스크 비용 모델에 기반한 성능 비교도 수행한다.

Developing a Dynamic Materialized View Index for Efficiently Discovering Usable Views for Progressive Queries

  • Zhu, Chao;Zhu, Qiang;Zuzarte, Calisto;Ma, Wenbin
    • Journal of Information Processing Systems
    • /
    • 제9권4호
    • /
    • pp.511-537
    • /
    • 2013
  • Numerous data intensive applications demand the efficient processing of a new type of query, which is called a progressive query (PQ). A PQ consists of a set of unpredictable but inter-related step-queries (SQ) that are specified by its user in a sequence of steps. A conventional DBMS was not designed to efficiently process such PQs. In our earlier work, we introduced a materialized view based approach for efficiently processing PQs, where the focus was on selecting promising views for materialization. The problem of how to efficiently find usable views from the materialized set in order to answer the SQs for a PQ remains open. In this paper, we present a new index technique, called the Dynamic Materialized View Index (DMVI), to rapidly discover usable views for answering a given SQ. The structure of the proposed index is a special ordered tree where the SQ domain tables are used as search keys and some bitmaps are kept at the leaf nodes for refined filtering. A two-level priority rule is adopted to order domain tables in the tree, which facilitates the efficient maintenance of the tree by taking into account the dynamic characteristics of various types of materialized views for PQs. The bitmap encoding methods and the strategies/algorithms to construct, search, and maintain the DMVI are suggested. The extensive experimental results demonstrate that our index technique is quite promising in improving the performance of the materialized view based query processing approach for PQs.

최소 DTW 거리 기반의 데이터 시퀀스 색인 기법 (Sequence Data Indexing Method based on Minimum DTW Distance)

  • 길기정;송석일;송재종;이석필;장세진;이종설
    • 한국콘텐츠학회논문지
    • /
    • 제11권12호
    • /
    • pp.52-59
    • /
    • 2011
  • 이 논문에서는 시퀀스 데이터베이스에서 효과적인 유사 검색을 지원하기 위한 색인 기법을 제안한다. 제안하는 색인 기법에서는 데이터 시퀀스에 대한 필터링 효과를 얻기 위해, 최소 DTW 거리를 새롭게 제안한다. 최소 DTW 거리는 유사한 데이터 시퀀스 그룹과 질의 시퀀스 사이의 최소거리를 측정하는 방법이다. 최소 DTW 거리는 계층적인 색인 구조를 통해서 시퀀스 데이터베이스를 필터링하면서 유사도 검색을 수행할 수 있도록 한다. 마지막으로, 실험을 통해서 제안하는 방법의 우수성을 입증한다.

Multi-level Scheduling Algorithm Based on Storm

  • Wang, Jie;Hang, Siguang;Liu, Jiwei;Chen, Weihao;Hou, Gang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권3호
    • /
    • pp.1091-1110
    • /
    • 2016
  • Hybrid deployment under current cloud data centers is a combination of online and offline services, which improves the utilization of the cluster resources. However, the performance of the cluster is often affected by the online services in the hybrid deployment environment. To improve the response time of online service (e.g. search engine), an effective scheduling algorithm based on Storm is proposed. At the component level, the algorithm dispatches the component with more influence to the optimal performance node. Inside the component, a reasonable resource allocation strategy is used. By searching the compressed index first and then filtering the complete index, the execution speed of the component is improved with similar accuracy. Experiments show that our algorithm can guarantee search accuracy of 95.94%, while increasing the response speed by 68.03%.

신뢰도지수와 목표성능치에 기반한 확률론적 구조설계 최적화기법에 대한 비교연구 (A Comparative Study on Reliability Index and Target Performance Measure Based Probabilistic Structural Design Optimizations)

  • 양영순;이재옥
    • 한국전산구조공학회:학술대회논문집
    • /
    • 한국전산구조공학회 2000년도 가을 학술발표회논문집
    • /
    • pp.32-39
    • /
    • 2000
  • Probabilistic structural design optimization, which is characterized by the so-called probabilistic. constraints which introduce permissible probability of violation, is preferred to deterministic design optimization since unpredictable inherent uncertainties and randomness in structural and environmental properties are to be taken quantitatively into account by probabilistic design optimization. In this paper, the well-known reliability index based MPFP(Most Probable Failure Point) search approach and the newly introduced target performance measure based MPTP(Minimum Performance Target Point) search approach are summarized and compared. The present comparison focuses on the number of iterations required for the estimation of probabilistic constraints and a technique for improvement which removes exhaustive iterations is presented as well. A 10 bar truss problem is examined for this.

  • PDF

의미 네트워크 모델을 이용한 탐색 용어 선택 시스템의 설계 및 구현에 관한 연구

  • 이효숙
    • 정보관리학회지
    • /
    • 제5권1호
    • /
    • pp.131-152
    • /
    • 1988
  • 본 연구에서는 컴퓨터를 이용하는 탐색 시스템에서 탐색 용어와 관련된 제한점을 해결하고자 의미 네트워크 모델에 지식 베이스를 설계하였다. 이것은 탐색 전략에서 주제분 야의 용어 및 용어간의 어의적 관계에 대한 지식을 확장 이용하였을 때 검색의 효율을 높이 는 데에 촛점을 두었다. 이를 위해서 정보의 탐색과 지식 표현에 관한 문헌 연구를 하였으 며, 실제로 한글 문헌의 화학 공학분야에서 색인어 실험을 통하여 '유체의 흐름'과 '연소'에 관한 지식 베이스를 구성하였다. 탐색 방법은 두가지로 구분되었는데 용어에 관한 탐색과 질문식과 관련된 문헌 검색으로 실시되었다.

  • PDF

웹과 GIS를 통합한 ″Kyonggi21Search″ 구현 : 색인어간 연관도 생성 및 최적화 (Implementation of ″Kyonggi21Search″ combining GIS with The Web : Optimization of Index Association)

  • 장정훈;이룡;상임미언;권용진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.79-81
    • /
    • 2003
  • Kyonggi21Search시스템은 GIS와 웹을 통합한 지역정보 검색 시스템이다. 웹과 GIS를 연동하여 지리정보를 검색하기 위해 웹 문서에서 지역관련 색인어를 추출하고, 색인어간의 관련성을 계산한다. "Kyonggi21Search"시스템에서는 웹 문서에 많이 나타나는 일반적인 단어보다는, 많은 문서에 나타나지 않는 지리적 문화적인 단어들 간의 관련성을 찾는 것이 더 중요한데, 본 연구에서는 단어들 간의 관련성을 찾는데 연관규칙과 연관클러스터를 이용하여 연관도를 계산한다. 그리고 이런 단어들의 관련성을 찾는데는 연관 클러스터를 이용하는 것이 더 적합하다는 것을 보여준다. 한편 웹 문서와 색인어를 이용하여 만든 행렬은 희소행렬이라는 점을 이용하여 연관 클러스터 방법의 단점인 높은 계산량을 줄이는 최적화 방법을 제안한다.

  • PDF

Applying Hebbian Theory to Enhance Search Performance in Unstructured Social-Like Peer-to-Peer Networks

  • Huang, Chester S.J.;Yang, Stephen J.H.;Su, Addison Y.S.
    • ETRI Journal
    • /
    • 제34권4호
    • /
    • pp.591-601
    • /
    • 2012
  • Unstructured peer-to-peer (p2p) networks usually employ flooding search algorithms to locate resources. However, these algorithms often require a large storage overhead or generate massive network traffic. To address this issue, previous researchers explored the possibility of building efficient p2p networks by clustering peers into communities based on their social relationships, creating social-like p2p networks. This study proposes a social relationship p2p network that uses a measure based on Hebbian theory to create a social relation weight. The contribution of the study is twofold. First, using the social relation weight, the query peer stores and searches for the appropriate response peers in social-like p2p networks. Second, this study designs a novel knowledge index mechanism that dynamically adapts social relationship p2p networks. The results show that the proposed social relationship p2p network improves search performance significantly, compared with existing approaches.

시퀀스 데이터베이스를 위한 타임 워핑 기반 유사 검색 (A Method for Time Warping Based Similarity Search in Sequence Databases)

  • 김상욱;박상현
    • 산업기술연구
    • /
    • 제20권B호
    • /
    • pp.219-226
    • /
    • 2000
  • In this paper, we propose a new novel method for similarity search that supports time warping. Our primary goal is to innovate on search performance in large databases without false dismissal. To attain this goal, we devise a new distance function $D_{tw-lb}$ that consistently underestimates the time warping distance and also satisfies the triangular inequality. $D_{tw-lb}$ uses a 4-tuple feature vector extracted from each sequence and is invariant to time warping. For efficient processing, we employ a multidimensional index that uses the 4-tuple feature vector as indexing attributes and $D_{tw-lb}$ as a distance function. We prove that our method does not incur false dismissal. To verify the superiority of our method, we perform extensive experiments. The results reveal that our method achieves significant speedup up to 43 times with real-world S&P 500 stock data.

  • PDF

Design and Implementation of a Main Memory Index Structure in a DBMS

  • Bae, Duck-Ho;Kim, Jong-Dae;Park, Se-Mi;Kim, Sang-Wook
    • International Journal of Contents
    • /
    • 제3권3호
    • /
    • pp.1-5
    • /
    • 2007
  • The main memory DBMS (MMDBMS) efficiently supports various database applications that require high performance since it employs main memory rather than disk as a primary storage. An index manager is an essential sub-component of a DBMS used to speed up the retrieval of objects from a large volume of a database in response to a certain search condition. Previous research efforts on indexing proposed various index structures. However, they hardly dealt with the practical issues occurred in implementing an index manager on a target DBMS. In this paper, we touch these issues and present our experiences in developing the index manager. The main issues are (1) compact representation of an index entry, (2) support of variable-length keys. (3) support of multiple-attribute keys, and (4) support of duplicated keys.