• 제목/요약/키워드: extended query

검색결과 104건 처리시간 0.021초

사용자 질의패턴 분석을 이용한 효율적인 확장검색어 추천시스템 (An Efficient Extended Query Suggestion System Using the Analysis of Users' Query Patterns)

  • 김영안;박건우
    • 한국통신학회논문지
    • /
    • 제37권7C호
    • /
    • pp.619-626
    • /
    • 2012
  • 주요 검색엔진들은 확장 및 연관검색어를 추천하는 서비스를 제공함으로써 질의어 확장에 대한 사용자의 검색 편의성을 제공하고 있다. 하지만 많은 수의 사용자가 많이 찾는 검색어 즉, 대중성을 근거하여 제공되는 확장 및 연관검색어 추천 서비스는 사용자의 만족도를 높이는데 한계가 있다. 왜냐하면 사용자마다 생각하는 차이가 존재하며 선호하는 질의 및 관심 분야도 다르기 때문이다. 본 논문에서는 사용자의 정보요구에 적합한 효율적인 확장검색어를 추천하는 시스템을 설계 및 구현하고 웹 사용자의 정보검색 과정에서 최초 질의어 입력 후 질의어 확장 과정에서 사용자의 편의성을 향상시키고자 하였다. 평가결과 제안시스템은 검색엔진에서 추천하지 못한 구글 41% 및 야후 48%의 확장검색어를 추천할 수 있었으며 사용자의 편의성을 위하여 대중성 기반으로 추천되고 있는 확장 및 연관검색어 추천 서비스의 한계를 보완하여 사용자의 편의성을 향상시킬 수 있었다.

확장 불리언 질의에 대한 비용 기반 최적화 (Cost-based Optimization of Extended Boolean Queries)

  • 박병권
    • 정보관리학회지
    • /
    • 제18권3호
    • /
    • pp.29-40
    • /
    • 2001
  • 본 논문에서는 역색인 파일을 미용하여 학장 불리언 질의를 처리할 때 최소 비용의 질의 처리 방법을 구해 주는 질의 최적화 알고리즘을 제시한다. 확장 불리언 질의를 처리하는 방법은 질의를 구성하는 키위드의 처리 순서에 따라 여러 가지가 있을 수 있으므로 확장 불리언 질의 최적화 문제는 결국 최적 키워드 처리 순서를 구하는 문제로 귀결된다. 본 논문에서는 이 문제가 데이터베이스 질의 최적화에서 최적 조인 순서를 구하는 문제와 구조적으로 유사함을 보이고 이 분야의 연구 결과를 이용하여 문제를 해결한다. 즉, 확장 불리언 질의 처리에 대한 비용 모델을 수립하고 키워드 선택률과 역색인 파일 접근 비용을 이용하여 키워드 순위 개념을 도입한 후 이를 이용하여 최적 키워드 처리 순서를 구하는 알고리즘을 도출한다. 그리고 도출한 질의 최적화 알고리즘의 최적성을 증명하고. 실험을 통하여 실제로 최소비용의 질의 처리 방법을 구함을 보이고, 질의 최적화를 하지 않을 경우와 비교하였을 때 그 성능이 월등히 우수함을 보인다. 본 논문에서 제시한 질의 최적화 알고리즘은 정보검색시스템의 질의 처리 성능 향상에 큰 기여를 하리라 믿는다.

  • PDF

Query Expansion Using Augmented Terms in an Extended Boolean Model

  • Nguyen, Tuan-Quang;Heo, Jun-Seok;Lee, Jung-Hoon;Kim, Yi-Reun;Whang, Kyu-Young
    • Journal of Computing Science and Engineering
    • /
    • 제2권1호
    • /
    • pp.26-43
    • /
    • 2008
  • We propose a new query expansion method in the extended Boolean model that improves precision without degrading recall. For improving precision, our method promotes the ranks of documents having more query terms since users typically prefer such documents. The proposed method consists of the following three steps: (1) expanding the query by adding new terms related to each term of the query, (2) further expanding the query by adding augmented terms, which are conjunctions of the terms, (3) assigning a weight on each term so that augmented terms have higher weights than the other terms. We conduct extensive experiments to show the effectiveness of the proposed method. The experimental results show that the proposed method improves precision by up to 102% for the TREC-6 data compared with the existing query expansion method using a thesaurus proposed by Kwon et al.

OLAP에서 MAX-of-SUM 질의의 효율적인 처리 기법 (Efficient Processing of MAX-of-SUM Queries in OLAP)

  • 정희정;김동욱;김종수;이윤준;김명호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제27권2호
    • /
    • pp.165-174
    • /
    • 2000
  • OLAP 분야에서 지금까지 연구되어온 영역 질의는 주어진 영역에 대한 집단 연산의 결과를 구하는 단순한 형태이다. 그러나 실제 데이타 분석 과정에서는 이러한 단순한 형태의 영역 질의뿐만 아니라, 집단 연산이 포함된 특정 조건을 만족하는 데이타 큐브 내의 영역을 찾는 형태의 확장된 영역 질의에 대한 필요성이 존재한다. 본 논문에서는 이러한 확장된 영역 질의 유형의 일반적인 형태를 정의하고, 이에 대한 대표적인 예인 'MAX-of-SUM 질의'의 효율적인 처리 기법을 제안한다. MAX-of-SUM 질의는 데이타 큐브 상에서 영역합(SUM)이 최대(MAX)가 되는 영역을 찾는 질의를 의미한다. 본 논문에서는 MAX-of-SUM 질의 처리 시 검색의 대상이 되는 영역들에 대한 SUM 연산의 결과값이 취할 수 있는 범위를 미리 예측하는 기법을 제안한다. 즉, 영역에 대한 SUM 값의 범위를 예측함으로써, 이들 중에서 최대값을 찾기 위해 실제로 계산하여야 하는 영역의 개수를 줄여 빠른 질의 처리를 보장한다.

  • PDF

시간지원 데이터베이스의 질의처리 시스템 구현 (Implementation of Query Processing System in Temporal Databases)

  • 이언배;김동호;류근호
    • 한국정보처리학회논문지
    • /
    • 제5권6호
    • /
    • pp.1418-1430
    • /
    • 1998
  • 시간지원 데이터베이스는 유효시간과 거래시간을 통해 객체에 대한 효율적인 이력관리를 제공한다. 유효시간은 현실세계에서 객체에 발생한 시간을 의미하며, 거래시간은 객체가 데이터베이스에서 정의된 연산 뿐만 아니라 사용자 질의에 내포된 이력정보에 관련된 연산을 처리할 수 있도록 확장되어야 한다. 따라서 이 논문에서는 시간지원 질의언어인 TQuel(temporal query language)을 대상으로 하는 이전에 제안된 시간지원 질의 처리 시스템에 대하여 시간지원 구문분석과 시간지원 의미분석, 그리고 시간지원 코드 생성 및 시간지원 실행기 등의 기본적인 요소를 기반으로 거래시간 관리, 시간지원 집계, 시간지원 뷰, 그리고 시간지원 죠인 및 최적화 기능을 추가로 설계 구현하고, 그 처리과정을 예를 들어 설명한다.

  • PDF

시공간 질의 처리 시스템의 설계 및 구현 (Design and Implementation of Spatiotemporal Query Processing Systems)

  • 이성종;김동호;류근호
    • 한국정보처리학회논문지
    • /
    • 제6권5호
    • /
    • pp.1166-1176
    • /
    • 1999
  • The spationtemporal databases support a historical informations as well as spatial managements for various kinds of objects in the real world, and can be efficiently used in many applications such as geographic information system, urban plan system, car navigation system. However it is difficult to represent efficiently historical operations with conventional database query language for spatial objects. In terms of cost for query processing, it also degenerates performance of query processing because of syntactic limitations which is innate in conventional query representation. So in this paper, we introduce a new query language, entitled as STQL, which has been extended on the basis of the most popular relational database query language SQL. And we implement as well as evaluate a spationtemporal query processing system that get a query written by STQL and then process it in a main memory.

  • PDF

XML 데이터 처리에서 시맨틱 (Semantics in XML Data Processing)

  • 진민
    • 한국산학기술학회논문지
    • /
    • 제12권3호
    • /
    • pp.1327-1335
    • /
    • 2011
  • XML은 계층적이고 스스로 기술하는 구조를 가지는 데이터를 표현하기에 좋지만 XML 자체는 시맨틱을 가지고 있지 않다. 하지만 XML이 널리 새로운 응용에서 사용됨에 따라 XML 시맨틱이 필요하게 되었다. 이 논문은 XML 데이터 처리 환경에서 시맨틱을 조사하였다. XML 시맨틱은 사용 용도에 따라 구조적 시맨틱, 관계 시맨틱, 확장 시맨틱과 시맨틱 웹으로 분류할 수 있다. 그리고 질의 처리와 같이 XML 문서 관리에서 활용하기 위해 확장된 관계 시맨틱을 제안한다.

부질의 기능을 추가한 확장된 Query-by-Example (The estended query-by-example supporting subqueries)

  • 원희선;이종학;황규영
    • 전자공학회논문지B
    • /
    • 제31B권9호
    • /
    • pp.10-21
    • /
    • 1994
  • Query-by-Example(QBE) is high-level display-oriented databased manipulation language that provides a convenient and unified style for querying, updating, defining, and controling a relational database. QBE is relationally complete. However, lack of aubquery constructs limits th usability of QBE significantly. In particular, certain queries cannot be represented in one window. In this paper, we define a subquery box and extend QBE for subquery construction. The Extended QBE makes it possible to represent the queries that the QBE cannot do in one window, reducing the overhead and complexity of composing those queries. We also define the grammar of the Extended QBE and present the parsing techniques. Finally, we present an algorithm to transform the queries in Exteded QBE to those in SQL. The result of the transformation can be executed using dynamic SQL features of any SQL system. The proposed language has been implemented on OS/2 using the OS/2 EE Database Manager.

  • PDF

성능평가를 위한 다양한 분포를 갖는 질의 작업부하의 생성 기법 (A Technique for Generating Query Workloads of Various Distributions for Performance Evaluations)

  • 서상구
    • Journal of Information Technology Applications and Management
    • /
    • 제9권1호
    • /
    • pp.27-44
    • /
    • 2002
  • Performance evaluations of database algorithms are usually conducted on a set of queries for a given test database. For more detailed evaluation results, it is often necessary to use different query workloads several times. Each query workload should reflect the querying patterns of the application domain in real world, which are non-uniform in the usage frequencies of attributes in queries of the workload for a given database. It is not trivial to generate many different query workloads manually, while considering non-uniform distributions of attributes'usage frequencies. In this paper we propose a technique to generate non-uniform distributions, which will help construct query workloads more efficiently. The proposed algorithm generates a query-attribute usage distribution based on given constraints on usage frequencies of attributes and qreries. The algorithm first allocates as many attributes to queries as Possible. Then it corrects the distribution by considering attributes and queries which are not within the given frequency constraints. We have implemented and tested the performance of the proposed algorithm, and found that the algorithm works well for various input constraints. The result of this work could be extended to help automatically generate SQL queries for various database performance benchmarking.

  • PDF

Design of Spatial Query Language for GEO Millennium Server TM

  • Zhaohong Liu;Kim, Sung-Hee;Oh, Young-Hwan;Bae, Hae-young
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.113-115
    • /
    • 2000
  • A GIS software GEO Millennium SystemTM has been developed to integrated with spatial database that combines conventional and spatially related data. As we known well the standard query language lacks the support of spatial data type and predicate, and can not serve as the query language in the spatial database directly; some extended strategies have been proposed, but some of them need their own storage manager, some introfuce new clause into the SELECT-FROM-WHERE structure, and some is very complex and available to us. So we designed our own query language on the conventional storage manager system. It supports the Spatial Data Type and predicate, and provides the full query capabilities of SQL on the non-spatial part of the database while being tightly integrated with the spatial part, without changing the standard SQL structure.

  • PDF