• Title/Summary/Keyword: 질의 생성

Search Result 2,127, Processing Time 0.085 seconds

Entropy-based Dynamic Histogram for Spatio-temporal Databases (시공간 데이타베이스의 엔트로피 기반 동적 히스토그램)

  • 박현규;손진현;김명호
    • Journal of KIISE:Databases
    • /
    • v.30 no.2
    • /
    • pp.176-183
    • /
    • 2003
  • Various techniques including histograms, sampling and parametric techniques have been proposed to estimate query result sizes for the query optimization. Histogram-based techniques are the most widely used form for the selectivity estimation in relational database systems. However, in the spatio-temporal databases for the moving objects, the continual changes of the data distribution suffer the direct utilization of the state of the art histogram techniques. Specifically for the future queries, we need another methodology that considers the updated information and keeps the accuracy of the result. In this paper we propose a novel approach based upon the duality and the marginal distribution to construct a histogram with very little time since the spatio-temporal histogram requires the data distribution defined by query predicates. We use data synopsis method in the dual space to construct spatio-temporal histograms. Our method is robust to changing data distributions during a certain period of time while the objects keep the linear movements. An additional feature of our approach supports the dynamic update incrementally and maintains the accuracy of the estimated result.

Efficient Skyline Computation on Time-Interval Data Streams (유효시간 데이터 스트림에서의 스카이라인 질의 알고리즘)

  • Park, Nam-Hun;Chang, Joong-Hyuk
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.13 no.1
    • /
    • pp.370-381
    • /
    • 2012
  • Multi-criteria result extraction is crucial in many scientific applications that support real-time stream processing, such as habitat research and disaster monitoring. Skyline evaluation is computational intensive especially over continuous time-interval data streams where each object has its own customized expiration time. In this work, we propose TI-Sky - a continuous skyline evaluation framework. To ensure correctness, the result space needs to be continuously maintained as new objects arrive and older objects expire. TI-Sky strikes a perfect balance between the costs of continuously maintaining the result space and the costs of computing the final skyline result from this space whenever a pull-based user query is received. Our key principle is to incrementally maintain a partially precomputed skyline result space - however doing so efficiently by working at a higher level of abstraction. TI-Sky's algorithms for insertion, deletion, purging and result retrieval exploit both layers of granularity. Our experimental study demonstrates the superiority of TI-Sky over existing techniques to handle a wide variety of data sets.

An XML Data Management System and Its Application to Genome Databases (XML 데이타 관리시스템과 유전체 데이타베이스에의 응용)

  • 이경희;김태경;김선신;이충세;조완섭
    • Journal of KIISE:Databases
    • /
    • v.31 no.4
    • /
    • pp.432-443
    • /
    • 2004
  • As the XML data has been widely used in the Internet, it is necessary to store and retrieve the XML data by using DBMSs. However, relational DBMSs suffer from the model difference between graph structure of the XML data and table forms in relational databases. We propose an ORDBMS-based DTD-dependent XML data management system Xing. Xing stores XML data in a DTD-dependent form in an object database. Since the object database schema has a graph structure and supports multi-valued attributes, mapping from an XML data model and queries into an object data model and OQLs is a simple problem. For rapid storing of large quantities of the XML data, we use SAX parser with customized Xing-tree which requires a small memory space compared with the DOM-tree. Xing also returns the query result in an XML document form. We have implemented the Xing system on top of UniSQL object-relational DBMS for the validity checking and performance comparison. For XML genome data from GenBank, and experimental evaluation shows that Xing can provide significant performance improvement (maximum 10 times) compared with the relational approach.

A Rule-Base based Context-aware Middleware in Sensor Network (센서 네트워크에서의 Rule-Base 기반 상황 인식 미들웨어)

  • Kim, Geum-Lan;Kim, J.A.;Kim, S.W.;Kim, C.H.;Kim, S.K.;Park, C.J.
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10c
    • /
    • pp.88-92
    • /
    • 2006
  • 상황인식 처리기술은 사용자의 컨텍스트에 근거하여 사용자와 장치간의 상호 운용성을 지원해 줌으로써, 사용자로 하여금 정보 획득 및 실행을 보다 용이하게 하도록 해주는 기술이다. 여러 상황변화가 발생할 경우 이에 따라 서비스 전달 방식을 동적으로 적응시키기 위하여 상황에 대한 명시적인 요구사항을 정의하고 이 정의 된 상황을 각 노드에 전파하고 노드에 포함된 미들웨어는 전파된 상황에 적합한 센싱된 정보를 분석하여 특정한 상황의 발생과 이에 따른 액션을 수행하며 또한 센서에서 취득한 컨텍스트로 부터 통합된, 추론된 컨텍스트를 생성한다. 본 논문에서는 센서로부터 다양한 타입의 컨텍스트를 처리 할 수 있는 미들웨어를 제안한다. 이 미들웨어는 변화하는 주변 환경에서 센서로부터 센싱된 컨텍스트 뿐 아니라 통합된, 추론된 컨텍스트를 생성할 수 있도록 설계 되었다. 제안한 상황인식 미들웨어를 기반으로 사용자 질의 요청과 이벤트 상황 질의를 설계하였으며, 이벤트 상황 질의의 추론 DB를 명시하기 위하여 Clips 언어를 사용하였다.

  • PDF

Document Filtering Algorithm for Efficient Preprocessing of XML Information Retrieval (XML 정보검색의 효율적 전처리를 위한 문서여과 알고리즘)

  • Kong Yong-Hae;Kim Myung-Sook
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.6 no.1
    • /
    • pp.1-11
    • /
    • 2005
  • The paper proposes a preprocessing method for efficient processing of XML queries in information retrieval with a large amount of XML documents. The conventional preprocessing methods filter out XML documents by parsing XML document for keyword of query or by comparing query signatures with signatures of XML document to be generated. But these methods are dependent on a query and are very in efficient for a large amount of XML documents. For this, we generate a universal DTD based on ontology of a domain. The universal DTD is applicable to the XML documents when they contain information of a same domain even when they have different structures and attributes. Then, using the universal DTD, we filter out the XML documents that are not bounded in the domain. We evaluate the performance of this method through experiments.

  • PDF

Generation of a Semantic Structure on a Conventional Goods Search System (대화형 상품 검색 시스템에서 의미 구조 생성에 관한 연구)

  • Jung, Hae-Kyung;Bae, Woo-Jung;Lee, Yong-Seok
    • Annual Conference on Human and Language Technology
    • /
    • 2006.10e
    • /
    • pp.197-204
    • /
    • 2006
  • 인터넷 쇼핑몰 분야에서 한국어 인터페이스에 대한 필요성이 대두되면서 이와 관련한 연구가 진행되어 왔다. 이러한 기존 연구들의 문제점은 다른 응용 분야에 대한 확장성이 떨어지고, 대화식 질의 문장을 처리하기 위해 필요한 상황 지식을 사용할 수 없다는 것이다. 확장성을 위해 한국어 인터페이스는 내부 구현의 변경 없이 도메인 지식의 교체만으로 다른 분야에 대한 적용이 쉬워야 한다. 아울러, 한국어 질의 문장을 SQL이나 ACL과 같은 여러 응용 분야의 인공 언어에 쉽게 변환할 수 있으려면 모호성이 전혀 없는 의미 구조로 표현되어야 한다. 이렇게 표현된 의미 구조는 상황 지식의 표현과 적용을 용이하게 한다. 본 논문은을 Sowa의 개념 구조를 이용하여 의사 의미 구조를 유형 정의, 관계형 정의, 액터와 같은 도메인 지식베이스를 이용하여 표준 의미 구조로 변환하는 시스템을 제안한다. 본 논문은 먼저 필요한 도메인 지식베이스의 종류와 역할 등을 설명하고, 상황 지식을 이용하여 불완전한 의미 구조를 완전한 의미 구조로 변환하는 방법을 보인다. 아울러, 같은 의미를 갖는 여러 형태의 의사 의미 구조가 하나의 표준 의미 구조로 변환됨으로서 시스템의 일관성을 유지하는데 용이함을 보일 것이다. 본 시스템에서 생성한 의미구조는 중간 언어의 역할을 하므로, 제안하는 한국어 인터페이스 시스템은 데이터베이스 분야뿐만 아니라 에이전트 분야, 시맨틱 웹 분야 등에서도 손쉽게 적용할 수 있다는 장점을 가진다.

  • PDF

Customized Query Recommendation by Agent Based on User's Query Pattern (사용자 질의패턴 기반 에이전트에 의한 맞춤형 질의추천)

  • Lim, Yo-Han;Park, Gun-Woo;Lee, Sang-Hoon
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06b
    • /
    • pp.200-204
    • /
    • 2008
  • 검색엔진을 사용해 질의를 입력 후 사용자가 원하는 정보를 얻을 때까지의 검색 결과정보의 탐색 범위에 대해 설문한 연구 보고서에 검색 결과정보의 첫 페이지만 보는 사용자가 설문인원의 41%를 차지했고, 상위 3페이지만 사용하는 사용자는 88%에 달한다고 하였다. 따라서 검색결과의 상위순위는 사용자의 정보 존재여부를 판단하는 중요한 척도가 된다. 또한 인터넷의 방대한 정보로 인해 정보 홍수에 빠진 사람들은 정보에 대한 까다로운 요구를 하고 있다. 이를 테면 개인화 또는 맞춤화된 정보를 제공 받기를 원하고 있다. 정보검색시 대다수의 사용자들은 질의의 길이를 2단어 이하의 키워드를 사용하여 질의가 특정한 토픽을 지향하도록 하고 있다. 본 논문에서는 데이터 마이닝의 연관규칙을 적용 사용자 프로파일 DB내 질의에 대한 사용자 질의패턴을 분석하여 '분석 Agent' 통한 연관 질의 리스트를 생성하고 '추천 Agent'는 사용자들의 취향변화 즉 시간에 따라 변하는 관심영역 또는 사용자 질의 변화에 대해서 날짜별 가중치를 부여하여 사용자와 상호교류를 통해 사용자에게 맞춤형 질의를 추천하는 방안을 제시하고자 한다.

  • PDF

The Characteristics of Air Quailty over Jeju Island : Variations of $O_3$ and NO$_2$ (제주지역 대기질 변동특성 : $O_3$과 NO$_2$를 중심으로)

  • 오태권;박용이;허철구;이기호
    • Proceedings of the Korea Air Pollution Research Association Conference
    • /
    • 2003.11a
    • /
    • pp.419-420
    • /
    • 2003
  • 대기질의 특성 및 변동에 관련된 많은 연구는 대부분이 대도시 또는 대도시 인접지역을 중심으로 이루어져 왔으며, 이러한 연구로부터 대도시에서의 대기질, 특히 오존의 변동 특성 및 기타 오염물질과의 관계 등에 대한 많은 자료가 축적되어왔다. 그렇지만 대도시의 오존농도가 대도시내에서의 생성 및 소멸에만 국한되어 있는 것이 아니라 대기운동과 관련된 수송과도 밀접한 관련이 있다고 밝혀짐에 따라 청정한 대기상태에서 배경농도 특성에 대한 연구의 필요성이 증가하고 있다. (중략)

  • PDF

A study on the XML Indexing model for Efficient Retrieval (XML의 RDB로의 맵핑과 효율적인 검색을 위한 색인 모델)

  • 김태희;김선경
    • Proceedings of the Korea Society for Industrial Systems Conference
    • /
    • 2004.06a
    • /
    • pp.55-60
    • /
    • 2004
  • XML 문서의 관계형 데이터베이스로의 맵핑과. 데이터베이스의 성능을 향상시키기 위한 방안으로 내용질의와 함께 XML 문서의 특성을 활용한 구조 검색 질의를 하기 위한 효율적인 색인 모델을 제안한다. 내용 색인과 구조 색인, 애트리뷰트 색인을 각각 구성하여 내용과 구조가 혼합된 효율적인 검색이 가능하도록 하였다. 검색의 효율성을 위해 노드 간의 위치 정보와 함께 독립적인 ID를 부여하여 경로테이블을 생성하여 질의의 효율을 높인다.

  • PDF

A Method for Collection Selection using Incomplete Information in a distributed retrieval system (분산검색에서 부분정보를 이용한 컬렉션 선택 방법)

  • 이현숙;맹성현;이만호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.484-486
    • /
    • 2002
  • 본 논문은 여러 컬렉션에 대해 검색을 수행하는 분산 검색시스템에서 질의어가 들어 왔을 때 질의어에 적합한 컬렉션을 자동으로 선택할 수 있도록 하는 컬렉션 선택 모델과 브로커 구조를 제안하였다. 각 컬렉션마다 과거 질의에 대해 검색된 결과 문서들을 색인하여 인접단어를 고려한 불완전 인텍스를 생성한다. 이러한 불완전 인덱스를 이 용하여 컬렉션 선택하는 모델을 TREC 문서집합과 SMART 시스템을 이용하여 구현하였다.

  • PDF