• 제목/요약/키워드: Query Patterns

검색결과 104건 처리시간 0.026초

기호공간에서 이동객체 스트림 데이터의 연속 시공간 셀프조인 질의 (Continuous Spatio-Temporal Self-Join Queries over Stream Data of Moving Objects for Symbolic Space)

  • 황병주;이기준
    • Spatial Information Research
    • /
    • 제18권1호
    • /
    • pp.77-87
    • /
    • 2010
  • 시공간 조인은 이동객체와 같이 시공간의 특성을 가지는 데이터를 처리할 때 요구되는 중요한 연산자로, 이동객체들의 움직임을 분석하거나 이동객체들의 시공간적 패턴을 찾는 것과 같이 다양하게 활용된다. 현재까지 실외공간에서의 시공간 조인 질의에 관한 연구는 많이 진행되어왔다. 최근에는 실내측위기술이 발전함에 따라 실외뿐만 아니라 실내에서도 다양한 위치기반 서비스가 점진적으로 제공되고 있으며, 특히 이동객체를 중심으로 다양한 응용 서비스들을 필요로 하게 된다. 하지만 실내공간에서의 시공간 조인에 관한 연구는 아직 전무하다. 본 논문에서는 실내공간에서 실시간으로 갱신되는 이동객체에 대한 연속 시공간 셀프조인 질의와 질의처리 방법론을 제안하였다. 연속 시공간 셀프조인 질의는 주어지는 특정 시간과 공간의 조건을 만족하는 모든 쌍들을 시간이 지남에 따라 지속적으로 갱신하는 질의이다. 본 논문에서는 방이나 복도와 같이 특정한 기호를 중심으로 이동객체의 위치를 표현하며 이러한 특징을 가지는 공간을 기호공간이라 한다. 그리고 방대한 스트림데이터를 효과적으로 필터링하고 관리하기 위한 후보쌍 버퍼 테이블이라는 자료구조와 이를 활용한 질의처리 방법론을 제안하였으며 실험을 통해 타당성을 검증하였다.

시맨틱 웹 데이터의 키워드 질의 처리를 위한 인덱싱 및 저장 기법 (Indexing and Storage Schemes for Keyword-based Query Processing over Semantic Web Data)

  • 김연희;신혜연;임해철;정균락
    • 한국컴퓨터정보학회논문지
    • /
    • 제12권5호
    • /
    • pp.93-102
    • /
    • 2007
  • 시맨틱 웹에서는 메타데이터와 온톨로지를 이용하여 질의를 처리하기 때문에 보다 정확한 검색 결과를 얻을 수 있을 뿐만 아니라 추론을 통하여 얻어진 새로운 지식도 검색 결과에 포함시킬 수 있다. 메타데이터와 온톨로지를 기술하기 위한 시맨틱 웹 언어 중 RDF와 RDF 스키마가 보편적으로 많이 활용되고 있다. 따라서 RDF와 RDF 스키마로 기술된 시맨틱 웹 언어에 대한 효과적인 검색 기법이 요구된다. 본 논문에서는 키워드 질의 처리 결과의 기본 단위를 전체 웹 문서나 부분이 아닌 정보 리소스로 정의하였다. 그리고 메타데이터와 온톨로지 정보를 모두 고려한 시맨틱 웹 환경의 키워드 질의를 3가지 유형으로 분류하고 다양한 관련 질의에 대한 처리를 효과적으로 지원하기 위하여 키워드 인덱스와 저장 구조를 제안하였다. 본 논문에서 제안한 키워드 인덱스는 질의 조건으로 주어진 키워드를 직접 포함하고 있는 리소스는 물론 의미적 관계에 의해 간접적으로 포함하고 있는 리소스에 관련된 정보를 쉽게 제공할 수 있다. 그리고 본 논문에서는 클래스와 속성의 일반적인 정보와 계층 정보를 단순한 레이블링 기법을 이용하여 표현한 후 제안된 저장 구조를 이용해 정보를 유지하여 시맨틱 웹 환경에 적합한 키위드 질의 처리를 지원하고자 한다.

  • PDF

XML 데이타 색인을 위한 경로 분할 기법 (A Path Partitioning Technique for Indexing XML Data)

  • 김종익;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권3호
    • /
    • pp.320-330
    • /
    • 2004
  • XML에 대한 질의 언어는 데이타 그래프 내의 경로를 이용하여 질의를 표현한다. 특히, 경로에 패턴 (예를 들어, 정규식)을 사용함으로써, 데이타의 구조를 정확히 알지 못하더라도 질의가 가능하도록 한다. 이때, 패턴을 이용하는 질의는 데이타 그래프의 탐색범위를 크게 넓히게 된다. 기존의 XML색인 기법은 질의의 탐색범위를 줄이기 위해 데이타 그래프 내의 서로 동일한 경로들을 하나로 묶어 작은 크기의 색인 그래프를 생성하는 방법을 이용한다. 하지만 이러한 색인들은 많은 경우 색인의 크기가 데이터 그래프의 크기만큼 증가하게 되어 질의의 탐색범위를 줄이지 못하고, 따라서 효율적인 질의 처리를 보장하지 못한다. 본 논문에서는 데이타 내에 존재하는 모든 경로를 분할(partitioning)하고 질의 처리 시 질의에 맞는 분할 영역을 빠르게 찾아낼 수 있는 색인 그래프를 제안한다. 본 논문에서 제안하는 색인 그래프는 데이터 그래프의 크기와 상관없이 색인 그래프의 크기를 조절할 수 있다. 따라서 색인 그래프의 크기를 작게 구성함으로써 색인 그래프 탐색 비용을 크게 줄일 수 있다. 본 논문에서는, 실험을 통해 기존의 그래프 기반색인 기법들보다 본 논문의 색인 기법이 보다 효율적임을 보이고 색인의 크기 변화에 따른 성능 변화에 대해 알아본다.

이동 객체의 효율적인 처리를 위한 갱신 관리 기법 (An Update Management Technique for Efficient Processing of Moving Objects)

  • 최용진;민준기;정진완
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권1호
    • /
    • pp.39-47
    • /
    • 2004
  • 대부분의 시공간 데이타베이스 연구들은 색인 분야에서 진행되었다. 그러나, 색인 연구들은 시공간 색인 유지를 위해서 필요한 엄청난 오버헤드의 고려 없이, 색인 생성 후의 빠른 질의 처리에 초점이 맞추어져 있다. 이 논문에서, 우리는 이동체들의 갱신들을 시공간 색인에 반영하기 위해서 필요한 디스크 액세스 수를 줄이는 효율적인 갱신 관리 방법을 제안한다. 객체의 움직임을 잘 표현할 수 있는 현실적인 갱신 패턴을 고려하여 자주 갱신되는 소수의 객체들을 유지할 수 있는 메모리 구조를 제안한다. 실질적인 갱신 패턴을 고려한 실험 환경에서, 우리의 방법은 기존 색인들의 일반적인 갱신 방법보다 약 40%의 디스크 액세스 수를 줄인다.

Investigation on the Side Effects of Denormalizing Corporate Databases

  • Lee, Sang-Won;Kim, Nam-Gyu;Moon, Song-Chun
    • Journal of Information Technology Applications and Management
    • /
    • 제16권2호
    • /
    • pp.135-150
    • /
    • 2009
  • Corporate databases are usually denormalized, due to the data modelers' impetuous belief that denormalization could improve system performance. By providing a logical insight into denormalization, this paper attempts to prevent every database modeler from falling into the denormalization pit. We indicate loopholes in the denormalization advocates' assertions, and then present four criteria to analyze the usefulness and validity of denormalization; 1) the level of concurrency among transactions, 2) the database independence of the application program, 3) the independence between the logical design and the physical one, and 4) the overhead cost to maintain database integrity under various query patterns. This paper also includes experimental results to evaluate performance of denormalized and fully normalized structures under various workloads.

  • PDF

Hashed B-트리 인덱스를 이용한 효율적인 무결성 검사 (Efficient Integrity Checking using Hashed B-Tree Index)

  • 박선섭;정재목;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제27권2호
    • /
    • pp.216-226
    • /
    • 2000
  • 본 논문에서는 무결성 제약을 효율적으로 유지하기 위한 접근 경로인 Hashed B-트리를 제안하고, 기존의 B-트라와 성능을 비교한다. 무결성 제약을 만족시키기 위해 필요한 질의 패턴들이 종점 질의로 구성되어 있다는 점에 착안하여, Hashed B-트리는 키를 해슁을 통해 압축하여 저장한다. 따라서 트리의 높이가 줄어들게 되고 트리의 탐색이 빠르다. 이 기법은 기존의 B-트리와 유사하게 작동하기 때문에 기존 시스템에 많은 수정을 요하지 않고 병행성 제어나 회복 기법을 그대로 사용할 수 있는 장점이 있다.

  • PDF

A Study on De-Identification of Metering Data for Smart Grid Personal Security in Cloud Environment

  • Lee, Donghyeok;Park, Namje
    • Journal of Multimedia Information System
    • /
    • 제4권4호
    • /
    • pp.263-270
    • /
    • 2017
  • Various security threats exist in the smart grid environment due to the fact that information and communication technology are grafted onto an existing power grid. In particular, smart metering data exposes a variety of information such as users' life patterns and devices in use, and thereby serious infringement on personal information may occur. Therefore, we are in a situation where a de-identification algorithm suitable for metering data is required. Hence, this paper proposes a new de-identification method for metering data. The proposed method processes time information and numerical information as de-identification data, respectively, so that pattern information cannot be analyzed by the data. In addition, such a method has an advantage that a query such as a direct range search and aggregation processing in a database can be performed even in a de-identified state for statistical processing and availability.

HTML 태그페턴을 이용한 웹정보추출시스템 (Web Information Extraction using HTML Tag Pattern)

  • 박병권
    • 한국정보시스템학회:학술대회논문집
    • /
    • 한국정보시스템학회 2005년도 춘계학술대회 발표 논문집
    • /
    • pp.79-92
    • /
    • 2005
  • To query the vast amount of web pages which are available i]l the Internet, it is necessary to extract the encoded information in the web pages for converting it into structured data (e.g. relational data for SQL) or semistructured data (e.g. XML data for XQuery), In this paper, we propose a new web information extraction system, PIES, to convert web information into XML documents. PIES is based on a user-specified target schema and HTML tag pattern descriptions. The web information is extracted by the pattern descriptions and validated by the target schema. We designed a new language to describe extraction rules, and a new regular expression to describe HTML tag patterns. We implemented PIES and applied it to the US patent web site to evaluate its correctness. It successfully extracted more than thousands of US patent data and converted them into XML documents.

  • PDF

온라인 목록의 탐색 유형 : 관련된 변수와 사용된 서지사항을 중심으로 (Online Catalog Search Patterns : variables and bibliographic data)

  • 곽철완
    • 한국문헌정보학회지
    • /
    • 제30권2호
    • /
    • pp.87-106
    • /
    • 1996
  • 본 논문의 목적은 이용자가 온라인 목록을 탐색할 때, 어떤 서지정보를 이용하여 다음 화면으로 진행하며, 어떤 요소가 서지정보 선정에 영향을 미치는 가를 조사하는데 있다. 결과는 온라인 목록의 초기화면에서 실험 참가자가 선택한 접근 점은 온라인 목록과 탐색질의에 따라 변하지만 이용자의 종류의 따라서는 변하지 않는 것으로 나타났다. 간략정보화면에서 상세정보화면으로 이동하기 위해 실험 참가자들은 서명을 가장 많이 사용하였고, 상세 정보화면에서 탐색결과를 확인하기 위해서도 역시 서명을 가장 많이 사용하였다.

  • PDF

웹 검색 개인화를 위한 개념네트워크 프로파일 기반 순위 재조정 기법 (New Re-ranking Technique based on Concept-Network Profiles for Personalized Web Search)

  • 김한준;노준호;장재영
    • 한국인터넷방송통신학회논문지
    • /
    • 제12권2호
    • /
    • pp.69-76
    • /
    • 2012
  • 본 논문은 웹 검색 개인화를 실현하기 위해 개념네트워크 구조의 사용자 프로파일에 기반한 새로운 형태의 순위 재조정 기법을 제안한다. 기본적으로 개인화 검색은 개인 사용자의 검색 성향을 담고 있는 사용자 프로파일을 기반으로 이루어지며, 이를 활용하여 초기에 주어진 검색 질의어를 확장하거나 검색결과의 순위를 재조정하게 된다. 제안 기법은 순위 재조정 기법을 주축으로 질의어 확장 기법을 융합한 형태를 취한다. 기본 아이디어는 사용자 프로 파일에 의해 추천된 확장 질의어로부터 도출된 문서집합들에 공통적으로 출현하는 문서들의 중첩도를 평가하여, 그 결과값을 순위 재조정에 활용하는 것이다. 성향이 다른 다수의 실험자들이 검색 질의어 유형을 구분하여 실험을 수행함으로써 제안기법이 기존 기법에 비해 우수함을 보인다.