• Title/Summary/Keyword: 색인구성

Search Result 350, Processing Time 0.036 seconds

An Efficient Dynamic Indexing Model for Various Structure Retrievals of XML Documents (XML 문서의 다양한 구조 검색을 위한 효율적인 동적 색인 모델)

  • 신승호;손충범;강형일;유재수
    • Journal of KIISE:Databases
    • /
    • v.31 no.1
    • /
    • pp.48-60
    • /
    • 2004
  • XML documents consist of elements that are basic units of information. When the structure of XML documents is changed dynamically, we need to update structure information efficiently without changing the information of the index structure for fast retrieval. In this paper, we propose a dynamic indexing model scheme that updates the index structure in real time as the structure of XML documents is changed by insertion and deletion of elements. Our dynamic indexing model consists of a structure information representation method and a dynamic index structure. The structure information representation method supports various types of structure retrievals. Our dynamic index structure processes various structural queries efficiently. We show through various experiments that our method outperforms existing ones in processing various types of queries such as content based queries, structural queries and hybrid queries.

2D-THI: Two-Dimensional Type Hierarchy Index for XML Databases (2D-THI: XML 데이테베이스를 위한 이차원 타입상속 계층색인)

  • Lee Jong-Hak
    • Journal of Korea Multimedia Society
    • /
    • v.9 no.3
    • /
    • pp.265-278
    • /
    • 2006
  • This paper presents a two-dimensional type inheritance hierarchy index(2D-THI) for XML databases. XML Schema is one of schema models for the XML documents supporting. The type inheritance. The conventional indexing techniques for XML databases can not support XML queries on type inheritance hierarchies. We construct a two-dimensional index structure using multidimensional file organizations for supporting type inheritance hierarchy in XML queries. This indexing technique deals with the problem of clustering index entries in the two-dimensional domain space that consists of a key element domain and a type identifier domain based on the user query pattern. This index enhances query performance by adjusting the degree of clustering between the two domains. For performance evaluation, we have compared our proposed 2D-THI with the conventional class hierarchy indexing techniques in object-oriented databases such as CH-index and CG-tree through the cost model. As the result of the performance evaluations, we have verified that our proposed two-dimensional type inheritance indexing technique can efficiently support the query Processing in XML databases according to the query types.

  • PDF

A Study on Automatic Indexing System Using natural language Processing, Statistical Technique, Relevance Verification (자연어 처리, 통계적 기법, 적합성 검증을 이용한 자동색인 시스템에 관한 연구)

  • Yu, Chun-Sik;U, Seon-Mi;Yu, Cheol-Jung;Lee, Jong-Deuk;Gwon, O-Bong;Kim, Yong-Seong
    • The Transactions of the Korea Information Processing Society
    • /
    • v.5 no.6
    • /
    • pp.1552-1562
    • /
    • 1998
  • 형태소 분석(Morphological Analysis)과 같은 언어학적 처리에 의존하는 기존의 한국어 문헌에 대한 자동색인 기법들은 품사의 애매모호함이나 복합명사의 처리 등으로 부담(overhead)이 크다. 또한 불용어 처리에 사용되는 불용어 리스트가 대상 문헌의 주제 분야별로 따로 구축되어야 하며 그 크기가 방대하다는 문제점이 있다. 이러한 문제점들을 해결하기 위해, 본 논문에서는 각 문헌의 텍스트에 대해 복합명사 처리나 애매모호함에 대한 엄격한 분석을 수행하지 않는 간단한 형태의 형태소 분석을 수행하여 단순명사들을 추출한다. 그런 후 이들 단순명사들을 이용하여 유한 오토마타(Finite Automata)를 구성하고, 구성된 유한 오토마타와 각 명사의 단어빈도(Term Frequency)에 의해 각 색인어 후보들의 중요도를 계산하는 자동색인 기법을 제안한다. 그 결과 품사의 애매모호함에 대한 처리나 복합명사의 처리에따른 부담을 줄일 수 있었으며, 선정된 색인어들과 수작업으로 선정한 색인어들의 비교 실험에 의해 제안한 자동색인 기법의 성능을 검증하였다.

  • PDF

The Design of Moving Objects Index Using the Grid File (그리드 파일을 이용한 메인 메모리 이동체 색인의 설계)

  • Lee, Seoung-Il;Ahn, Kyoung-Hwan;Hong, Bong-Hee
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 2003.11a
    • /
    • pp.129-134
    • /
    • 2003
  • 이동체란 시간 변화에 따라 연속적으로 위치가 변화하는 객체를 말한다. 이러한 이동체는 기존의 공간 데이터와는 달리 이동체의 위치변경 보고에 따라 지속적인 갱신연산을 발생시키는 특징을 가지고 있다. 이동체의 현재 색인에 있어 트리 기반의 색인 구조는 빈번한 갱신에 대한 색인의 변경 비용이 크므로 부적합하다. 확장 해쉬 기반의 그리드 파일 색인은 갱신연산의 비용이 적고, 그리드를 동적으로 구성하므로 공간 활용도가 높으며 영역 질의에 우수한 장점을 가지고 있다. 그러나 빈번한 갱신연산으로 인하여 해당 색인의 반복적인 분할/합병 비용을 발생시키는 문제점을 가지고 있다. 이 논문에서는 메인 메모리 기반의 그리드 파일을 구성하고, 빈번한 갱신연산에 따른 색인의 반복적인 분할/합병 비용을 제거하기 위한 합병정책을 제안한다. 특히 시간에 따라 해당 이동체의 수가 지역에 따라 변화하므로 이동체의 이동을 고려한 합병정책을 제안한다.

  • PDF

An Efficient Concurrency Control Algorithm for High-Dimensional Index Structures (고차원 색인구조를 위한 효율적인 동시성 제어 알고리즘)

  • 최길성;이석희;송석일;유재수;조기형
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10b
    • /
    • pp.54-56
    • /
    • 1998
  • 동시에 다수의 사용자가 빠른 속도로 이미지 검색이 가능하도록 지원해주는 고차원 색인구조에 대한 효율적인 동시성 제어 방법은 매우 중요하지만 이에 대한 연구는 부족한 실정이다. 기존에 제안된 방법인 RLINK-트리는 링크를 적용시켜 다른 기법들에 비해 향상된 효율을 갖고 있지만 고차원 색인구조에 적용할 경우에는 문제가 발생한다. RLINK-트리에서는 고차원 색인구조의 효율적인 구성을 위한 재삽입 연산에 대한 동시성 제어를 고려하지 않고 있으며, 트리의 일관성을 유지하기 위해서 동시성 효율이 낮은 잠금 결합 방법을 사용하기 때문에 고차원 색인구조의 동시성 제어 기법에 그대로 적용하기에는 한계가 있다. 따라서, 본 논문에서는 고차원 색인구조의 효율적인 트리구성을 위해 수행되는 재삽입의 동시성 문제를 해결하면서 동시성 수준을 향상시킨 새로운 동시성 제어 알로리즘을 제안하고, 제안된 알로리즘을 고차원 색인구조에 적용시켜 동시성 제어가 효율적으로 제공될 수 있음을 증명한다.

A Type Hierarchy Index for XML Databases with XML Schema (XML Schema에 의한 XML 데이타베이스의 타입 상속 색인구조)

  • Lim Yun-Ju;Lee Jong-Hak
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.11a
    • /
    • pp.85-88
    • /
    • 2004
  • 최근 XML데이터베이스는 웹의 발전과 더불어 광범위한 인터넷의 자원 공유에 크게 기여하고 있으며 이러한 자원 공유를 위해서는 XML데이타베이스에 대한 구조적 정의로 타입 상속 구조를 가지는 XML Schema를 사용한다. 그러므로 XML Schema를 따르는 XML데이타베이스에 대한 효율적인 색인기법에 대한 연구가 필요하다. 따라서 본 논문에서는 기존의 다차원 색인구조와 사전에 분석한 사용자 질의 패턴에 대한 정보를 이용하여 주어진 질의들에 의해서 액세스되는 색인 페이지의 평균 개수가 최소가 되게 하는 최적의 이차원 타입 색인 구조를 구성 할 수 있는 2D-THI를 제안한다. 제안한 2D-THI의 성능을 비교 평가하기 위해서 기존의 객체지향 데이터베이스에서 클래스 상속에 대한 색인구조로 널리 사용되고 있는 CH-index와 CG-tree를 XML데이타베이스에 적용하여 이들과 2D-THI를 비용모델을 통해서 비교 분석한다. 그 결과로 본 논문에서 제안한 2D-THI로서 다양한 질의 패턴에 대해서 최적의 색인구조를 구성할 수 있음을 보인다.

  • PDF

Phrase search using posting file in Korean Information Retrieval System (Posting File을 이용한 구절 검색 방법)

  • 박대원;박민식;박진희;권혁철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.384-386
    • /
    • 2000
  • Posting file은 문서 내의 색인어와 색인어의 위치 정보-문장번호, 어절 번호 등으로 구성한 문서별 색인어 역파일(inverted file)이다. 본 논문에서는 posting file을 구성하고 이를 정보검색시스템에 적용하여 색인어의 어절 거리 계산에 의해 구절 검색이 가능한 정보검색시스템을 소개한다. 또한 사용자 질의문과 가장 유사한 문장을 검색결과 대표문장으로 제시하여 사용자가 검색결과를 쉽게 확인할 수 있는 방법을 제시한다.

  • PDF

Searching Spatial Data of Wireless Devices using GIS agents (GIS 에이전트를 이용한 무선 단말기의 공간데이터 검색)

  • 이재호;임덕성;홍봉희
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10a
    • /
    • pp.199-201
    • /
    • 2001
  • 무선 단말기는 저장공간, 연산능력, 통신등에 대한 계약을 가지고 있다. 무선 단말기의 공간데이터 검색의 경우 사용자의 요구를 효과적으로 처리하기 위해서 질의 생성, 데이터 관리, 색인관리등과 같은 연산들을 필요로 한다. 그러나 추가되는 영역과 저장된 영역의 데이터 사이에 중복객체가 존재하는 문제가 있고 추가되는 영역에 대해 색인을 구성하기 위해 공간 데이터의 정렬과 같은 고비용의 연산이 필요하다. 특히 무선 단말기에서 색인관리는 서버로부터 공간 데이터를 전송받을 때 마다 색인을 재 구성하기 위해 Bulk-Insertion 기법의 사용이 효율적이다. 따라서 이 논문에서는 낮은 컴퓨팅 능력을 가지는 무선 단말기에서 고비용의 연산 처리를 줄이기 위해 데이터 정렬, 색인 구성 등의 연산을 처리하는 에이전트를 제시한다.

  • PDF

Construction of Theme Melody Index by Transforming Melody to Time-series Data for Content-based Music Information Retrieval (내용기반 음악정보 검색을 위한 선율의 시계열 데이터 변환을 이용한 주제선율색인 구성)

  • Ha, Jin-Seok;Ku, Kyong-I;Park, Jae-Hyun;Kim, Yoo-Sung
    • The KIPS Transactions:PartD
    • /
    • v.10D no.3
    • /
    • pp.547-558
    • /
    • 2003
  • From the viewpoint of that music melody has the similar features to time-series data, music melody is transformed to a time-series data with normalization and corrections and the similarity between melodies is defined as the Euclidean distance between the transformed time-series data. Then, based the similarity between melodies of a music object, melodies are clustered and the representative of each cluster is extracted as one of theme melodies for the music. To construct the theme melody index, a theme melody is represented as a point of the multidimensional metric space of M-tree. For retrieval of user's query melody, the query melody is also transformed into a time-series data by the same way of indexing phase. To retrieve the similar melodies to the query melody given by user from the theme melody index the range query search algorithm is used. By the implementation of the prototype system using the proposed theme melody index we show the effectiveness of the proposed methods.

Design and Implementation of Time Division Framework for Indexing Numerous Moving Objects (대용량 이동체의 색인을 위한 시간축 분할 프레임웍의 설계 및 구현)

  • 조대수;임덕성;박종현
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04a
    • /
    • pp.722-724
    • /
    • 2003
  • 이동체 데이터베이스에서는 대용량의 위치정보를 효과적으로 저장, 검색하기 위해 이동체 색인을 이용한다. 이동체 색인은 시간에 지남에 따라 검색 영역이 증가하고, 관리해야 하는 위치정보의 양이 커지게 되므로, 삽입 검색, 삭제 연산의 성능이 계속해서 저하되는 문제가 있다. 이 논문에서는 기존의 이동체 색인을 시간축으로 분할하여 관리하기 위한 시간축 분할 프레임웍을 제안하고, 기존의 TB-tree 및 STR-tree에 대해서 제안한 프레임웍에 적용하였다. 시간축 분할 프레임웍은 전체 시간 도메인에 대해서 하나로 구성되는 색인을 시간 구간별로 쪼개어서 여러 색인으로 구성하여 관리함으로서, 위치정보의 삽입 및 검색 비용을 줄일 수 있으며, 오래된 위치정보에 대한 삭제 연산을 효과적으로 처리할 수 있다.

  • PDF