• 제목/요약/키워드: XML data filtering

검색결과 22건 처리시간 0.022초

PrimeFilter: 소수 인덱싱 기법에 기반한 효율적 XML 데이타 필터링 (PrimeFilter: An Efficient XML Data Filtering based on Prime Number Indexing)

  • 김재훈;김상욱;박석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권5호
    • /
    • pp.421-431
    • /
    • 2008
  • 최근 이질적인 시스템 사이에서의 정보교환의 표준으로 널리 사용되는 XML을 사용하는 Publish/Subscribe 시스템의 스트리밍 XML 데이타 필터링 기법이 활발히 연구되었다. 스트리밍 XML 데이타 필터링 기법은 사용자가 등록한 질의에 대해서 신속한 질의-데이타 매칭을 목적으로 하기 때문에 효율적인 질의 처리 메커니즘이 요구된다. 현재까지 대부분의 연구는 질의 경로 표현식의 부분적인 공유를 꾀하거나 프레디킷을 효율적으로 처리함으로써 질의 처리의 시간적, 공간적 효율을 목적으로 하였다. 하지만 만약 질의간의 포함 관계를 알 수 있다면 질의 처리시에 가장 하위의 질의가 매칭되면 그 질의를 포함하고 있는 상위의 질의들은 별도의 처리 과정 없이 매칭됨을 알 수 있게 된다. 이러한 질의 포함 관계를 이용한 질의 처리 방식은 XML 스트리밍 데이타를 처리하는 또 하나의 효율적 방식이 될 수 있다. 본 논문에서는 소수 인덱싱 기법과 목표 질의 노드 중심의 포함 관계 설정에 기반하여 효율적인 스트리밍 XML 데이타 필터링을 수행하는 새로운 방법을 소개한다. 그리고 몇 가지 실험을 통하여 기존 방법과의 비교 분석 및 효율성을 보인다. 비록 각각의 실험은 서로 다른 실험 요소에 대하여 수행되었지만, 모두 제안 방법이 기존의 방법보다 두 배 이상 더 나은 성능을 가짐을 보여 주었다.

SemFilter: 단순하며 효율적인 시맨틱 XML 메시지 필터링 (SemFilter: A Simple and Efficient Semantic XML Message Filtering)

  • 김재훈;박석
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권7호
    • /
    • pp.680-693
    • /
    • 2008
  • XML 메시지 필터링에 관한 최근의 연구들은 모든 출판되는 데이타 소스들이 필터링 시스템에 정의된 유일한 전역 스키마를 따르는 것을 가정한다. 하지만 이러한 가정을 넘어서, 데이타 제공자들이 그들 자신의 스키마를 자유롭게 사용할 수 있는 서비스를 고려할 수 있다. 즉, 데이타 소스들이 이질적인 환경이다. 하지만 XML 필터링 시스템에서 데이타 소스는 다수이며, 또한 출판되는 데이타들은 수시로 생성되고, 갱신되며, 사라진다. 즉, 매우 다이내믹한 환경이다. 본 논문에서는 그러한 다이내믹한 환경을 고려하여 고안된 단순하며 효율적인 의미적 XPath 질의 번역 구현을 소개한다. 특별히 제안되는 질의 번역 기법은 어떤 비주얼한 데이타 가이드가 제공되지 않는 환경에서 사용자가 자신의 지식과 경험에만 의존하여 작성한 질의를 번역하는 것에 초점을 맞춘다. 이러한 환경에서, 사용자는 다수의 이질적인 데이타를 질의하기 때문에, 사용자의 기억상의 스키마에 의존하여 작성된 질의는 실제 스키마와 불일치할 수 있다. 본 연구에서는 제안하는 의미적 XPath 질의 기법이 이러한 문제를 고려하도록 설계한다. 몇 가지 실험 결과는 제안된 질의 번역 기법이 수용할 만한 질의 번역시간을 제공하며, 기존의 방법과 비교하여 실제적임을 보여 준다.

XML 필터링 질의의 효율적 처리를 위한 이차원 그룹핑 색인기법 (Two-Dimensional Grouping Index for Efficient Processing of XML Filtering Queries)

  • 여대휘;이종학
    • 정보화연구
    • /
    • 제10권1호
    • /
    • pp.123-135
    • /
    • 2013
  • 본 논문에서는 XML 필터링 질의의 효율적 처리를 위한 이차원 그룹핑 색인기법인 2DG-index를 제안한다. 최근 XML데이터의 질의 처리를 위해 조상-후손관계 또는 부모-자식관계 등의 구조적 관계를 효율적으로 처리하기 위한 많은 연구들이 수행되었다. 그러나 이러한 연구들은 경로 질의에만 초점을 두고 있으며 특정 조건 값을 포함하는 필터링 질의에 대해서는 고려하지 않고 있다. 2DGindex는 필터링 질의를 효율적으로 처리하기 위한 방안으로 XML 스키마의 경로 도메인과 필터링 데이터 값의 도메인으로 구성된 이차원 도메인 공간상의 색인 엔트리들의 클러스터링을 다루는 색인기법이다. 2DG-index의 성능평가를 위하여 특정 조건 값을 포함하는 질의의 유형을 세 가지로 분류하고, 이러한 질의 유형별로 2DG-index의 질의처리 성능을 기존의 일차원 색인구조를 이용하는 색인기법인 데이터 값별로 그룹핑한 DG-index와 경로별로 그룹핑한 PG-index와 비교하여 2DG-inedx의 효율성을 입증한다.

스트리밍 XML 데이타를 위한 효율적인 다중 질의 처리 기법 (An Efficient Multi-Query Evaluation Technique for Streaming XML Data)

  • 민준기;박명제;정진완
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권3호
    • /
    • pp.270-281
    • /
    • 2007
  • 현재 스트리밍 XML 데이타에 대한 관심이 점차 증가한다. 스트리밍 XML 데이타에 대한 대부분의 연구는 XML 데이타를 효율적으로 여과하는 기법에 초점을 맞추었다. 이러한 XML 여과 시스템들은 사용자들이 관심 있는 XML 문서 전체를 사용자들에게 제공한다. 이 경우, 제공된 XML 문서들로부터 관심 있는 부분만을 추출하는 부담이 사용자에게 남겨지게 된다. 따라서, 스트리밍 XML 데이타에 대하여 직접적으로 질의 처리를 수행하여 관심 있는 XML 부분만을 추출하는 스트리밍 XML 질의 처리 기법들이 제안되었다. 그러나, 기존의 스트리밍 XML 질의 처리 기법들은 제안된 XPath 질의 만을 지원하며 복수 개의 질의 문을 처리하지는 못하고 있다. 본 논문에서는 스트리밍 데이타의 한 번 읽는 특성에 따라 XML 데이타를 한 번 읽으면서 복수 개의 질의들을 동시에 처리하는 XTREAM을 제안하고자 한다. 또한, XTREAM은 기존의 기법들에 비하여 순서 기반 프리디케이트 등 다양한 종류의 XPath 질의 기능들을 지원한다. 실제 XML 데이타와 합성 XML 데이타를 통한 실험 결과들은 XTREAM의 효율성과 확장성을 보인다.

부분매칭 경로질의를 위한 포스트픽스 공유에 기반한 스트리밍 XML 데이타 필터링 기법 (A Filtering Technique of Streaming XML Data based Postfix Sharing for Partial matching Path Queries)

  • 박석;김영수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권1호
    • /
    • pp.138-149
    • /
    • 2006
  • 센서 네트워크나 유비쿼터스 환경이 보급되면서 최근에는 저장되어 있는 데이타가 아닌 계속적으로 빠르게 지나가는 스트리밍 데이타에 대한 연구가 활발하게 이루어지고 있다. 기존의 Publish-Subscribe 시스템도 인터넷의 발달로 데이타가 실시간으로 빠르게 들어오는 스트리밍 데이터의 형태를 가지게 되면서 스트리밍 데이타 연구에 관심을 가지게 되었고 이 중에서도 웹 환경의 표준으로 많이 사용되는 XML에 관심을 가지게 되었다. Publish-Subscribe 시스템에서 서버에 들어오는 스트리밍 XML 데이타에 대해서 질의에 빠르게 매치(match)되는 것을 찾기 위한 스트리밍 XML 데이타 필터링 기법이 오토마타를 이용해서 연구되었으며, 이중에서 비결정적 오토마타를 사용한 방법이 YFilter이다. 비결 정적 오토마타를 사용하는 YFilter의 경우 질의 앞부분의 공통된 오퍼레이터를 한번에 계산하기 위해서 XPath 질의의 공통된 앞부분을 공유하고 질의의 루트부터 처리하는 하향식 방식을 사용하고 있다. 하지만, 부분매칭 경로질의의 경우에는 질의의 앞부분 공유를 방해하고 질의를 루트에서부터 처리할 필요가 없기 때문에 YFilter에서 부분매칭 경로질의가 증가하면 처리량이 떨어지는 문제가 발생한다. 본 논문에서는 이 문제 대해 XPath 질의의 공통된 뒷부분 공유에 기반한 상향식 방식을 사용하는 PoSFilter를 한가지 해결책으로 제시한다. 그리고 YFilter와 PoSFilter의 처리량을 비교를 통해서 PoSFilter의 경우 부분매칭 경로질의가 증가할 때 YFilter보다 좋은 처리량을 나타내는 것을 검증한다.

점진적 갱신에 기반을 둔 XML 형성뷰 관리 프레임워크 (A Framework of XML Materialized Views Using Incremental Refresh)

  • 임재국;강현철;서상구
    • 정보처리학회논문지D
    • /
    • 제8D권4호
    • /
    • pp.327-338
    • /
    • 2001
  • 뷰는 이질적인 데이터의 통합 및 여과(filtering) 기능을 통해서 사용자가 요구하는 데이터를 제공한다. 뷰는 질의 처리의 성능 향상을 위해 형성뷰(materialized view)로 유지될 수 있다. 형성뷰는 하부 데이터가 변경되었을 경우에 일관성을 유지해야하는데, 그 기법으로는 뷰의 재생성(recomputation)과 변경 내용 중 뷰와 관련이 있는 것만 반영하는 점진적 갱신(incremental refresh)이 있다. XML은 문서의 구조정보를 나타낼 수 있으므로 XML 형성뷰에 대해서는 기존의 관계 형성뷰 등의 관리 기법과는 다른 관리 기법이 요구된다. 본 논문에서는 XML 문서들을 대상으로 생성된 XML 형성뷰를 지원하고, 하부 XML 문서가 변경되었을 경우에 형성뷰에 대해 점진적 갱신을 지원하는 XML 형성뷰 관리 프레임워크를 제안한다.

  • PDF

XML 뷰 인덱싱 (XML Vicw Indexing)

  • 김영성;강현철
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권3호
    • /
    • pp.252-272
    • /
    • 2003
  • 뷰는 이질적인 데이타의 통합 및 여과(filtering) 기능을 통해서 데이타베이스의 필요한 부분을 제공한다. 많은 정보가 쏟아지고 있는 웹 환경의 데이타 교환 표준인 XML에 대해서도 뷰의 개념은 유용하다. 본 논문은 XML 뷰 인덱싱이라고 명명한 XML 뷰를 구현하는 기법을 제안한다. XML 뷰는 XML 뷰에 대한 정보와 더불어 뷰를 구성하는 하부 XML 엘리먼트에 대한 식별자를 저장하는 구조인 XML 뷰 인덱스로 표현된다. XML 뷰 인덱스가 XML 엘리먼트 자체가 아닌 식별자만을 저장하므로, 사용자가 XML 뷰를 요청하면 하부 XML 문서를 기반으로 XML 뷰를 실체화해야 한다. 또한, 하부 XML 문서에 대한 변경에 대하여 XML 뷰 인덱스의 일관성을 유지하기 위한 효율적인 점진적 갱신 기법이 필요하다. 본 논문에서는 XML 뷰 인덱싱을 위한 자료구조와 알고리즘을 제안하고 구현하였다. 성능 평가 결과 XML 뷰 인덱싱을 사용하는 것이 매번 뷰를 재생성하는 경우보다 질의 재수행 시간이 적게 걸렸다. XML 뷰 인덱싱 기법이 실체화 시간으로 인해 XML 실체뷰 기법보다 질의 재수행 시간은 많이 걸리지만, 저장 공간 면에서는 약 30배 정도 효율적인 것으로 나타났다.

Peer-to-Peer 네트워크 상에서 XML 데이터의 효율적이고 안전한 배포 방식에 관한 연구 (An Efficient Secure Dissemination of XML data in Peer-to-Peer Networks)

  • 고혁진;강우준
    • 한국산학기술학회논문지
    • /
    • 제8권3호
    • /
    • pp.528-534
    • /
    • 2007
  • XML이 인터넷 상에서 수많은 정보의 표현과 교환의 표준으로 자리매김해감에, XML 데이터를 안전하고 효율적으로 배포하기 위한 방법의 강구가 강력히 요구 되는 추세이다. 특히 Peer-to-Peer와 같은 환경에서 그런 경향은 더욱 두드러지고 있다. 지금까지의 SDI 연구는 user profiling 에 대해 새로 입수되는 XML source에 대한 match(filtering 문제)에 관련된 문제에 집중, 효율적 배포와 관련된 연구가 드문 실정이며, 효율적 배포에 관련된 소수의 기존연구에서도 중앙집중식 관리방식을 사용함으로써 Peer-to-Peer와 같은 분산환경에는 바로 적용시키기가 어렵다. 본 논문에서는 이러한 특징을 가지고 있는Peer-to-Peer 환경에서 인가정책과 비밀분산을 이용함으로써 안전하고 확장이 용이한 XML 데이터의 배포 방법을 제안한다.

  • PDF

대용량 데이터처리를 위한 XML기반의 RFID 미들웨어시스템 (RFID Middleware System based on XML for Processing Large-Scale Data)

  • 박병섭
    • 한국콘텐츠학회논문지
    • /
    • 제7권7호
    • /
    • pp.31-38
    • /
    • 2007
  • 본 논문에서는 대용량 데이터 처리를 위한 XML 기반 RFID 미들웨어 시스템을 구현하였다. 개발된 RFID 미들웨어 시스템은 태그 데이터를 수집하는 리더 인터페이스, 태그 데이터를 의미있는 데이터로 가공하여 응용인터페이스에게로 전송하는 이벤트 매니저, 그리고 기존 응용과의 인터페이스를 위해 다양한 응용접근프로토콜을 지원하는 응용 인터페이스를 설계 구현하였다. 리더 인터페이스는 고정형 장비뿐만 아니라 핸드헬드 유형의 PDA형 리더도 지원하도록 어댑터 형태로 구현되었다. 구현된 미들웨어 시스템은 빠른 필터링 처리기능을 가지며, 응용프로그램 접근 프로토콜인 HTTP, XML, JMS, SOAP을 지원한다. 성능은 CPU 이용율 측면에서 성능을 입증하였다.

실시간 RFID 미들웨어시스템에서의 동기화를 고려한 필터링관리 기법의 설계 및 구현 (Design and Implementation of Filtering Management Scheme for Synchronization in the Realtime RFID Middleware System)

  • 박병섭
    • 한국콘텐츠학회논문지
    • /
    • 제7권8호
    • /
    • pp.50-58
    • /
    • 2007
  • 본 논문은 대용량 데이터 처리를 위한 실시간 RFID 미들웨어 시스템에서 요구되는 태그 데이터의 필터링 엔진의 동기화를 고려한 필터링 관리기법을 다루고 있다. 응용인터페이스는 HTTP, XML, JMS, SOAP 등의 이는 다양한 프로토콜을 지원하여 다양한 플랫폼에서 본 미들웨어 시스템을 접근하도록 개발되었다. 일반적으로, 필터를 제어하는 클라이언트가 다수가 되는 환경에서 하나의 필터링 화일을 접근하면 동기화 문제가 발생한다. 본 논문에서는 필터 관리프로세스를 통해 동기화를 고려하면서 필터링을 관리하는 기법을 설계하고 구현하였으며, 이를 RFID 미들웨어의 동작 통해 검증한다.