• 제목/요약/키워드: XML 클러스터링

검색결과 36건 처리시간 0.031초

무선 방송을 위한 효과적인 XML 스트리밍 (Effective Streaming of XML Data for Wireless Broadcasting)

  • 박준표;박창섭;정연돈
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권1호
    • /
    • pp.50-62
    • /
    • 2009
  • 방송 기법을 통한 데이타의 전달은 대역폭 활용의 이점과 에너지 효율성, 확장성으로 인해 무선 모바일 환경에서 효과적인 방법으로 알려져 있다. 본 논문에서는 무선 방송 환경에서 트리 기반의 색인 구조를 사용하기 때문에 이동 사용자의 접근 시간이 증가하는 "질의 처리의 지연 문제"를 다루고 있다. 본 논문에서는 "질의 처리의 지연 문제"를 해결하기 위한 분산 색인 구조와 함께 XML 데이타의 에너지 및 접근 시간 효율적인 방송을 위한 클러스터링 방법을 제안한다. 먼저 분산 색인 구조를 구현하기 위해 엘리먼트의 태그 이름과 애트리뷰트, 그리고 텍스트와 색인 정보를 포함하고 있는 DIX 노드 구조를 제안한다. 모바일 사용자는 DIX 노드에 포함되어 있는 색인 정보를 통해 무선 XML 스트링에서 보다 짧은 지연 시간만으로 원하는 정보에 접근할 수 있다. 또한, 질의 처리를 위한 탐색 범위를 한정시킴으로써 질의 처리에 소요되는 접근 시간과 튜닝 시간을 단축시킬 수 있는 클러스터링 정책을 제안한다. 성능 평가 실험을 통해 제안 방법이 기존의 XML 데이타 방송 기법들에 비해 우수함을 확인할 수 있다.

MPEG-7 문서 관리를 위한 효율적인 저장 방법 (A Effective Storage Method for Managing of MPEG-7 Document)

  • 안병태;이종하;정범석
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2006년도 추계 종합학술대회 논문집
    • /
    • pp.637-641
    • /
    • 2006
  • 제한된 자원 하에서 멀티미디어 컨텐츠를 이용하기 위해서는 XML로 표현되는 MPEG-7 문서의 효율적인 관리 방법이 필요하다. 이 때 XML 문서 클러스터링 방법들을 이용할 수 있겠으나 보다 효율성을 높이기 위해 MPEG-7 문서의 특성을 반영한 새로운 방법이 요구된다. 본 논문에서는 MPEG-7 문서를 효율적으로 관리하기 위해 MPEG-7 문서의 엘리먼트들 사이에 나타나는 의미 관련성을 이용해 저장할 수 있는 새로운 클러스터링 방법을 제안하고, 이를 기존 방법들과 비교하였다.

  • PDF

통합 XML 스키마의 효율적인 추출 (An Efficient Extraction of An Integrated XML Schema)

  • 임태우;강혜란;이경호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.43-45
    • /
    • 2005
  • XML 스키마의 수가 급증함에 따라 동일한 도메인에 속하는 유사한 스키마를 통합하는 방법에 대한 관심이 증가하고 있다. 일반적으로 XML 스키마 통합 과정은 스키마 클러스터링과 통합 스키마 추출의 두 단계로 구성된다. 본 논문에서는 통합 스키마의 추출을 위한 효율적인 방법을 제안한다. 제안된 방법은 공통 구조 추출, 스키마 통합, 그리고 최적화의 세 단계로 이루어진다. 실험결과, 제안된 방법은 처리시간 및 정확도 측면에서 우수란 결과를 보였다.

  • PDF

XML 문서의 유사 경로 검색을 위한 인덱싱 시스템 (An Indexing System for Retrieving Similar Paths in XML Documents)

  • 이범석;황병연
    • 정보처리학회논문지D
    • /
    • 제15D권2호
    • /
    • pp.171-178
    • /
    • 2008
  • 1998년 W3C에 의해 XML 표준이 제정된 이래로, XML을 사용하는 문서가 급증하였다. 이에 따라 방대한 양의 XML 문서들을 효율적으로 관리하고 검색하기 위한 많은 시스템들이 개발되고 있다. 특히 비트맵 인덱스 기법을 사용한 BitCube는 이러한 분야의 대표적인 시스템이다. 비트맵 인덱스 기법을 이용하여 유사한 경로를 대상으로 클러스터링을 수행한 경로 비트맵 인덱스 시스템(LH06)은 기존의 BitCube 시스템이 유사경로 검색을 할 수 없는 문제점을 개선하였다. 유사경로 검색 시스템은 정확히 일치하는 경로뿐만 아니라, 사용자가 질의한 경로와 유사한 경로까지도 빠르게 검색해 낼 수 있다는 장점을 가진다. 그러나 경로 사이의 유사도를 계산하는 알고리즘이 가진 몇 가지 문제점들로 인해 유사하다고 볼 수 있는 두 경로의 유사도를 계산할 수 없어서 서로 다른 클러스터로 인식되고, 이는 의미 없는 클러스터의 수를 증가시키는 문제점을 야기한다. 이러한 문제점의 해결을 위해 본 논문에서는 보다 합리적이고 정확한 경로 유사도 계산 방법을 제안하고, 기존 시스템과의 성능평가를 통해 제안하는 방법이 더 낫다는 것을 증명한다.

경로 기반의 XML 문서 유사도 계산 기법 (Technique for Path-based Similarity Evaluation of XML Documents)

  • 이동애;장덕성
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 추계학술발표논문집(상)
    • /
    • pp.689-692
    • /
    • 2004
  • XML은 의미적으로는 동일하거나 혹은 유사하지만 서로 다른 구조의 XML 문서들을 허용하므로 XML 문서들을 대상으로 하는 검색, 클러스터링 등의 응용에서는 XML 문서들간의 유사도 계산이 선행되어져야 한다. XML 문서간 유사도를 계산하기 위해서는 문서의 구조 정보인 엘리먼트들과 이들 엘리먼트들의 계층적 구조가 고려되어져야 한다. 본 연구에서는 두 XML 문서가 얼마나 유사한 경로들을 공통으로 가지냐를 두 문서간의 유사도로 보고, 경로 유사도 계산식과, 이를 기반으로 하는 문서 거리 및 문서 유사도 계산식을 정의하여, 유사도 계산 기법을 제안한다. 제안된 기법과 기존 유사도 계산 기법들을 예제 문서들을 통해 계산결과를 비교한다.

  • PDF

2D-THI: XML 데이테베이스를 위한 이차원 타입상속 계층색인 (2D-THI: Two-Dimensional Type Hierarchy Index for XML Databases)

  • 이종학
    • 한국멀티미디어학회논문지
    • /
    • 제9권3호
    • /
    • pp.265-278
    • /
    • 2006
  • 본 논문에서는 XML 데이터베이스의 타입상속 계층에 대한 색인기법으로 이차원 색인구조를 이용하는 이차원 타입상속 색인기법인 2D-THI를 제안한다. XML 스키마는 타입상속을 지원하는 XML 문서를 위한 스키마 모델 중에 하나이다. 기존의 XML 데이터베이스를 위한 색인기법은 XML 스키마상의 타입상속 계층에 대한 XML 질의를 지원하지 못한다. 따라서 본 논문에서는 XML 질의의 타입상속 계층을 지원하기 위한 색인기법으로 다차원 파일구조를 이용하는 이차원 색인구조를 구성한다. 이차원 색인구조에서 한 축은 색인된 엘리먼트의 킷값 도메인으로 구성하고 다른 한 축은 타입상속 계층의 타입 식별자 도메인으로 구성한다. 이와 같은 이차원 색인구조를 이용함으로써 사용자 질의 패턴에 따라 두 도메인 사이에서 객인 엔트리들의 클러스터링 정도를 조정함으로써 질의처리의 성능을 향상시킬 수 있다. 본 논문에서 제안한 2D-THI의 성능 평가를 위하여, 비용 모델을 개발하고 이를 통하여 2D-THI를 기존의 객체지향 데이터베이스에서 사용하고 있는 CH-index와 CG-tree와 같은 클래스 계층 색인기법들과 색인의 성능을 비교평가 한다. 성능평가의 결과로서, CH-index와 CG-tree에서는 특정 형태의 XML 질의의 경우에만 좋은 성능을 보인 반면, 본 논문에서 제안한 2D-THI에서는 주어진 질의 형태에 따라 최적의 질의처리 성능을 제공할 수 있음을 보인다.

  • PDF

병렬 내장형 소프트웨어 개발환경을 위한 데이터 플로우 블록 클러스터링 (Dataflow Block Clustering for Parallel Embedded Software Development Environment)

  • 조용우;권성남;하순회
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (B)
    • /
    • pp.337-341
    • /
    • 2008
  • 갈수록 복잡해지는 내장형 시스템을 개발함에 있어서 소프트웨어 개발의 중요성은 날로 커지고 있다. 기존 연구에서 소프트웨어 개발 효율을 높이기 위해 소프트웨어의 재사용 가능성을 높이고 병렬성 명세를 용이하게 하고자 중간단계코드(CIC)를 정의하였다. 이 중간단계 코드는 각 태스크의 순수 알고리즘을 기술하는 C형태의 태스크 코드와 그 외의 정보를 포함하는 XML형태의 아키텍쳐 정보 파일로 구성된다. 이 CIC는 사용자가 직접 기술할 수 있고 각종 모델로부터 자동 생성할 수도 있다. 이 논문에서는 후자에 초점을 두고 데이터 플로우 모델에 사용된 블록들을 클러스터링하여 태스크 코드를 생성하는 기법을 제안하였다. 이것을 위해 블록 클러스터링 알고리즘은 주어진 클러스터의 크기로 블록이 묶일 때까지 블록의 수행시간 정보를 고려하여 함수 병렬성을 최대한 보존하며 블록들을 묶어나간다. H.263 코덱 예제를 이용한 실험을 통해 제안하는 방법이 다양한 클러스터의 크기 조건에 대해서 다양한 클러스터링 결과를 제공함을 보였다.

  • PDF

유사성 기반 XML 문서 분석 기법 (XML Document Analysis based on Similarity)

  • 이정원;이기호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권6호
    • /
    • pp.367-376
    • /
    • 2002
  • XML 문서가 가지고 있는 태그의 자유로운 정의와 내포된 구조 정보는 정보 검색 및 문서 관리 분야에 많은 이점을 제공할 수 있다. 본 논문은 XML 요소(element)의 의미와 구조 정보를 반영한 문서간의 유사성을 검사할 수 있는 XML 문서 분석 기법을 제시하고자 한다. 도출된 문서간 유사성은 많은 정보 검색 및 마이닝 등의 기초 자료로 사용될 수 있다. 먼저 XML 요소를 시소러스를 이용하여 유사어와 합성어로 구성된 확장-요소 벡터로 확장하고 유사 행렬을 구축하여 요소간 유사성을 판별한다. 또한 오토마타(NFA(Nondeterministic Finite Automata)와 DFA(Deterministic Finite Automata)(를 이용하여 XML 문서의 내포된 구조를 발견하고 최소화 한다. 요소간의 유사 행렬과 최소화된 XML 구조를 이용하여 구조간의 유사성을 판별한다. 본 논문의 XML의 의미를 반영한 유사성 분석 기법은 온라인 서점의 실제 문서의 카테고리를 인식하는 데 있어 100% 정확도를 보였다.

XML 필터링 질의의 효율적 처리를 위한 이차원 그룹핑 색인기법 (Two-Dimensional Grouping Index for Efficient Processing of XML Filtering Queries)

  • 여대휘;이종학
    • 정보화연구
    • /
    • 제10권1호
    • /
    • pp.123-135
    • /
    • 2013
  • 본 논문에서는 XML 필터링 질의의 효율적 처리를 위한 이차원 그룹핑 색인기법인 2DG-index를 제안한다. 최근 XML데이터의 질의 처리를 위해 조상-후손관계 또는 부모-자식관계 등의 구조적 관계를 효율적으로 처리하기 위한 많은 연구들이 수행되었다. 그러나 이러한 연구들은 경로 질의에만 초점을 두고 있으며 특정 조건 값을 포함하는 필터링 질의에 대해서는 고려하지 않고 있다. 2DGindex는 필터링 질의를 효율적으로 처리하기 위한 방안으로 XML 스키마의 경로 도메인과 필터링 데이터 값의 도메인으로 구성된 이차원 도메인 공간상의 색인 엔트리들의 클러스터링을 다루는 색인기법이다. 2DG-index의 성능평가를 위하여 특정 조건 값을 포함하는 질의의 유형을 세 가지로 분류하고, 이러한 질의 유형별로 2DG-index의 질의처리 성능을 기존의 일차원 색인구조를 이용하는 색인기법인 데이터 값별로 그룹핑한 DG-index와 경로별로 그룹핑한 PG-index와 비교하여 2DG-inedx의 효율성을 입증한다.

스마트폰 센싱에서 메타데이터의 구조적 유사도를 고려한 클러스터링 기법 (A Clustering Scheme Considering the Structural Similarity of Metadata in Smartphone Sensing System)

  • 민홍;허준영
    • 한국인터넷방송통신학회논문지
    • /
    • 제14권6호
    • /
    • pp.229-234
    • /
    • 2014
  • 다수의 저가 센서 노드를 통해 주변의 환경 정보를 수집하는 센서 네트워크와 스마트폰에 탑재되어 있는 다양한 종료의 센서들을 연동함으로써 사용자의 상태에 따라 주위 환경과 반응하는 응용들이 개발되고 있다. 이런 응용에서 수집된 데이터의 공유를 위해 센싱 데이터와 의미정보를 저장하는 XML 형태의 메타데이터를 함께 저장할 필요가 있다. 메타데이터는 시스템 설계자의 필요에 따라 확장되고 변형되는데 거리 기반의 클러스터링 기법을 사용할 경우 서로 다른 형태의 메타데이터가 혼재하게 되어 데이터 수집의 효율성이 떨어지는 문제가 발생한다. 본 논문에서는 효율적인 데이터 수집을 위해 클러스터를 구성할 때 각 노드의 메타데이터의 구조적 유사도를 반영함으로써 클러스터 구성에 필요한 시간을 줄이고, 구성원 간 메타데이터 유사도를 향상시키는 기법을 제안한다.