• Title/Summary/Keyword: 스키마 추출

검색결과 150건 처리시간 0.024초

반구조적 데이터의 효율적인 최소경계 스키마 추출 기법 (An Efficient Technique for Extracting Lower Bound Schema from Semistructured Data)

  • 박경현;김록원;양은주;최은선;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.27-29
    • /
    • 2000
  • 반구조적 데이터는 기존의 스키마와는 달리 고정된 스키마가 없고 주어진 데이터 인스턴스에 대해 하나 이상의 스키마가 존재한다. 따라서 여러 개의 스키마 추출이 가능한데 그중 가장 정확한 스키마를 추출해야 하는 문제(S초듬 Fxtraction)가 발생한다. 이러한 문제를 해결하기 위해 지금까지 여러 가지 스키마 추출 기번들이 제안되었는데 대표적인 것으로 데이터가이드(DataGuide)를 이용하여 최대경계 스키마를 추출하는 방법과 데이터로그(DataLog)를 이용하여 최소경계 스키마를 추출하는 방법이 있다. 이 논문에서는 기존의 데이터로그를 이용하는 방법보다 최소경계 스키마 추출 기법을 제안하고 이전의 스키마 추출 기법들과 비교함으로써 알고리즘의 성능을 살펴본다.

  • PDF

통합 XML 스키마의 효율적인 추출 (An Efficient Extraction of An Integrated XML Schema)

  • 임태우;강혜란;이경호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.43-45
    • /
    • 2005
  • XML 스키마의 수가 급증함에 따라 동일한 도메인에 속하는 유사한 스키마를 통합하는 방법에 대한 관심이 증가하고 있다. 일반적으로 XML 스키마 통합 과정은 스키마 클러스터링과 통합 스키마 추출의 두 단계로 구성된다. 본 논문에서는 통합 스키마의 추출을 위한 효율적인 방법을 제안한다. 제안된 방법은 공통 구조 추출, 스키마 통합, 그리고 최적화의 세 단계로 이루어진다. 실험결과, 제안된 방법은 처리시간 및 정확도 측면에서 우수란 결과를 보였다.

  • PDF

XML 스키마로부터 관계형 스키마 추출 기법 (Extraction of Relational Schema from XML Schema)

  • 김은욱;민미경
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 추계학술발표논문집
    • /
    • pp.351-354
    • /
    • 2002
  • 데이터로서 XML의 의미가 중요해짐에 따라 XML 문서를 저장하는 방법들에 대한 연구가 활발히 진행되고 있다. 그 중 하나가 스키마를 이용하여 XML 문서를 관계형 데이터베이스에 저장하는 것으로서, 지금까지 DTD를 중심으로 연구가 이루어져 왔으나, XML 스키마의 등장으로 DTD의 단점을 보완하고, 기존 관계형 데이터베이스와 보다 유사하게 표현 할 수 있게 되었다. 본 논문에서는 XML 스키마에서 관계형 스키마를 추출하는 기법을 제시한다. 제시된 기법은 DTD에서 관계형 스키마를 추출하는 기법을 기반으로 하여, DTD에서 표현할 수 없는 사용자 정의 데이터형을 추가로 제공하는 등, XML 스키마의 속성과 요소에 따른 여러 특성을 표현할 수 있다.

  • PDF

XML 문서에서의 엘리먼트 정보를 이용한 스키마 추출방법 (A Schema Extraction Method using Elements Information in XML Documents)

  • 김성림;윤용익
    • 정보처리학회논문지D
    • /
    • 제9D권3호
    • /
    • pp.381-388
    • /
    • 2002
  • 인터넷상에서 데이터를 표현하고 교환하는 새로운 표준으로 등장하는 XML 문서는 정해진 스키마를 가지고 있지 않다. XML 문서를 기존의 SQL이나 OQL에 바로 적용하기에는 부적합하여 이러한 XML 문서에 대해 스키마를 추출하는 방법과 질의어에 대한 연구가 활발히 진행되고 있다. 본 논문에서는 XML문서에 대해 엘리먼트 정보를 이용하여 스키마를 추출하고, 추출된 스키마를 바탕으로 데이터 빈도수에 따라 새로운 여러 단계의 스키마를 추출하는 방법을 제시하고 실험한다.

XML 스키마로부터 관계형 스키마 변환 기법 설계 및 구현 (Design and Implementation of Transformation of XML Schema to Relational Schema)

  • 최정규;민미경
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 추계학술발표대회(상)
    • /
    • pp.392-395
    • /
    • 2003
  • XML은 W3C에서 제안된 웹 상에서 데이터를 표현하고 교환하는 표준이다. XML 문서를 관계형 데이터베이스나 객체지향 데이터베이스에 바로 저장하기에는 적합하지 못하기 때문에, XML문서에서 DTD를 이용하여 관계형 데이터베이스 스키마를 추출하고, 저장하는 방법에 대한 연구가 활발히 진행되고 있다. 그러나 DTD는 타입이 제한되어있고, 확장의 어려움이 있기 때문에 XML 스키마를 이용하여 DTD의 단점을 보완하고, 관계형 데이터 베이스 스키마를 추출하여 저장할 수 있게 되었다. 본 논문에서는 XML 스키마를 관계형 스키마로 변환하는 기법을 제안하고 구현 결과를 보인다. 제안된 방법은 XML 스키마를 이용하므로, 타입의 확장성 및 유연성 등을 제공할 수 있다.

  • PDF

지역 스키마간 충돌 문제를 고려한 XML 문서의 전역 스키마 생성 모델 (XML Global Schema Generation Model of XML Documents Considering Conflicts on Local Schema Integration)

  • 김정희;곽호영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.70-72
    • /
    • 2002
  • 본 논문에서는 분산된 XML 문서를 수집 처리하여 상호 제공하는 과정에서 활용될 통합된 XML 문서의 전역 스키마를 생성하는 시스템을 제안한다. 제안된 시스템에서는 분산 환경에 존재하는 개별적인 XML 문서들에 대한 지역 스키마 정보를 관계형 데이터베이스로 구축하고, 통합된 XML 문서의 데이터를 기반으로 각각의 지역 스키마 데이터베이스를 검색한 후 데이터에 적합한 스키마 정의를 추출하게 된다. 또한 추출과정에서 중복 정의에 의한 충돌 범주를 분석하고, 이를 해결하는 방법도 제시하였다. 시스템 모델링 결과 XML 문서의 구조와 검증을 명확하게 보장하는 통합된 XHL 문서의 전역 스키마 생성과 지역 스키마간 발생되는 충돌문제 해결이 가능함을 알 수 있었다.

  • PDF

참조 스키마 생성을 위한 개념적 스키마 분석 (Conceptual Schema Analysis for Creation of Reference Sche)

  • 김흥수
    • 한국컴퓨터정보학회논문지
    • /
    • 제7권4호
    • /
    • pp.83-88
    • /
    • 2002
  • 데이터베이스 설계를 위해 구축된 수많은 개념적 스키마들을 재사용하기 위한 분석수단이 요구된다. 본 논문에서는 개념적 스키마를 분석하는 방법을 제시하고 참조 스키마를 추출하기 위한 스키마 분석을 실험을 하였다. 스키마 통합은 유사함 값이 0.6 이상인 경우에 적용하는 것이 바람직하다. 분석 방법을 통해 생성되는 참조 스키마는 개념을 포괄적으로 표현할 수 있고 스키마 재사용을 위한 수단이 된다. 그리고, 참조 스키마 추출에 필요한 상세한 분석자료를 구하기 위해서는 피쳐를 근거로 스키마를 분석하는 것이 효과적인 수단이 된다.

  • PDF

ER 도형의 연결 위상구조를 이용한 스타 스키마 추출 알고리즘 (A Star Schema Extraction Algorithm Using Connection Topologies of ER Diagrams)

  • 신성현;김진호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.136-138
    • /
    • 2002
  • 관계형 OLAP 시스템에서는 다차원 분석에 사용될 데이터를 하나의 사실과 여러 개의 차원 테이블로 구성된 스타 스키마로 표현한다. 사실 테이블은 측정치의 속성을 포함하며, 차원 테이블들은 이러한 사실 테이블에서 중심으로 뻗어져 나온 형태로써, 측정치에 대한 정보를 제공한다. 방대한 크기의 OLTP 소스 데이타베이스로부터 사실과 차원 테이블로 구성된 스타 스키마 설계하기 위해서는 풍부한 경험과 많은 시간을 필요로 한다. 따라서 스타 스키마를 효과적으로 설계하기 위한 체계적인 설계 방법이 필요하다. 본 논문에서는 소스 데이터베이스들에 대한 개념적 모델인 ER 도형을 이용하여 여러 개의 사실 엔터티를 추출하는 알고리즘과 이를 통해 자동적으로 스타 스키마를 설계하는 알고리즘을 제시하였다. 스타 스키마가 하나의 사실 테이블에 여러 개의 차원 테이블이 M:1의 관계로 연결되었다는 성질을 활용하여, 이 방법에서는 EH 도형이 연결된 위상 구조를 이용하여 각 엔터티에 연결된 M:1 관계의 개수에 근거하여 사실과 차원을 추출하는 방법을 제시하였다. 본 논문에는 이러한 방법을 통해 데이터 웨어하우스의 스타 스키마들 자동적으로 쉽게 설계하여 소요되는 시간과 노력을 줄일 수 있도록 하였다.

  • PDF

공통 유사 서브스키마 추출을 통한 개념적 스키마 통합 : 다중 데이터베이스 시스템 적용사례 (A Conceptual Schema Integration through Extraction of Common Similar Subschemas : An Case Study of Multidatabase System)

  • 고재진;이원조
    • 정보처리학회논문지D
    • /
    • 제11D권4호
    • /
    • pp.775-782
    • /
    • 2004
  • 최근 글로벌 기업들은 조직들이 지역적으로 분산되어 있고, 분산된 조직들로 인하여 정보시스템들도 분산되어 있다. 이러한 정보시스템의 중심이 되는 데이터베이스도 분산되어 있어, 다양한 사용자 응용 프로그램을 위한 공통된 뷰(view)의 제공 및 효과적인 관리가 어렵다. 이것을 해결하기 위한 개념이 MDBS이고, 이것을 효과적으로 구축하기 위한 방안이 스키마 통합이다. 본 논문에서는 공통 유사 서브스키마 추출을 통한 스키마 통합 방법론을 제시한다. 본 방법론은 분석 대상 스키마에 대하여 친밀도 분석, 유사 서브스키마 추출, 통합순서 결정, 의리충돌 해결, 그리고 스키마 통합 순서로 구성되어 있다. 방법론의 유용성을 검증하기 위하여, MDBS를 대상으로 사례분석을 수행하였다. 분석 결과, 본 논문의 방법론이 공통 유사 서브스키마의 추출 및 스키마 통합에 유용하게 적용될 수 있다는 것을 확인할 수 있었다.

이동 객체 데이터베이스 상에서 정보 비용 테스트를 위한 테스트 베드의 설계 및 구현 (Design and Implementation of Testbed for Information Cost Test)

  • 김태원;김경식;김창화;강태원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.73-75
    • /
    • 2002
  • 본 논문에서는 분산된 XML 문서를 수집 처리하여 상호 제공하는 과정에서 활용될 통합된 XML 문서의 전역 스키마를 생성하는 시스템을 제안한다. 제안된 시스템에서는 분산 환경에 존재하는 개별적인 XML 문서들에 대한 지역 스키마 정보를 관계형 데이터베이스로 구축하고, 통합된 XML 문서의 데이터를 기반으로 각각의 지역 스키마 데이터베이스를 검색한 후 데이터에 적합한 스키마 정의를 추출하게 된다. 또한 추출과정에서 중복 정의에 의한 충돌 범주를 분석하고, 이를 해결하는 방법도 제시하였다. 시스템 모델링 결과 XML 문서의 구조와 검증을 명확하게 보장하는 통합된 XHL 문서의 전역 스키마 생성과 지역 스키마간 발생되는 충돌문제 해결이 가능함을 알 수 있었다.

  • PDF