• 제목/요약/키워드: 데이타 웨어하우스

검색결과 45건 처리시간 0.017초

데이타 웨어하우스 환경에서의 설명기반 데이타 마이닝 (Explanation-based Data Mining in Data Warehouse)

  • 김현수;이창호
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1999년도 춘계공동학술대회: 지식경영과 지식공학
    • /
    • pp.115-123
    • /
    • 1999
  • 산업계 전반에 걸친 오랜 정보시스템 운용의 결과로 대용량의 데이타들이 축적되고 있다. 이러한 데이타로부터 유용한 지식을 추출하기 위해 여러 가지 데이타 마이닝 기법들이 연구되어왔다. 특히 데이타 웨어하우스의 등장은 이러한 데이타 마이닝에 있어 필요한 데이타 제공 환경을 제공해 주고 있다. 그러나 전문가의 적절한 판단과 해석을 거치지 않은 데이타 마이닝의 결과는 당연한 사실이거나, 사실과 다른 가짜이거나 또는 관련성이 없는(trivial, spurious and irrelevant) 내용만 무수히 쏟아낼 수 있다. 그러므로 데이타 마이닝의 결과가 비록 통계적 유의성을 가진다 하더라고 그 정당성과 유용성에 대한 검증과정과 방법론의 정립이 필요하다. 데이타 마이닝의 가장 어려운 점은 귀납적 오류를 없애기 위해 사람이 직접 그 결과를 해석하고 판단하며 아울러 새로운 탐색 방향을 제시해야 한다는 것이다. 본 논문의 목적은 이러한 데이타 마이닝에서 추출된 결과를 검증하고 아울러 새로운 지식 탐색 방향을 제시하는 방법론을 정립하는데 있다. 본 논문에서는 데이타 마이닝 기법 중 연관규칙탐사로 얻어진 결과를 설명가능성 여부의 판단을 통해 검증하는 기법을 제안하며, 이를 통해 얻어진 검증된 지식을 토대로 일반화를 통한 새로운 가설을 생성하여 데이타 웨어하우스로부터 연관규칙을 검증하는 일련의 아키텍쳐(architecture)를 제시하고자 한다. 먼저 데이타 마이닝 결과에 대한 설명의 필요성을 제시하고, 데이타 웨어하우스와 데이타 마이닝 기법들에 대한 간략한 설명과 연관규칙탐사에 대한 정의 및 방법을 보이고, 대상 영역에 대한 데이타 웨어하우스의 스키마를 보였다. 다음으로 도메인 지식(domain knowledge)과 연관규칙탐사를 통해 얻어진 결과를 표현하기 위한 지식표현 방법으로 Relational predicate Logic을 제안하였다. 연관규칙탐사로 얻어진 결과를 설명하기 위한 방법으로는 연관규칙탐사로 얻어진 연관규칙에 대해 Relational Predicate Logic으로 표현된 도메인 지식으로서 설명됨을 보이게 한다. 또한 이러한 설명(explanation)을 토대로 검증된 지식을 일반화하여 새로운 가설을 연역적으로 생성하고 이를 연관규칙탐사론 통해 검증한 후 새로운 지식을 얻는 반복적인 Explanation-based Data Mining Architecture를 제시하였다. 본 연구의 의의로는 데이타 마이닝을 통한 귀납적 지식생성에 있어 귀납적 오류의 발생을 고메인 지식을 통해 설명가능 함을 보임으로 검증하고 아울러 이러한 설명을 통해 연역적으로 새로운 가설지식을 생성시켜 이를 가설검증방식으로 검증함으로써 귀납적 접근과 연역적 접근의 통합 데이타 마이닝 접근을 제시하였다는데 있다.

  • PDF

다차원 대용량 저밀도 데이타 큐브에 대한 고밀도 서브 큐브 추출 알고리즘 (Dense Sub-Cube Extraction Algorithm for a Multidimensional Large Sparse Data Cube)

  • 이석룡;전석주;정진완
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권4호
    • /
    • pp.353-362
    • /
    • 2006
  • 데이타 웨어하우스는 기업이나 사회 전반에서 사용되는 방대한 데이타를 저장하고, 효율적인 분석을 가능하게 하는 데이타 저장소로써, 점점 그 활용도가 증가하고 있다. 본 연구에서는 이러한 데이타 웨어하우스 구축 기술의 핵심이 되는 다차원 데이타 큐브 (multidimensional data cube) 기술을 연구하는 데 목적이 있다. 고차원 데이타 큐브에는 필연적으로 내재하는 데이타의 희소성 (sparsity)에 의한 검색 오버헤드가 있다. 본 연구에서는 이러한 오버헤드를 현격하게 감소시키는 알고리즘을 제시함으로써, 데이타 웨어하우스의 효율을 높이는 데 기여한다. 즉, 고차원의 희소 데이타 큐브에서 데이타가 조밀하게 밀집된 영역들을 찾아 그 영역을 중심으로 서브 큐브를 구축하여, 데이타 검색 시에 전체의 데이타 큐브를 대상으로 하지 않고 해당 서브 큐브만으로 검색 대상을 제한시킴으로써 검색 효율을 높이는 알고리즘이다. 본 논문에서는 다 차원 대용량의 희소 데이타 큐브로부터 밀도가 높은 서브 큐브를 찾기 위하여 비트맵과 히스토그램에 기반한 알고리즘을 제안하며, 실험을 통하여 제안한 알고리즘의 효용성을 보여준다.

인터넷, 인트라넷과 연계되는 데이타웨어하우스 시스템의 구축방안

  • 박주석;김찬수
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 1996년도 추계학술대회발표논문집; 고려대학교, 서울; 26 Oct. 1996
    • /
    • pp.73-77
    • /
    • 1996
  • 정보는 의사결정자들의 수주에 있을 때 기업에 있어 강력한 경쟁무기가 된다. 의사결정자들의 정보에 대한 이러한 필요성을 충족시키기 위해서 데이타는 운영시스템(Operational System)에서 추출되어 데이타웨어하우스에 저장된다. 데이타웨어하우스는 핵심 비지니스영역(key business dimension)에 의해 정리된 historical data를 저장한다. 이러한 의사결정자들을 위한 데이타웨어하우스 정보의 전달은 기존의 클라이언트/서버 시스템 하에서는 많은 지원을 요구한다. 즉 기존 클라이언트/서버 시스템 하에서는 사용자들의 접근을 위해 데이타가 추출되고 조직화되어지고 나면, 반드시 분석 소프트웨어가 각 사용자의 컴퓨터에 설치되어야 하고 외부의 사용자를 위한 새로운 운영자가 고용되어야 한다. 사용자의 다양한 요구 그리고 계속적 사용자의 교체는 사용자 지원에 있어 심각한 기업부담으로 작용한다. 또한 클라이언트/서버 시스템에서는 기업외부의 정보 이용자들에게 정보를 제공하는데 있어 장소적 한계점을 가지고 잇다. 인트라넷과 인터넷은 이러한 클라이언트/서버 시스템 환경의 문제에 대해 해답을 제시한다. 인트라넷은 데이타웨어하우스로의 접근을 간단히 할뿐만 아니라 의사결정자들의 정보의 공유와 상호분석의 새로운 단계를 제공한다. 그리고 인터넷은 기업 외부 어디에서나 기업이 제공하는 정보를 이용하고자 하는 사람들에게 접근의 편의성을 제공한다. 즉 데이타웨어하우스의 목표와 인트라넷, 인터넷의 목표는 데이타로의 손쉬운 접근이라는 점에서 동일하다. 이러한 점에 착안하여 인트라넷과 인터넷하에서 운용되는 데이타웨어하우스 시스템 구축을 위한 방안을 제시하고자 한다.다(학생군:8.16kg 작업자군:12.9kg). 심박수를 이용한 생리학적 연구에서는 평균 심박수가 거의 100 이하를 유지하므로써 피실험자들이 8시간 작업기준으로 보아 무리가 없는 최대허용 하중을 결정하였음을 보였다. 또한 각 운반작업에 대한 최대허용 하중을 예측하는 회귀모형을 제시하였다.아직 정립되어 있지 않은 분산 환경하에서의 관계형 데이타베이스의 데이타관리의 분류체계를 나름대로 정립하였다는데 그 의의가 있다. 또한 이것의 응용은 현재 분산데이타베이스 구축에 있어 나타나는 기술적인 문제점들을 어느정도 보완할 수 있다는 점에서 그 중요성이 있다.ence of a small(IxEpc),hot(Tex> SOK) core which contains two tempegatlue peaks at -15" east and north of MDS. The column density of HCaN is (1-3):n1014cm-2. Column density at distant position from MD5 is larger than that in the (:entral region. We have deduced that this hot-core has a mass of 10sR1 which i:s about an order of magnitude larger those obtained by previous studies.previous studies.업순서들의 상관관계를 고려하여 보다 개선된 해를 구하기 위한 연구가 요구된다. 또한, 준비작업비용을 발생시키는 작업장의 작업순서결정에 대해서도 연구를 행하여, 보완작업비용과 준비비용을 고려한 GMMAL 작업순서문제를 해

  • PDF

데이타 웨어하우스 환경에서 최적 실체뷰 구성을 위한 효율적인 탐색공간 생성 기법 (An Efficient Search Space Generation Technique for Optimal Materialized Views Selection in Data Warehouse Environment)

  • 이태희;장재영;이상구
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권6호
    • /
    • pp.585-595
    • /
    • 2004
  • 데이타 웨어하우스에서의 분석 질의는 대체로 복잡한 연산을 포함하고 있기 때문에 질의 처리 과정이 매우 중요하다. 성능 향상을 위해서 데이타 웨어하우스에서 보편적으로 쓰이고 있는 방법은 실체뷰를 구축하는 것이다. 어떤 실체뷰를 구축하느냐 하는 문제는 데이타 웨어하우스 전체의 질의처리 성능과 유지보수 비용에 중요한 영향을 미친다. 실체뷰 구성 문제란 이러한 질의처리 비용과 유지보수비용을 고려하여 최적의 실체뷰를 선택하는 것이다. 본 논문에서는 이러한 최적의 실체뷰를 구성하는 효율적인 해결방안을 제시한다. 최적 실체뷰의 구성문제는 일반적으로 NP-hard 문제이지만, 본 논문에서는 관계형 데이터 베이스에서 사용되는 조인, 선택, 그룹, 집계 연산의 특성을 고려하여 문제해결을 위한 탐색 공간을 획기적으로 줄이는 방법을 제안한다.

효율적인 공간 데이타 웨어하우스에 관한 연구 (A Study on the Effective Spatial Data Warehouse)

  • 이기영
    • 한국컴퓨터정보학회논문지
    • /
    • 제3권4호
    • /
    • pp.126-131
    • /
    • 1998
  • 최근 의사결정 지원 시스템의 필요성과 중요성이 크게 대두되어 활발히 연구가 진행되고 있는 공간 데이타 웨어하우스는 요약˙분석 작업을 통해 의사 결정에 필요한 정보를사용자에게 효율적으로 제공하기 위하여 과거로부터 누적된 이질적이고 다양한 대용량의 공간 데이타로 구성된다. 본 논문에서는 공간 데이타 웨어하우스 모델링을 위해서 가상적인 시나리오를 토대로 효과적인 공간 다차원 모델을 고찰한다. 또한 사용자가 요구하는 기본적이고 핵심적인 분석 기능들을 모두 표현할 수 있는 공간 다차원 분석 질의의 여러 형태에 대하여 살펴본다.

  • PDF

고성능 뷰 관리르 지원하는 새로운 데이터 웨어하우징 시스템 구조 (A New Data Warehousing System Architecture Supporting High Performance View Maintenance)

  • 김점수;이도헌;이동익
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권10호
    • /
    • pp.1156-1166
    • /
    • 1999
  • 의사결정 시스템은 전사적인 의사결정과 전략적 정보수집을 위해 거대한 량의 정보를 빠른 시간내에 제공할 것을 요구한다. 데이타 웨어하우스는 이러한 정보를 신속히 제공하기 위해 여러 지역 데이타베이스로부터 필요한 정보를 사전에 추출하고 가공 및 통합하여 별도의 저장공간에 저장한다. 일반적으로, 웨어하우스 내의 정보는 지역 데이타베이스에 저장된 정보에 대한 실체화된 뷰로서 간주하며 지역 데이타의 변경에 따라 일관성을 유지하도록 반영해야 한다. 본 논문에서는 일관성을 유지하기 위해 정보 공유가 가능한 데이타 웨어하우스 시스템의 구조와 비-보상 실체 뷰 관리 기법을 제안한다. 본 논문에서 제안한 데이타 웨어하우스 시스템의 구조는 지역 데이타베이스에서 추출된 정보를 관리하는 별도의 지역 정보 관리자를 두어 뷰 관리자들 간의 정보 공유가 가능하게 한다. 비-보상 실체 뷰 관리 기법은 지역 데이타 변경 사건에 따른 뷰 관리 시 다른 사건에 의해 영향을 받지 않도록 하기 때문에 기본의 사전 보상이나 나중 보상 기법과는 달리 추가적인 질의 처리를 요구하지 않는 기법이다.Abstract A decision support system(DSS) commonly requires fast access to tremendous volume of information. A data warehouse is a database storing the information that is extracted, filtered and integrated from several relevant local databases to reply upon aggregated queries. The information stored in the data warehouse can be regarded as materialized views. The materialized view has to be modified according to the change of the corresponding local databases to preserve the data consistency. In this paper, we propose a data warehousing system architecture allowing information sharing (DAWINS), and a non-compensating materialized view maintenance algorithm(NCA). DAWINS architecture allows relevant information to be shared by individual view managers with local data manager for each local database. Unlikely to the pre- or post-compensating algorithms, which are required to remove the effects of some events to other view in the process of view maintenance, NCA does not require any additional query processing, since a local data manager in DAWINS already maintains the effects of update events occurring in local systems.

중대형 컴퓨터를 위한 데이터 웨어하우스 구축도구 개발

  • 이국철;이춘열;안연식;안효성;공세호;김용희
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1998년도 국제 컨퍼런스: 국가경쟁력 향상을 위한 디지틀도서관 구축방안
    • /
    • pp.433-447
    • /
    • 1998
  • 데이터 웨어하우스는 일상업무 처리를 위한 운영 데이터(Operational Data)의 관리를 목적으로 구현되는 전통적인 데이터베이스 시스템에 대응하는 새로운 개념으로서, 업무분석 및 의사결정을 위한 '정보 데이터(Informational Data)'를 효과적으로 제공하는 것을 목적으로 하고 있다. 최근 가트너그룹의 조사에 의하면, 데이터베이스 보유기업중 대부분이 향후 5년 이내에 데이터 웨어하우스를 구축할 것으로 전망하고 있어 국내외적으로 급격한 수요증가가 예상되고 있다. 데이터 웨어하우스에 대한 수요 증대와 더불어, 국내 연구 기관에서도 독자적인 데이터 웨어하우스 관리 시스템 또는 구현 도구들을 개발하기 시작하고 있으나, 주로 UNIX 시스템을 대상으로 하고 있다.(중략)

  • PDF

데이타 웨어하우스에서 효과적인 점진적 뷰 관리 (An Efficient Incremental View Maintenance in Data Warehouses)

  • 이기용;김명호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제27권2호
    • /
    • pp.175-184
    • /
    • 2000
  • 데이타 웨어하우스는 외부 데이타를 통합 요약하여 저장하는 시스템으로, 의사 결정에 필요한 정보를 효과적으로 제공할 수 있다. 대부분의 데이타 웨어하우스에서는 데이타를 정랴한 결과를 형성(materialized) 뷰의 형태로 저장한다. 이 때 뷰가 정의된 데이타 소스가 변화하면 뷰는 이를 반영하기 위 해 갱신되어야 한다. 뷰에 대한 갱신 작업은 상당한 부하를 야기시킬 수 있으므로, 이러한 갱신 작업을 효율적으로 수행하는 것은 매우 중요한 문제가 된다. 이미 뷰의 효율적인 갱신 방법에 대해서는 많은 연구 가 이루어져 왔다. 그러나 뷰가 여러 개의 데이타 소스에 의해 정의되고 이들 중 둘 이상의 데이타 소스가 변화된 경우, 이를 뷰에 반영하기 위해서 기존의 방법들은 데이타 소스에 대해 많은 수의 접근이 이루어져야 한다. 본 논문에서는 여러 개의 데이타 소스에 변화가 일어난 경우, 기존 연구에 비해 데이타 소스에 대한 접근을 줄일 수 있는 효율적인 뷰 갱신 방법을 제안한다 . 그리고 TPC-D 데이타를 사용한 실험을 통하여 본 논문에서 제안한 방법이 기존의 방법들보다 성능이 우수하다는 것을 보인다.

  • PDF

의료용 데이터 웨어하우스를 위한 메타데이터 기반의 보안 프로토타입 시스템 구현 (Implementing Metadata-based Security Prototype System for Medical Data Warehouse)

  • 김종호;김태훈;송해용;홍수희;박진두;민성우;이희석
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1999년도 국제컨퍼런스 디지털컨텐츠 활용을 통한 지식경영의 확산
    • /
    • pp.113-118
    • /
    • 1999
  • 본 연구는 통합병원정보시스템 (Integrated Hospital Information System) 에서 의료용 데이터 웨어하우스 (Medical Data Warehouse) 부분의 보안 프로토타입 시스템을 메타데이터 기반으로 설계하고 구현하는 데 주안점을 두었다. 특히, 의료용 데이터 웨어하우스 중에서도 임상 데이터 웨어하우스 (Clinical Data Warehouse) 에 초점을 두었으며 이에 대한 프로토타입은 ㅈ 병원에 적용되어서 개발되었다.

  • PDF

데이터 웨어하우스 메타데이터 구축사례 (Implementing A Data Warehouse Metadata: A Case)

  • 조남철;손명호;김태훈;이희석
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1999년도 춘계공동학술대회: 지식경영과 지식공학
    • /
    • pp.383-392
    • /
    • 1999
  • 오늘날의 의사결정을 지원하는 시스탬에 있어서 데이터 웨어하우스가 널리 활용되고 있다. 이러한 데이터웨어 하우스를 개발하는데 있어서 메타 데이터가 필수적인 요소로 활용되고 있다. 한편. 메타 데이터 연합 (Meta Data Coalition)에서 제정한 Metadata Interchange Specification (MDIS)는 이러한 메타 데이터의 표준으로 널리 활용되고 있다. 본 연구는 이러한 표준을 기반으로 한 메타 데이터 스키마를 제시하고 있다. 실제적인 개발에서 이러한 표준은 핵심웨어하우스 계층, 적용 계층, 사용자 탐험 계층 및 비즈니스 계층으로 구성되어 있다. 이러한 메타 데이터 스키마를 적용한 실제 시스템의 프로토타입을 본 연구에서 구현해 보았다.

  • PDF