• Title/Summary/Keyword: 속성데이터

Search Result 1,594, Processing Time 0.052 seconds

A Study on Selecting Bitmap Join Index to Speed up Complex Queries in Relational Data Warehouses (관계형 데이터 웨어하우스의 복잡한 질의의 처리 효율 향상을 위한 비트맵 조인 인덱스 선택에 관한 연구)

  • An, Hyoung-Geun;Koh, Jae-Jin
    • The KIPS Transactions:PartD
    • /
    • v.19D no.1
    • /
    • pp.1-14
    • /
    • 2012
  • As the size of the data warehouse is large, the selection of indices on the data warehouse affects the efficiency of the query processing of the data warehouse. Indices induce the lower query processing cost, but they occupy the large storage areas and induce the index maintenance cost which are accompanied by database updates. The bitmap join indices are well applied when we optimize the star join queries which join a fact table and many dimension tables and the selection on dimension tables in data warehouses. Though the bitmap join indices with the binary representations induce the lower storage cost, the task to select the indexing attributes among the huge candidate attributes which are generated is difficult. The processes of index selection are to reduce the number of candidate attributes to be indexed and then select the indexing attributes. In this paper on bitmap join index selection problem we reduce the number of candidate attributes by the data mining techniques. Compared to the existing techniques which reduce the number of candidate attributes by the frequencies of attributes we consider the frequencies of attributes and the size of dimension tables and the size of the tuples of the dimension tables and the page size of disk. We use the mining of the frequent itemsets as mining techniques and reduce the great number of candidate attributes. We make the bitmap join indices which have the least costs and the least storage area adapted to storage constraints by using the cost functions applied to the bitmap join indices of the candidate attributes. We compare the existing techniques and ours and analyze them in order to evaluate the efficiencies of ours.

Implementation of a Virtual Environment Data Representation Interface (가상환경 데이터 표현 인터페이스 구현)

  • Lee, Myeong-Won;Lee, Min-Geun;Lee, Sol-Me;Leem, Tai-Jin;Kim, Sung-Gon
    • Journal of the Korea Computer Graphics Society
    • /
    • v.10 no.3
    • /
    • pp.9-16
    • /
    • 2004
  • 가상환경의 표현 정보가 의미있는 데이터로서 사용되게 하기 위해서는 지구상 모든 물체를 유일하게 정의하고 표현할 수 있는 데이터 구성 체계가 요구된다. 이를 위해서는 화면에 표현할 물체의 속성 정보가 표준화된 기술 방법에 따라서 표현되어야 한다. 이것은 가상환경 정보가 실세계 정보처리 분야에서 의미있는 데이터로서 유효하게 사용되도록 하기 위해서 모든 물체에 대한 고유한 물리적 정보 기술 방법이 고려되어야 함을 의미한다. 여기에는 물체 표현에 필요한 외관에 관한 정보 뿐 아니라 물체의 내부 표현을 포함하여 물체의 기능 및 성능 표현, 길이 및 무게, 지리적 위치 등의 속성 정보까지 모두 표현되고 관리될 수 있어야 한다. 본 논문에서는 이와 같은 속성 기술 방법을 위해서 lSO/IEC JTC1 SC24 WG8에서 표준화작업을 진행하고 있는 SEDRIS를 이용하여 물체의 모습과 속성을 표현하는 데이터구조를 가시화하고 이 데이터구조에 따라 물체의 모습을 렌더링하고 조작하는 가상환경 표현 인터페이스 구현에 대해 설명한다.

  • PDF

Definition of Data Maintenance Framework For Updating Spatial and Attributes Information of Steep Slopes and Derivation of Operation Plan (급경사지 관련 공간 및 속성정보 관리를 위한 데이터 유지관리 프레임워크 정의 및 운영방안 도출)

  • Sim, Gyoo-Seong;Moon, Chi-Gook;Kim, Jae-Young
    • Proceedings of the Korean Society of Disaster Information Conference
    • /
    • 2022.10a
    • /
    • pp.431-432
    • /
    • 2022
  • 최근 국내에서는 국소지역에서 단 시간 내 발생하는 돌발강우와 게릴라성 폭우와 같은 현상으로 붕괴위험지구 및 산사태 위험지역 등의 급경사지에서 재난 및 재해가 증가하는 있는 추세이다. 이와 같은 재난 및 재해의 증가는 우리나라의 지형 및 강우특성에 따라 지역적으로 다양한 양상으로 발생하고 있다. 급경사지의 지형 및 강우특성을 고려하고 재난 및 재해 발생을 최소화하기 위한 대책수립에 활용할 수 있는 데이터 유지 및 운영관리 방안이 필요한 실정이다. 본 연구에서는 급경사지 관련 공간 및 속성정보를 합리적이고 과학적으로 관리할 수 있는 방법을 도출하기 위하여 데이터 생애주기적인 관점에서의 데이터 수집, 입력, 갱신, 수정 등의 유지관리 개념을 도입하여 연구를 수행하였고 그 결과로 급경사지 관련 유관기관에서 생산하는 공간정보와 속성정보를 정기적으로 수집하고 수정·편집하여 변환 및 전송할 수 있는 급경사지 데이터 유지관리 프레임워크 정의 및 운영 방안을 도출 하였다.

  • PDF

The Extended Cube Tree for Distribution Area Query Processing in Spatial Data Warehouses (공간 데이터 웨어하우스에서 분포 지역 질의 처리를 위한 확장된 큐브 트리 기법)

  • 최준호;유병섭;박순영;배해영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.76-78
    • /
    • 2004
  • 최근 원격 탐사 시스템 등이 발전함에 따라 축적된 공간 데이터의 양이 증가했고 이를 공간 데이터 웨어하우스 분야에서 의사 결정에 활용하는 방안이 중요한 이슈가 되고 있다. 기존의 활용 방법은 주어진 영역을 기준으로 공간 범위-집계를 검색하는 형태였지만, 최근 특정 성향 분석을 위해 분포 질의를 요청하고 그 결과 지역에 대한 공간 분석을 통한 의사결정의 필요성이 대두되었다. 하지만 기존의 처리 방법으로 비공간 질의를 처리하기 위해서는 모든 데이터를 검색해야 하므로 분포 질의를 처리하기 위한 비용이 증가하게 된다. 본 논문에서는 분포 지역 질의 처리를 위한 확장된 큐브 트리 기법을 제안한다. 제안하는 기법은 분석하고자 하는 사실 테이블의 비공간 속성을 큐브 트리의 키로 사용하고, 이 속성과 관련된 공간 데이터의 포인터 집합을 관리한다. 본 논문의 제안 기법을 공간 데이터 웨어하우스에 적용함으로써 비공간 속성 질의를 통해 공간 객체를 결과로 요청하는 형태의 질의를 지원할 수 있게 되며 사실 컬럼을 계층화시킴으로서 사용자에게 좀 더 다각적인 분석을 지원할 수 있다.

  • PDF

A Loglet Analysis of Voice and Data Service Diffusion Pattern (Loglet 분석을 이용한 음성 및 데이터 서비스의 수요 확산 패턴 차이)

  • 김문수
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 2000.04a
    • /
    • pp.69-73
    • /
    • 2000
  • 정보통신기술의 역사는 다른 산업 기술에 비해 매우 일천하다. 그러나 현재 가장 빠르게 진보하고 있는 기술이며, 기업활동과 개인의 일상 생활에 커다란 영향 요소로 대두되고 있다. 특히 인터넷의 영향은 지대하다. 인터넷을 이용하여 기업의 생산성을 증대하거나 전자 상거래와 같은 새로운 형태의 사업 기회 제공의 장이 되고 있다. 또한 개인은 매우 다양하고 방대한 정보를 획득, 이용함으로써 자신의 효용을 극대화할 수 있다. 이는 사회, 경제의 새로운 패러다임의 출현으로까지 표현되고 있다. 따라서 과거의 음성통신 서비스 수요와 현재 및 미래의 데이터 통신 수요의 패턴에는 많은 차이가 존재할 수 있다. 본 논문은 대표적 음성 서비스인 전화 서비스 그리고 데이터 서비스라 할 수 있는 인터넷 서비스를 대상으로 수요 속성별 즉, 업무용과 가정용 수요의 확산 패턴을 Logier 분석을 이용하여 고찰하였다. 분석 결과 전체적으로 음성보다는 데이터 수요 확산 속도가 컸으며, 수요 속성별로는 데이터 서비스에서 업무용보다 가정용확산이 음성의 경우보다 훨씬 빠르게 이루어지고 있었다. 그리고 인터넷 가입에 대한 여러 결과를 얻었으며, 이는 정보통신관련 기업과 정책 당국자에게 매우 중요한 자료로 활용할 수 있을 것으로 기대된다.

  • PDF

Clustering Algorithm for Data Mining using Posterior Probability-based Information Entropy (데이터마이닝을 위한 사후확률 정보엔트로피 기반 군집화알고리즘)

  • Park, In-Kyoo
    • Journal of Digital Convergence
    • /
    • v.12 no.12
    • /
    • pp.293-301
    • /
    • 2014
  • In this paper, we propose a new measure based on the confidence of Bayesian posterior probability so as to reduce unimportant information in the clustering process. Because the performance of clustering is up to selecting the important degree of attributes within the databases, the concept of information entropy is added to posterior probability for attributes discernibility. Hence, The same value of attributes in the confidence of the proposed measure is considerably much less due to the natural logarithm. Therefore posterior probability-based clustering algorithm selects the minimum of attribute reducts and improves the efficiency of clustering. Analysis of the validation of the proposed algorithms compared with others shows their discernibility as well as ability of clustering to handle uncertainty with ACME categorical data.

Discretization of Continuous-Valued Attributes considering Data Distribution (데이터 분포를 고려한 연속 값 속성의 이산화)

  • Lee, Sang-Hoon;Park, Jung-Eun;Oh, Kyung-Whan
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.13 no.4
    • /
    • pp.391-396
    • /
    • 2003
  • This paper proposes a new approach that converts continuous-valued attributes to categorical-valued ones considering the distribution of target attributes(classes). In this approach, It can be possible to get optimal interval boundaries by considering the distribution of data itself without any requirements of parameters. For each attributes, the distribution of target attributes is projected to one-dimensional space. And this space is clustered according to the criteria like as the density value of each target attributes and the amount of overlapped areas among each density values of target attributes. Clusters which are made in this ways are based on the probabilities that can predict a target attribute of instances. Therefore it has an interval boundaries that minimize a loss of information of original data. An improved performance of proposed discretization method can be validated using C4.5 algorithm and UCI Machine Learning Data Repository data sets.

Satellite Image Retrieval using Feature Vectors (속성벡터를 이용한 위성영상의 검색)

  • 박수영;최동훈;곽장호;김준철;이준환
    • Proceedings of the IEEK Conference
    • /
    • 2001.09a
    • /
    • pp.735-738
    • /
    • 2001
  • 위성영상은 그 특성상 다중대역과 방대한 양의 영상 데이터로 이루어져 있으며, 방대한 양의 데이터에서 필요한 영상정보를 검색하기 위해서는 위성영상 검색에 적용 가능한 다중대역의 화소벡터, 질감 및 이들의 공간분포를 효과적으로 얻어낼 수 있는 속성을 추출하여 활용하는 것이 필요하다. 따라서 본 논문에서는 위성영상 검색에 유용하게 사용할 수 있는 속성으로 다중대역의 화소벡터 값과 질감 정보를 동시에 추출하면서 UV(Color Coherent Vector)의 개념을 적용하여 이들의 공간분포에 관한 정보를 포함한 새로운 속성을 정의하였고, SPOT 위성영상을 이용하여 국부적인 질의 영상의 속성벡터와 광범위한 지역의 위성영상에서 부분영상들의 속성벡터와의 유사성 비교를 통하여 원하는 부분영상을 검색하는 방법으로 그 성능을 평가하였다. 제안된 검색방식은 칼라와 질감 그리고 이들의 공간적인 분포 등을 개별적으로 추출하여 조합하는 과정이 필요 없으며, 특히 위성영상이나 특정 도메인에 종속되지 않기 때문에 다양한 내용기반 영상정보 검색에 효과적으로 이용될 수 있을 것으로 사료된다.

  • PDF

Vertical Relation Partitioning Method With Attribute Replications (속성 중복을 고려한 릴레이션의 수직 분할방법)

  • 유종찬;김재련
    • Proceedings of the Korea Database Society Conference
    • /
    • 1997.10a
    • /
    • pp.504-514
    • /
    • 1997
  • 관계형 데이터베이스의 성능을 향상시키는데 중요한 요소 중의 하나는 트랜잭션을 처리하기 위해 데이터를 디스크에서 주기억장치로 옮기는데 필요한 디스크 액세스(access) 횟수이다. 본 연구는 관계형 데이터베이스에서 트랜잭션을 처리할 때, 릴레이션(relation)을 수직분할하여 디스크에 단편(fragment)으로 저장하므로써 필요한 단편만 액세스하여 액세스 횟수를 감소시키는데 목적이 있다. 단편에 속성을 중복할당하여 수직분할하므로써 트랜잭션을 만족시키는 단편의 수를 감소시켜 중복할당을 고려하지 않은 방법보다 디스크 액세스 횟수를 감소시킬 수 있다. 갱신트랜잭션의 경우 하나의 속성이 갱신되면 중복된 속성을 모두 갱신하여야 하므로 액세스 횟수가 증가하지만, 조회트랜잭션의 경우 각 단편에 속성을 중복할당하여 액세스 횟수를 감소시킬 수 있다. 본 연구에서는 속성의 중복을 허용하여 단편을 구성하는 경우에 중복을 고려하지 않은 경우를 포함하므로 효과적으로 디스크 액세스 횟수를 감소시킬 수 있다. 본 연구에서는 중복할당을 고려하여 디스크의 액세스 횟수를 최소화시킬 수 있는 수직분할문제의 0-1 정수계획모형을 개발하고, 모형에 대한 최적해법으로 분지한계법을 제안한다.

  • PDF

Mining Generalized Fuzzy Quantitative Association Rules with Fuzzy Generalization Hierarchies (퍼지 일반화 계층을 이용한 일반화된 퍼지 정량 연관규칙 마이닝)

  • 한상훈;손봉기;이건명
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2001.05a
    • /
    • pp.8-11
    • /
    • 2001
  • 연관규칙 마이닝은 트랜잭션 데이터를 이루고 있는 항목간의 잠재적인 의존관계를 발견하는 데이터 마이닝의 한 분야이다. 정량 연관규칙이란 부류적 속성과 정량적 속성을 모두 포함한 연관규칙이다. 정량 연관규칙 마아닝을 위한 퍼지 기술의 응용, 정량 연관규칙 마이닝을 위한 일반화된 연관규칙 마이닝, 사용자의 관심도를 반영한 중요도 가중치가 있는 연관규칙 마이닝 등에 대한 연구가 이루어져 왔다. 이 논문에서는 중요도 가중치가 있는 일반화된 퍼지 정량 연관규칙 마이닝의 새로운 방법을 제안한다. 이 방법은 부류적 속성의 퍼지 개념 계층과 정량적 속성의 퍼지 언어항 일반화 계층을 일반화된 추출하기 위해 이용한다. 이것은 속성들의 수준별 일반화 계층과 속성의 중요도 가중치를 이용함으로써 사용자가 보다 융통성 있는 연관규칙을 마이닝할 수 있게 해준다.

  • PDF