• Title/Summary/Keyword: 속성데이터

Search Result 1,598, Processing Time 0.025 seconds

A Study on Attribute Index for Evaluation of Data Governance (Data Governance 평가를 위한 속성지표 연구)

  • Jang, Kyoung-Ae;Kim, Woo-Je
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.6 no.2
    • /
    • pp.57-66
    • /
    • 2017
  • The academic research on data governance is still in its infancy and focused on the definition of concept and components. However, we need to study of evaluation on data governance to help make decision of establishment. The purpose of this paper is to develop of attribute index in data governance framework. Therefore, in this paper, we used RGT (repertory grid technique) and Laddering techniques for experts interview and survey for validation of disinterested third party experts and analysis statistically. We completed data governance attribute index which is composed of data compliance area including 8 components, data quality area including 16 components and data organization area including 7 components. Moreover, the evaluation attributes is prioritized and ranked using the AHP. As a result of the study, this paper can be used for the base line data in introducing and operating data governance in an IT company.

Evaluation Criteria of Attributes of Classes and Objects of Data Repositories for Structural Experiment Information (구조실험 정보를 위한 데이터 저장소의 클래스와 객체의 속성구성 평가요소)

  • Lee, Chang-Ho
    • Journal of the Computational Structural Engineering Institute of Korea
    • /
    • v.27 no.6
    • /
    • pp.653-662
    • /
    • 2014
  • The data repositories for structural experiment information needs to be efficient to use in order to allow structural engineers and researchers to store and retrieve easily the information involved in the structural experiments. The data repositories can be evaluated in terms of the organization of the data repositories themselves and of the organization of the actual experiment information in the data repositories, which can be represented using classes and objects with their attributes. This paper proposes the evaluation criteria of attributes of the classes and objects. The evaluation criteria of the attributes of the classes, such as the number of attributes in class and the numbers of the data-valued and object entity-valued attributes, are used for understanding the complexity of the organization of the data repositories. The evaluation criteria of the attributes of the objects, such as the number of valued attributes in object, are used for describing how the actual experiment information is stored through the levels in the data repositories for the structural experiment information.

A New Learning Algorithm for Rare Class Classification (희귀 목적값 분류를 위한 학습 알고리즘)

  • Lee, Kwang-Ho;Lee, Chang-Hwan
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.11a
    • /
    • pp.39-42
    • /
    • 2006
  • 본 논문에서는 데이터 마이닝에서 발생되는 희귀 데이터를 분석하기 위한 희귀 목적값 분석의 새로운 알고리즘을 제시한다. 이를 위하여 속성들이 가지는 속성의 가중치 값과 속성값이 목적 속성에 미치는 가중치값을 정보이론에 입각하여 가중치 계산을 하고, 계산된 가중치값을 사용하여 스코어링 함으로써 희귀 목적값에 속한 데이터 예측/분류에 사용하는 방법을 제시하였다. 실험을 통해 본 알고리즘의 성능을 입증함은 물론 제안된 알고리즘이 희귀 데이터의 분류/학습에 좀 더 효과적이다는 것을 보였다.

  • PDF

An Implementation of Optimal Rules Discovery System: An Integrated Approach Based on Concept Hierarchies, Information Gain, and Rough Sets (최적 규칙 발견 시스템의 구현: 개념 계층과 정보 이득 및 라프셋에 의한 통합 접근)

  • 김진상
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.10 no.3
    • /
    • pp.232-241
    • /
    • 2000
  • This study suggests an integrated method based on concept hierarchies, information gain, and rough set theory for efficient discovery rules from a large amount of data, and implements an optimal rules discovery system. Our approach applies attribute-oriented concept ascension technique to extract generalized knowledge from a database, knowledge reduction technique to remove superfluous attributes and attribute values, and significance of attributes to induce optimal rules. The system first reduces the size of database by removing the duplicate tuples through the condition attributes which have no influences on the decision attributes, and finally induces simplified optimal rules by removing the superfluous attribute values by analyzing the dependency relationships among the attributes. And we induce some decision rules from actual data by using the system and test rules to new data, and evaluate that the rules are well suited to them.

  • PDF

Performance Estimation of Fuzzr Quantitative Association Rules and Crisp Quantitative Association Rules (퍼지 연관규칙과 연관규칙의 성능 평가)

  • 손영경;김명원
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.235-237
    • /
    • 2002
  • 연관규칙(association rule)이란 데이터 베이스에 존재하는 속성들 사이에 유사성 또는 패턴을 기술하는 것으로, 사용자에게 데이터에 관한 유용한 조보를 줄 수 있다. 그러나, 지금가지의 연관규칙은 이진 (boolean) 데이터 베이스에 존재하는 연관규칙의 발견에 대해서 주로 연구되어 왔으며, 정량적(수치적, quantitative) 속성을 갖는 데이터에 대한 연관규칙의 연구는 미비하였다. 그 이유는 정량적 속성을 갖는 데이터를 기호적(nominal) 속성값으로 바꾼 후 연관규칙 보다 성능이 우수함을 보이고 있다. 또한 본 논문에서는 퍼지 연관규칙에서 소속함수(항목, 아이템, 속성값)의 모양과 개수를 데이터 분포에 대한 통계적 특성을 나타내는 히스토그램을 이용하여 소속함수를 자동 생성하는 효율적인 연관규칙 추출방법을 제안한다

  • PDF

Predicting Protein-Protein Interactions Using Various Amino Acid Properties (다양한 아미노산 속성을 이용한 단백질 상호작용 예측)

  • 최일영;정유진
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.310-312
    • /
    • 2004
  • 이 논문에서는, 단백질의 상호작용을 다양한 아미노산의 속성과 Support Vector Machine(SVM)을 사용하여 예측하였다. SVM을 사용한 단백질 상호작용의 예측 시스템에 단백질 상호작용에 중요한 작용을 하는 아미노산의 속성을 사용하고 있다. 이번 실험은 9가지의 아미노산의 속성의 조합 즉, 511(2$^{9}$ -1)가지의 아미노산 속성을 SVM 학습데이터로 사용하여 예측시스템의 결과를 비교한다. 실험에는 Database of Interacting Proteins(DIP)를 사용하였다. 실험을 위하여 DIP의 H.pylori를 학습용데이터로 사용하고, E.coli를 예측데이터(검증데이터)로 사용하였다. 실험에 따르면 H.pylori의 학습데이터와 E.coli를 예측데이터의 가공에 '소수성'을 사용한 방법보다 '방향성'을 사용한 방법이 더 높은 수치를 나타냈다.

  • PDF

Multi-Attribute based on Data Management Scheme in Big Data Environment (빅 데이터 환경에서 다중 속성 기반의 데이터 관리 기법)

  • Jeong, Yoon-Su;Kim, Yong-Tae;Park, Gil-Cheol
    • Journal of Digital Convergence
    • /
    • v.13 no.1
    • /
    • pp.263-268
    • /
    • 2015
  • Put your information in the object-based sensors and mobile networks has been developed that correlate with ubiquitous information technology as the development of IT technology. However, a security solution is to have the data stored in the server, what minimal conditions. In this paper, we propose a data management method is applied to a hash chain of the properties of the multiple techniques to the data used by the big user and the data services to ensure safe handling large amounts of data being provided in the big data services. Improves the safety of the data tied to the hash chain for the classification to classify the attributes of the data attribute information according to the type of data used for the big data services, functions and characteristics of the proposed method. Also, the distributed processing of big data by utilizing the access control information of the hash chain to connect the data attribute information to a geographically dispersed data easily accessible techniques are proposed.

The System of Converged u-GIS Data Processing (u-GIS 융합데이터 처리 시스템)

  • Jang, In-Sung;Kim, Min-Soo;Kim, Ju-wan
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2009.05a
    • /
    • pp.584-587
    • /
    • 2009
  • 전통적으로 지리정보시스템은 지형데이터와 속성데이터가 결합된 정적인 공간정보를 처리한다. 기존 지리정보시스템을 발전시켜, 시간에 따라 위치 및 기하데이터가 변화는 동적인 시공간데이터에 연구가 한동안 진행되어 왔다. 최근 들어 유비쿼터스 컴퓨팅 환경에 대한 관심이 집중되면서, 센싱 데이터와 같이 속성데이터가 동적으로 계속 변화는 데이터가 급증하고 있고, 센서노드의 위치가 고정 또는 이동함에 따라 공간정보와 결합하여 관리될 필요성이 급증하고 있다. 이에 본 논문에서는 USN기술와 GIS기술을 융합하여 GeoSensor 정보를 효과적으로 관리할 수 있는 u-GIS 융합데이터 처리 시스템을 제안하고자 한다.

  • PDF

Hybrid Neural Network Clustering Using SOM and BP for DataMing (데이터 마이닝을 위한 신경망 클러스터링 기법에 관한 연구)

  • 김만선;이상용
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.160-162
    • /
    • 2001
  • 최근 대용량의 데이터베이스로부터 유용한 정보를 발견하고 데이터간에 존재하는 연관성을 탐색하고 분석하는 데이터 마이닝에 관한 많은 연구들이 진행되고 있다. 실제 응용분야에선 수집된 데이터는 시간이 지날수록 데이터의 양이 늘어나게 되고, 중복되는 속성과 잡음을 갖게 되어 마이닝 기법을 이용하는데 많은 시간과 비용이 소요된다. 또한 어느 속성이 중요한지 알 수 없어 중요한 속성이 중요하지 않은 속성에 의해 왜곡되거나 제대로 분석되지 않을 수 있다. 이 논문은 이러한 문제점들을 해결하기 위해, 대용량의 데이터에 적용할 수 있고 데이터에서 알려지지 않은 패턴을 발견할 뿐만 아니라, 사용자가 얻고자 하는 출력을 생성할 수 있는 혼합형 신경망 클러스터링 기법을 제안한다. 그리고 알고리즘의 타당성을 검증하기 위해 몇 가지 벤치마크데이터를 이용하여 본 논문의 타당성을 보인다.

  • PDF

Classification of emotion data using rough set on fuzzy inference (퍼지추론에서 러프집합을 이용한 감성 데이터의 분류)

  • 손창식;정환묵
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2004.10a
    • /
    • pp.145-148
    • /
    • 2004
  • 규칙 기반 추론 시스템에서 규칙의 속성 감축은 다양한 방법으로 제안되어 왔다. 규칙의 속성 감축은 퍼지 추론 시스템을 구현하는데 있어서 처리 시간을 단축시킬 수 있으나 규칙의 종속성 및 상관성을 고려하지 않을 경우 예상하지 못한 추론 결과를 얻을 수 있다. 따라서, 본 논문에서는 복합속성을 가진 규칙의 속성 감축과 상관성을 고려하기 위하여 러프집합의 특성 중 식별가능 행렬과 식별가능 함수를 이용하였다. 그리고 속성 감축에 사용된 규칙은 복합속성(composite attribute)을 가지는 감성 데이터를 이용하였다.

  • PDF