• 제목/요약/키워드: 데이터 비교

Search Result 12,347, Processing Time 0.051 seconds

A Study on the Development of Framework for Enhancing Data Quality in Data Warehouse Environments (데이터 웨어하우스 환경에서 데이터 품질의 향상을 위한 개념적 프레임워크의 개발에 관한 연구)

  • 정경수;김병곤;장상도
    • Proceedings of the Korea Database Society Conference
    • /
    • 1999.10a
    • /
    • pp.191-201
    • /
    • 1999
  • 데이터 웨어하우스와 데이터 품질에 관한 문헌연구를 통하여 데이터 웨어하우스 환경에서 데이터 품질의 향상을 위한 개념적 프레임워크를 개발하고자 하는 것이 본 연구의 목적이다. 데이터 웨어하우스 데이터 품질향상 활동을 지원하는 프레임워크를 개발하는 목적은 (1) 다양한 요구를 가진 사용자들이 웨어하우스 데이터에 접근하기 때문에, 사용자의 요구를 만족시키며 기업의 목적에 적합한 품질향상 활동을 지원하기 위해서이며, 다양한 기업활동을 가장 잘 지원할 수 있는 데이터 품질향상 지침을 관리자에게 제공하기 위해서 이다. (2) 웨어하우스 관리자의 데이터 품질향상 활동을 지원하기 위해서는 품질차원이나 데이터세트 등과같은 품질향상에 필요한 다양한 이슈를 관리자가 인식할 수 있도록 하기 위해서이다. (3) 데이터 웨어하우스 환경에서 데이터 품질 향상에 필요한 체계적이고 포괄적인 안목을 제공하기 위해서이다. 본 연구는 다음과 같은 단계로 수행하게 된다. 첫째, 데이터 웨어하우스의 개념과 데이터 웨어하우스의 구축단계 및 데이터 웨어하우스를 구성하는 프레임워크를 검토한다. 둘째, 데이터 웨어하우스 환경에서의 데이터 품질의 기준과 데이터 품질의 측정 및 데이터 품질의 향상 방안 등을 고찰한다. 셋째, 데이터 웨어하우스 환경에서 데이터 품질의 향상을 위한 개념적 프레임워크를 개발하기 위하여 데이터 웨어하우스 데이터 풀질 향상과 관련된 기업활동, 데이터 세트, 품질의 속성 및 차원 등을 정의한다. 마지막으로 데이터 웨어하우스 환경하에서 데이터 품질을 향상할 수 있는 3차원 구조의 개념적 프레임워크를 제안하며, 나아가 제안한 모형에 대하여 데이터 품질 향상을 위한 프로젝트 활동의 사례를 통하여 모형의 타당성을 개념적으로 설명한다.통하여 각각의 제품을 비교하였으며, 둘째 소프트웨어 종류별 평가로 제품을 응용소프트웨어, 응용개발도구, 시스템 소프트웨어로 분류하여 평균값으로 비교하였다. 셋째, 국내외 제품별 평가분석으로 전체 제품을 국내제품과 국외제품으로 분류하여 비교하였으며, 마지막으로 총괄분석을 통해 가중치를 적용하여 전 제품의 점수를 비교하였다. 여기에서는 각 제품의 평균점수에 대한 차이를 95%의 유의수준으로 T-Test를 실시하였다.uted to the society, and what the socioeconomic impacts are resulted from the program. It would be useful for the means of (ⅰ) fulfillment of public accountability to legitimate the program and to reveal the expenditure of pubic fund, and (ⅱ) managemental and strategical learning to give information necessary to improve the making. program and policy decision making, The objectives of the study are to develop the methodology of modeling the socioeconomic evaluation, and build up the practical socioeconomic evaluation model of the HAN projects including scientific and technological effects. Since the HAN projects cons

  • PDF

Visualization of Multiple Transcript Sequences and Comparison using Boolean Query (다중 전사체 서열의 시각화와 불리언 질의를 이용한 비교)

  • Park, TaeWon;Cho, Hwan-Gue;Lee, DoHoon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.11a
    • /
    • pp.1330-1332
    • /
    • 2012
  • 생물정보학 데이터를 분석하는 과정에서 서열 데이터의 시각화는 연구자에게 방대한 서열 데이터의 특성을 눈으로 쉽게 이해하기 위한 필수 과정이다. 대조 실험 데이터나 다중 서열 데이터를 시각화해 주는 많은 도구들이 있지만 방대한 유전체 서열에서 사용자가 원하는 다중 데이터간의 비교 영역을 찾아서 시각화해주는 기능이 부족한 것이 현 상황이다. 본 논문은 불리언 질의를 통해서 다중 전사체 서열을 효율적으로 비교하고 그 결과를 시각화해주는 방법을 제안한다.

Ananlyzing Customer Management Data by Datamining (Focused on Apartment Customer Classification) (데이터마이닝을 통한 고객관리데이터의 분석 (아파트고객 세분화를 중심으로))

  • Baek, Shin Jung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.05a
    • /
    • pp.69-72
    • /
    • 2004
  • 기업간의 경쟁이 심화되고 정보의 중요성에 대한 인식이 확대되어 가는 상황에서 다량의 데이터로부터 가치 있는 데이터를 추출하는 CRM 데이터 마이닝은 중대한 관심사가 아닐 수 없다. 본 연구는 데이터마이닝의 여러 활용 분야 중 고객세분화를 위해 최근 많이 사용되고 있는 데이터마이닝 기법인 로지스틱 회귀분석, 의사결정나무, 신경망 알고리즘 기법들을 비교하며, 이를 실제 아파트 고객의 데이터를 이용하여 검증하고자 한다. 따라서, 아파트 고객 세분화를 위한 데이터마이닝 수행시 기법 선택의 기준과 비교 평가의 기준을 제시하는 데 연구목적 있다.

  • PDF

Implementation and comparison with Structured data collection modules (정형 빅데이터 수집 모듈 구현 및 비교)

  • Jang, Dong-Hwon;Lee, Min-Woo;Kim, Woosaeng
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2014.04a
    • /
    • pp.635-638
    • /
    • 2014
  • 빅데이터 시대의 대두에 따라 기존의 관계형 데이터베이스로는 처리하기 어려운 형태의 데이터가 발생하였다. 이런 성질의 데이터를 저장, 활용하기 위한 방법으로 Apache 하둡이 널리 사용되고 있다. 기존의 RDBMS 상의 데이터를 하둡 데이터 분석의 원천 데이터로 활용하려고 하는 경우, 혹은 데이터 크기와 복잡도의 증가로 저장방식을 바꿔야 하는 경우 데이터를 HDFS(Hadoop Distributed File System) 으로 전송해야 한다. 본 논문에서는 정형 데이터 수집 모듈인 Sqoop과 Nosqoop4u의 개발을 통하여 데이터 전송 성능을 비교하였다.

Comparative Analysis of 3D Spatial Data Models (3차원 공간정보 데이터 모델 비교 분석)

  • Park, Se-Ho;Lee, Ji-Yeong
    • Spatial Information Research
    • /
    • v.17 no.3
    • /
    • pp.277-285
    • /
    • 2009
  • Each system should have a suitable data model about their purpose for efficiently managing, analyzing, and manipulating data. And the usable range of application is determined by the data model, and suitable data models are being developed for each application. In GIS, diversity spatial data model is being developed too. The accuracy and update of the spatial data would be important for applying efficient application as well as the data modeling is important as constructing the spatial data structure. Therefore, the purposes of this research are to 1)compare domestic spatial data models with oversea spatial data models about their geometry model, topology model and visualizing method of 3D spatial data 2)to compare the features of the data model by analyzing each data structures. We 3)compare and analyze features of each spatial data models via the quantitative analysis of each spatial data models.

  • PDF

Characteristics and Analysis of Wireless Data Communications Method (무선데이터 통신 방식별 특징 및 비교분석)

  • Lee, Yeong-Hwan;Mok, Jin-Dam
    • Electronics and Telecommunications Trends
    • /
    • v.11 no.1 s.39
    • /
    • pp.85-103
    • /
    • 1996
  • 본 고에서는 현재 서비스하려고 하는 무선데이터 통신의 방식에 대한 망 구성 및 특징들에 대해 살펴보고, 기존망을 이용한 서비스와 전용망을 이용한 서비스를 비교하였다. 또한, 전용망들(모토롤라의 DataTAC과 에릭슨의 Mobitex)을 비교하였다. 기존망을 이용한 방식과 전용망을 이용한 방식의 비교는 국내 무선데이터 통신서비스 활성화 측면, 국내 기술개발 활성화 측면, 그리고 국제 경쟁력 강화 측면에 대하여 비교하였으며, 전용망을 이용한 두가지 방식 사이의 비교는 우선 외향적인 제원, 망 신뢰성 및 확장성, 시스템 각 부분별 성능, 각 제조업체의 시스템 설치 및 지원에 관한 사항을 비교하였다.

A Comparison Environment of Aerospace e-Science Experiments (항공 우주 e-Science에서의 실험 비교 환경)

  • Cho, Jung-Hyun;Hong, Mi-Hyun;Cho, Hye-Kyung;Kim, Yoon-Hee;Kim, Chong-Am;Cho, Kum-Won
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.06b
    • /
    • pp.432-436
    • /
    • 2007
  • e-AIRS(e-Science Aerospace Integrated Research System)는 항공 우주 분야의 e-Science[1]를 제공하여 복잡한 문제를 해결하고 협력적인 연구 지원하기 위해 사용자 기반의 통합적 비교 환경을 구축하였다. e-AIRS에서는 CFD(Computational Fluid Dynamics)[2] 시뮬레이션 서비스 및 원격 실험 서비스를 제공하고 이 서비스들에서 도출된 결과 데이터에 대해 비교, 분석할 수 있는 환경을 제공한다. 사용자가 시뮬레이션 데이터와 실험 데이터를 비교 하여 오차가 큰 케이스에 대해 계산하고자 할 때, 계산 범위와 그에 따른 환경 값을 설정하면, 자동적으로 서브 케이스를 생성하여 계산함으로써 사용자에게 한 번의 실험으로 다양한 결과를 분석할 수 있는 연구 환경을 제공한다. 또한 연구자간 비교, 협력 환경을 지원하기 위해 사용자간에 협업 환경을 구성하고 기존의 시각적 데이터 공유 환경을 보완하여 연구자간 데이터 공유가 가능한 회의 환경을 제공하였다.

  • PDF

Comparison of Detection Performance of Intrusion Detection System Using Fuzzy and Artificial Neural Network (퍼지와 인공 신경망을 이용한 침입탐지시스템의 탐지 성능 비교 연구)

  • Yang, Eun-Mok;Lee, Hak-Jae;Seo, Chang-Ho
    • Journal of Digital Convergence
    • /
    • v.15 no.6
    • /
    • pp.391-398
    • /
    • 2017
  • In this paper, we compared the performance of "Network Intrusion Detection System based on attack feature selection using fuzzy control language"[1] and "Intelligent Intrusion Detection System Model for attack classification using RNN"[2]. In this paper, we compare the intrusion detection performance of two techniques using KDD CUP 99 dataset. The KDD 99 dataset contains data sets for training and test data sets that can detect existing intrusions through training. There are also data that can test whether training data and the types of intrusions that are not present in the test data can be detected. We compared two papers showing good intrusion detection performance in training and test data. In the comparative paper, there is a lack of performance to detect intrusions that exist but have no existing intrusion detection capability. Among the attack types, DoS, Probe, and R2L have high detection rate using fuzzy and U2L has a high detection rate using RNN.