• 제목/요약/키워드: data quality

검색결과 20,623건 처리시간 0.049초

A Data Quality Management Maturity Model

  • Ryu, Kyung-Seok;Park, Joo-Seok;Park, Jae-Hong
    • ETRI Journal
    • /
    • 제28권2호
    • /
    • pp.191-204
    • /
    • 2006
  • Many previous studies of data quality have focused on the realization and evaluation of both data value quality and data service quality. These studies revealed that poor data value quality and poor data service quality were caused by poor data structure. In this study we focus on metadata management, namely, data structure quality and introduce the data quality management maturity model as a preferred maturity model. We empirically show that data quality improves as data management matures.

  • PDF

빅 데이터의 품질 요소 제안 (A propose of Big data quality elements)

  • 최상균;전순천
    • 한국항행학회논문지
    • /
    • 제17권1호
    • /
    • pp.9-15
    • /
    • 2013
  • 빅 데이터가 새로운 가치 창출과 문제 해결의 핵심 엔진이 되는 데이터 중심 시대가 본격적으로 시작되고 있다. 본 논문은 빅 데이터를 활용하기 위하여 빅 데이터의 품질 확보를 위한 품질 요소 정의와 품질 요소별 품질확보 전략에 대하여 논한다. 이를 위해 빅 데이터의 구축 사례, 빅 데이터의 자원 확보 방안 및 빅 데이터의 요소기술, 분석기술과 처리기술 등에 대해 살펴 보았다. 이를 통하여 빅 데이터의 품질 요소를 정의하고 품질 요소별 품질 확보 전략을 제안한다. 빅 데이터의 품질이 확보되면 기업은 대용량의 데이터에서 데이터의 재해석을 통하여 빅 데이터를 추출하고 기업의 경쟁력 제고를 위한 각종 전략을 수립할 것이다.

연구데이터 품질관리를 위한 프로세스 모델 제안 (Proposal of Process Model for Research Data Quality Management)

  • 한나은
    • 정보관리학회지
    • /
    • 제40권1호
    • /
    • pp.51-71
    • /
    • 2023
  • 본 연구는 공공데이터 품질관리 모델, 빅데이터 품질관리 모델, 그리고 연구데이터 관리를 위한 데이터 생애주기 모델을 분석하여 각 품질관리 모델에서 공통적으로 나타나는 구성 요인을 분석하였다. 품질관리 모델은 품질관리를 수행하는 객체인 대상 데이터의 특성에 따라 생애주기에 맞추어 혹은 PDCA 모델을 바탕으로 구축되고 제안되는데 공통적으로 계획, 수집 및 구축, 운영 및 활용, 보존 및 폐기의 구성요소가 포함된다. 이를 바탕으로 본 연구는 연구데이터를 대상으로 한 품질관리 프로세스 모델을 제안하였는데, 특히 연구데이터를 대상 데이터로 하여 서비스를 제공하는 연구데이터 서비스 플랫폼에서 데이터를 수집하여 서비스하는 일련의 과정에서 수행해야하는 품질관리에 대해 계획, 구축 및 운영, 활용단계로 나누어 논의하였다. 본 연구는 연구데이터 품질관리 수행 방안을 위한 지식 기반을 제공하는데 의의를 갖는다.

Saliency Score-Based Visualization for Data Quality Evaluation

  • Kim, Yong Ki;Lee, Keon Myung
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제15권4호
    • /
    • pp.289-294
    • /
    • 2015
  • Data analysts explore collections of data to search for valuable information using various techniques and tricks. Garbage in, garbage out is a well-recognized idiom that emphasizes the importance of the quality of data in data analysis. It is therefore crucial to validate the data quality in the early stage of data analysis, and an effective method of evaluating the quality of data is hence required. In this paper, a method to visually characterize the quality of data using the notion of a saliency score is introduced. The saliency score is a measure comprising five indexes that captures certain aspects of data quality. Some experiment results are presented to show the applicability of proposed method.

원천 데이터 품질이 빅데이터 분석결과의 유용성과 활용도에 미치는 영향 (An Empirical Study on the Effects of Source Data Quality on the Usefulness and Utilization of Big Data Analytics Results)

  • 박소현;이국희;이아연
    • Journal of Information Technology Applications and Management
    • /
    • 제24권4호
    • /
    • pp.197-214
    • /
    • 2017
  • This study sheds light on the source data quality in big data systems. Previous studies about big data success have called for future research and further examination of the quality factors and the importance of source data. This study extracted the quality factors of source data from the user's viewpoint and empirically tested the effects of source data quality on the usefulness and utilization of big data analytics results. Based on the previous researches and focus group evaluation, four quality factors have been established such as accuracy, completeness, timeliness and consistency. After setting up 11 hypotheses on how the quality of the source data contributes to the usefulness, utilization, and ongoing use of the big data analytics results, e-mail survey was conducted at a level of independent department using big data in domestic firms. The results of the hypothetical review identified the characteristics and impact of the source data quality in the big data systems and drew some meaningful findings about big data characteristics.

비정형데이터의 AI학습을 위한 영상/이미지 데이터 품질 향상 방법 (Method for improving video/image data quality for AI learning of unstructured data)

  • 김승희;류동주
    • 융합보안논문지
    • /
    • 제23권2호
    • /
    • pp.55-66
    • /
    • 2023
  • 최근 전세계적으로 사회 모든 분야에서 인공지능 학습용 데이터에 관한 선행연구를 기반으로, 인공지능 학습용 데이터의 가치를 높이고 고품질 데이터를 확보하고자 하는 움직임이 늘고 있다. 따라서, 고품질 데이터를 확보하기 위한 구축사업에서는 품질관리가 매우 중요하다. 이에, 본 논문에서는 인공지능 학습용 데이터를 구축할 시 고품질데이터 확보를 위한 품질관리와 그에 따른 구축공정별 개선방안을 제시하였다. 특히, 인공지능 학습을 위해 구축되는 비정형데이터는 데이터 품질의 80% 이상이 구축과정에서 결정된다. 본 논문에서는 비정형데이터 이미지/영상데이터에 대한 품질검사를 통해 구축단계에서의 획득, data cleaning, labeling 모델에서 발생된 검사절차 및 문제 요소를 해결함으로써 고품질 데이터 확보 방안을 제시하였으며, 제시한 방안을 토대로 인공지능 학습용 데이터 구축에 참여하는 연구단체와 사업자들에게 데이터의 품질편차를 극복하기 위한 대안이 될 것으로 기대된다.

디지털 트윈국토 건물 데이터 품질 표준 개발을 위한 항목 도출에 관한 연구 (A Study on the Derivation of Items for Development of Data Quality Standard for 3D Building Data in National Digital Twin)

  • 김병선;이희석;홍상기
    • 지적과 국토정보
    • /
    • 제52권1호
    • /
    • pp.37-55
    • /
    • 2022
  • 본 연구는 디지털 트윈국토 건물 데이터 품질 표준을 개발하기 위한 품질 항목 모델을 제시하는데 목적이 있다. 이를 위해 3차원 공간정보 오류의 특징과 품질 표준 필요성에 대해 도출하였으며, 디지털 트윈국토 건물 품질 개발에 필요한 데이터 모델 표준과 공간정보 품질 표준에 대해 분석하였다. 이러한 내용을 토대로 디지털 트윈국토 건물 데이터의 품질 평가 범위, 품질 표준 확장 요소(기하 무결성, 기하 충실도, 위치 정확성, 시맨틱 분류 정확성) 및 품질 항목 모델(안)을 제시하였다. 본 연구에서 제안한 디지털 트윈국토 건물 품질 항목모델은 디지털 트윈국토 품질 표준 개발은 물론 이와 관련된 다양한 디지털 트윈국토 공간정보표준 개발에 기여할 것으로 판단된다.

데이터 품질진단을 위한 자동화도구 개발 (Development of Automated Tools for Data Quality Diagnostics)

  • 고재환;김동수;한기준
    • 한국IT서비스학회지
    • /
    • 제11권4호
    • /
    • pp.153-170
    • /
    • 2012
  • When companies or institutes manage data, in order to utilize it as useful resources for decision-making, it is essential to offer precise and reliable data. While most small and medium-sized enterprises and public institutes have been investing a great amount of money in management and maintenance of their data systems, the investment in data management has been inadequate. When public institutions establish their data systems, inspection has been constantly carried out on the data systems in order to improve safety and effectiveness. However, their capabilities in improving the quality of data have been insufficient. This study develops an automatic tool to diagnose the quality of data in a way to diagnose the data quality condition of the inspected institute quantitatively at the stage of design and closure by inspecting the data system and proves its practicality by applying the automatic tool to inspection. As a means to diagnose the quality, this study categorizes, in the aspect of quality characteristics, the items that may be improved through diagnosis at the stage of design, the early stage of establishing the data system and the measurement items by the quality index regarding measurable data values at the stage of establishment and operation. The study presents a way of quantitative measurement regarding the data structures and data values by concretizing the measurement items by quality index in a function of the automatic tool program. Also, the practicality of the tool is proved by applying the tool in the inspection field. As a result, the areas which the institute should improve are reported objectively through a complete enumeration survey on the diagnosed items and the indicators for quality improvement are presented quantitatively by presenting the quality condition quantitatively.

데이타 품질 측정 도구 (A Data Quality Measuring Tool)

  • 양자영;최병주
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제9권3호
    • /
    • pp.278-288
    • /
    • 2003
  • 소프트웨어 제품을 실행시키기 위해 요구되는 데이타의 품질은 소프트웨어 품질에 영향을 미치고 있다 특히 대용량의 데이타로부터 의미 있는 지식을 추출하는 지식공학 시스템에서 원시 데이터의 품질을 보장하는 일은 매우 중요하다. 본 논문에서는 데이타의 측정 도구인 DAQUM도구를 설계 구현하였다. 본 논문에서는 DAQUM도구의 설계 및 구현에 관한 주요내용을 기술하고, 사례연구를 통하여 DAQUM도구가 오류데이타를 검색하여 데이타 사용자 관점에서 데이타의 품질을 정량적으로 측정 가능하도록 함을 나타낸다. DAQUM도구는 데이타의 품질 측정 및 품질 제어를 가능하게 함으로써 데이타를 주로 처리하는 소프트웨어 제품의 품질 향상에 기여할 수 있다.

공공개방데이터 품질 특성에 관한 연구 (Quality Characteristics of Public Open Data)

  • 박고은;김창재
    • 디지털융복합연구
    • /
    • 제13권10호
    • /
    • pp.135-146
    • /
    • 2015
  • 공공데이터 개방은 민간을 포함한 누구나 공공데이터를 자유롭게 재이용하여 국민 삶의 질을 높이고 신(新) 산업, 일자리 창출로 창조 경제 활성화에 기여하고자 하는 목표를 가진다. 공공데이터 개방은 전 세계적으로 중요성이 강조되고 있는 정책이며, 개방의 성공 사례들이 만들어지고 있다. 공공개방데이터는 공공의 목적을 달성하기 위해 이에 적합한 품질을 갖추어야 한다. 그러나 공공데이터 품질 관리와 표준화의 미흡으로 인한 오류데이터 발견 및 활용성 저하 문제가 제기되며, 품질에 관한 가이드라인이 미흡하다. 이에 본 연구에서는 기존의 데이터 품질과 공공데이터 품질, 공공 서비스 품질에 관한 복합적 시각을 적용한 연구를 통해 개방 공공데이터가 갖춰야 할 품질 특성에 대해 도출하고 전문가 설문을 통해 모델을 수정 및 검증하였으며, 그 결과 공공개방데이터의 품질 특성으로 공공성, 활용성, 신뢰성, 적합성을 도출하였다. 공공개방데이터의 품질 향상과 활용 활성화를 위해 갖춰야 할 품질 특성을 제시함에 본 연구의 의의가 있다.