• Title/Summary/Keyword: 데이터 품질기준

검색결과 332건 처리시간 0.026초

국방데이터 품질관리를 위한 대상 체계 선정 기준 (Selection Criteria of Target Systems for Quality Management of National Defense Data)

  • 손지성;황윤영
    • 인터넷정보학회논문지
    • /
    • 제24권6호
    • /
    • pp.155-160
    • /
    • 2023
  • 국방부 또는 공공기관에서 관리하는 모든 데이터베이스 및 시스템의 데이터는 일정 품질 이상 보장하는 것이 원칙이나 대부분 다수의 정보시스템을 구축·운영하기 때문에 현실적으로 모든 시스템에 대한 데이터 품질관리는 한계가 있다. 국방데이터는 업무의 특성상 공개되지 않는 데이터가 대부분이고 군에서 업무의 필요 및 중요도에 따라 전략적으로 개발되거나 통합되어 관리하는 시스템이 많다. 또한, 무기체계에서 발생하는 센서데이터, 비정형데이터, 인공지능 학습데이터 등 데이터 품질관리가 필요한 다양한 유형의 많은 데이터가 축척되고 생성되고 있다. 그러나, 국방데이터를 위한 데이터 품질관리 가이드 및 품질관리 대상 선정에 대한 가이드가 부재한 상황이고, 공공데이터 품질관리 매뉴얼의 기준에 따라 국방데이터의 품질관리 대상 데이터베이스 및 시스템을 선정하기에는 선정 기준이 모호하며 실무 담당자에 의존적이다. 따라서, 본 논문에서는 국방데이터의 품질관리를 위한 대상 체계 선정 기준에 대하여 제안하며, 제안한 선정기준들과 기존 매뉴얼의 선정기준과의 관계성에 대하여 기술한다.

연구데이터 관점에서 본 거대언어모델 품질 평가 기준 제언 (A Proposal of Evaluation of Large Language Models Built Based on Research Data)

  • 한나은;서수정;엄정호
    • 정보관리학회지
    • /
    • 제40권3호
    • /
    • pp.77-98
    • /
    • 2023
  • 본 연구는 지금까지 제안된 거대언어모델 가운데 LLaMA 및 LLaMA 기반 모델과 같이 연구데이터를 주요 사전학습데이터로 활용한 모델의 데이터 품질에 중점을 두어 현재의 평가 기준을 분석하고 연구데이터의 관점에서 품질 평가 기준을 제안하였다. 이를 위해 데이터 품질 평가 요인 중 유효성, 기능성, 신뢰성을 중심으로 품질 평가를 논의하였으며, 거대언어모델의 특성 및 한계점을 이해하기 위해 LLaMA, Alpaca, Vicuna, ChatGPT 모델을 비교하였다. 현재 광범위하게 활용되는 거대언어모델의 평가 기준을 분석하기 위해 Holistic Evaluation for Language Models를 중심으로 평가 기준을 살펴본 후 한계점을 논의하였다. 이를 바탕으로 본 연구는 연구데이터를 주요 사전학습데이터로 활용한 거대언어모델을 대상으로 한 품질 평가 기준을 제시하고 추후 개발 방향을 논의하였으며, 이는 거대언어모델의 발전 방향을 위한 지식 기반을 제공하는데 의의를 갖는다.

데이터 오너 관리를 통한 데이터 품질 향상 (Improving data quality through Data Owners management)

  • 박지수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.278-281
    • /
    • 2007
  • 데이터 품질 기준은 반드시 현업의 입장에서 바라봐야 하며, 현업의 마인드가 데이터 품질에 가장 결정적인 영향을 미친다. 이에 따라 데이터 품질을 향상시키기 위해서는 현업이 데이터 품질 관리에 직접 참여할 수 있는 연구가 필요하다. 본 연구에서는 데이터 값(Data Value)에 대한 데이터 오너 (Owner)를 부여하여 데이터 품질 오류 시 현업이 직접 데이터 품질 관리 프로세스에 참여 할 수 있는 방안을 제시하였다. 데이터 품질 관리 프로세스는 데이터 품질 대상 및 기준을 정의하고 측정, 분석, 개선하는 방법이다. 본 연구에서 제시한 데이터 오너 관리 방안은 보다 효율적인 데이터 품질 관리 프로세스를 개선 시킬 수 있을 것이다.

금융산업에서의 데이터 품질이 경제적인 성과에 주는 영향의 실증분석 (An Empirical Analysis on the Effect of Data Quality on Economic Performance in the Financial Industry)

  • 이상호;박주석;김재경
    • 경영정보학연구
    • /
    • 제13권1호
    • /
    • pp.1-11
    • /
    • 2011
  • 본 연구는 한국 금융산업에서의 기업 데이터 품질이 경제적인 성과에 주는 영향을 2008년과 2009년 자료를 이용하여 실증적으로 분석하였다 데이터 품질은 한국데이터베이스진흥원에서 측정한 데이터 품질관리 프로세스 지수와 데이터 품질기준을 이용하였으며, 기업의 재무 성과는 금융감독원의 금융 통계정보시스템을 이용하여 수집하였다. 분석 결과, 데이터 품질은 기업의 매출액, 영업이익, 부가가치에 통계적으로 유의한 영향을 주었다. 데이터 품질관리 프로세스 지수가 1만큼 증가하면, 부가가치는 약 2.3%가 증가한다. 또한 데이터 품질기준이 1만큼 증가하면, 부가가치는 약 72.6%가 증가한다. 기업의 경영자는 데이터 품질을 개선시키도록 노력해야 하고, 경제정책 입안자들은 기업들이 데이터 품질에 관심을 갖고 데이터 품질을 개선시키도록 하는 유인책과 정책 방향을 수립해야 한다.

항로표지 데이터 품질지수 산출에 관한 연구

  • 정제한;한윤석;이예경;다이리;탕멍위엔;장준혁;신상문
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2022년도 춘계학술대회
    • /
    • pp.100-102
    • /
    • 2022
  • 데이터의 품질을 파악하고 그 기준을 선정하는 것은 해양 항로 표지와 같은 분석에 있어서 중요한 역할을 한다. 본 연구에서는 해양 분야에서 디지털 항로표지 데이터의 품질 진단을 위해 공정능력지수를 이용하여 데이터의 품질을 정량적으로 산출하고 그 결과에 대한 판정 기준을 명확히 하여 데이터에 대한 품질을 판단할 수 있는 척도를 제시하였다.

  • PDF

국내 GNSS 상시관측소 데이터 품질 및 관리규정 표준화에 관한 연구 (Standardization of Data Quality and Management Regulation for Korean CORS)

  • 황진상;김혁길;윤홍식;조재명
    • 한국측량학회지
    • /
    • 제33권4호
    • /
    • pp.245-258
    • /
    • 2015
  • 본 논문에서는 국내 GNSS 상시관측소의 올바른 구축과 운영을 위해 결정되어야 할 다양한 규격들의 표준화에 관한 연구를 수행하였다. 이를 위해 GNSS 상시관측소를 구성하는 구조와 장비 및 데이터 품질 등 다양한 부분에 대한 표준 규격을 제시하였다. 이와 더불어, 국내 GNSS 상시관측소의 표준화 항목 중 데이터 품질평가 기준을 경험적으로 결정하는 방법을 다루었다. 경험적이고 통계적인 접근방법을 통해 GNSS 상시관측소 데이터의 품질평가 기준값을 결정하기 위하여 전 지구상에 분포된 다수의 GNSS 상시관측소에서 취득한 데이터에 대한 품질평가를 수행하였으며, 이를 통계적으로 분석하여 GNSS 데이터가 갖추어야 하는 품질기준을 시범적으로 결정하였다. 이를 위해 각 품질평가 지수에 대한 방대한 크기의 표본을 형성하고, 각 표본의 분포를 고려하여 GNSS 상시관측소의 데이터 품질평가에 적용할 수 있는 일반기준과 권고기준을 결정하였다. 본 연구의 결과는 국내 GNSS 상시관측소의 표준적이고 정밀한 데이터의 취득과 서비스 운영을 위한 다양한 연구에 활용될 수 있을 것으로 기대된다

오류 데이터로부터의 데이터 품질 메트릭의 정립 (Establishing Data Quality Metric from Dirty Data)

  • 김수경;최병주
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.409-411
    • /
    • 2000
  • 소프트웨어 제품의 품질을 보증하는 일은 매우 중요하며, 국제 표준인 ISO/IEC9126은 소프트웨어 품질 특성 및 측적 메트릭 표준을 제공하고 있다. 이때 ISO/IEC 9126에서는 소프트웨어를 프로그램, 절차, 규칙 및 관련문서로 한정하고 있기 때문에 데이터의 품질에는 적용할 수 없다. 본 논문에서는 데이터 품질 평가 및 제어를 위하여 오류 데이터 형태를 분류하고, 이를 기반으로 데이터 품질 특성을 추출한다. 추출된 데이터 품질 특성을 측정하기 위해, 오류 데이터를 품질 속성으로 하는 데이터 품질 특성을 추출한다. 본 논문에서 제시하는 데이터 품질 메트릭은 지식 공학(knowledge engineering) 시스템이 최종 사용자에게 제공하는 데이터나 지식의 품질 측정 및 제어에 기준이 된다.

  • PDF

데이터 오류에서 추출한 데이터 품질 특성 (Extraction of Data Quality Characteristics from Dirty Data)

  • 김수경;최병주
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (A)
    • /
    • pp.549-551
    • /
    • 2000
  • 소프트웨어 제품의 품질을 보증하는 일은 매우 중요하며, 국제표준인 ISO/IEC 9126은 소프트웨어 품질 및 특성 및 측정 메트릭 표준을 제공하고 있다. 이때 ISO/IEC 9126에서는 소프트웨어를 프로그램, 절차, 규칙 및 관련문서로 한정하고 있기 때문에 데이터의 품질에는 적용할 수 없다. 본 논문에서는 데이터 품질 평가 및 제어를 위하여 데이터 오류 형태를 분류하고, 이를 기반으로 데이트 품질 특성 및 부특성을 분류한다. 데이터 품질 특성 분류는 ISO/IEC 9126에 정의한 소프트웨어 품질 특성을 데이터 오류 형태에 대응시켜 추출한다. 본 논문에서 제시하는 데이트 품질특성 분류는 지식 공학(knowledge engineering)시스템이 최종 사용자에게 제공하는 데이터나 지식의 품질 측정 및 제어에 기준이 된다.

  • PDF

게임의 멀티미디어 데이터 품질평가지표 연구 (A study of Multimedia Data Quality Evaluation Metrics of the Game)

  • 윤선정
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권9호
    • /
    • pp.63-70
    • /
    • 2013
  • 게임의 멀티미디어 데이터는 그 품질에 따라 게임의 몰입에 영향을 준다. 예술적인 품질은 평가기준을 설계하기가 어렵지만 기술적인 관점에서 평가할 수 있는 부분에 대해서는 평가기준을 설계하는 것이 품질의 신뢰성과 객관성을 확보할 수 있다. 그러나 게임의 멀티미디어 데이터에 대한 품질평가 기준은 아직 설계된 것이 없다. 따라서 본 연구에서는 게임의 멀티미디어 데이터에 대한 품질평가 요소를 추출하고, 추출 요소에 대한 신뢰성을 검증하였다. 그리고 각 요소에 대한세부평가내용을 정의하고, 평가지표를 개발하였다. 본 연구의 결과는 고품질의게임 개발에 가이드 역할을 하며 게임산업의 성장에 긍정적인 영향을 줄 것으로 기대한다.

Proposal of Public Data Quality Management Level Evaluation Domain Rule Mapping Model

  • Jeong, Ha-Na;Kim, Jae-Woong;Chung, Young-Suk
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권12호
    • /
    • pp.189-195
    • /
    • 2022
  • 정부는 공공데이터의 민간 개방, 활용을 장려함으로써 신산업, 일자리 창출 등 창조경제 활성화에 기여하는 것을 주요 국정과제로 삼고 있다. 그리고 고품질 공공데이터 보유를 위해 공공데이터 품질관리 수준평가 진행 등의 활동을 통해 공공데이터 품질 향상을 도모하고 있다. 그러나 품질진단 도구 사용자의 데이터 전문성, 이해도에 따라 공공데이터 품질관리 수준평가 결과에 격차가 발생하기 때문에 진단 결과의 정확성을 보장하기 어렵다. 본 논문은 데이터 이해도가 낮은 사용자의 진단 결과에 대한 정확성을 보장하기 위해 데이터 품질진단 기준 중 유효성 진단에 적용 가능한 공공데이터 품질관리 수준평가 도메인규칙 매핑 모델을 제안하였다. 또한 모델에 실제 데이터를 적용한 결과 공공데이터 품질진단의 안정성과 정확성을 높이는 것을 확인하였다.