• 제목/요약/키워드: 데이터품질관리

검색결과 844건 처리시간 0.035초

공공데이터 품질진단 지원을 위한 진단규칙 매핑모델 제안 (Proposal of diagnosis rule mapping model to support public data quality diagnosis)

  • 정하나;김재웅;이윤열;채의근;정영석
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.127-128
    • /
    • 2022
  • 정부는 공공데이터 개방을 통해 신산업, 일자리 창출 등 경제 활성화를 위한 도구로 활용하는 것을 목표로 한다. 정부는 고품질의 공공데이터 보유를 위하여 품질 개선 활동을 통해 공공데이터 품질 향상을 진행하고 있다. 그러나 공공데이터 품질관리 수준 진단을 진행하는 담당자의 데이터에 대한 전문성과 이해도에 따라 품질진단 결과에 격차가 발생하여 진단 결과의 신뢰성을 보장하기 어렵다. 본 논문은 공공데이터의 원활한 품질진단 지원을 위해 품질진단규칙 매핑 모델을 제안하여 공공데이터 품질진단의 안정성과 신뢰성을 높인다.

  • PDF

연구데이터 관점에서 본 거대언어모델 품질 평가 기준 제언 (A Proposal of Evaluation of Large Language Models Built Based on Research Data)

  • 한나은;서수정;엄정호
    • 정보관리학회지
    • /
    • 제40권3호
    • /
    • pp.77-98
    • /
    • 2023
  • 본 연구는 지금까지 제안된 거대언어모델 가운데 LLaMA 및 LLaMA 기반 모델과 같이 연구데이터를 주요 사전학습데이터로 활용한 모델의 데이터 품질에 중점을 두어 현재의 평가 기준을 분석하고 연구데이터의 관점에서 품질 평가 기준을 제안하였다. 이를 위해 데이터 품질 평가 요인 중 유효성, 기능성, 신뢰성을 중심으로 품질 평가를 논의하였으며, 거대언어모델의 특성 및 한계점을 이해하기 위해 LLaMA, Alpaca, Vicuna, ChatGPT 모델을 비교하였다. 현재 광범위하게 활용되는 거대언어모델의 평가 기준을 분석하기 위해 Holistic Evaluation for Language Models를 중심으로 평가 기준을 살펴본 후 한계점을 논의하였다. 이를 바탕으로 본 연구는 연구데이터를 주요 사전학습데이터로 활용한 거대언어모델을 대상으로 한 품질 평가 기준을 제시하고 추후 개발 방향을 논의하였으며, 이는 거대언어모델의 발전 방향을 위한 지식 기반을 제공하는데 의의를 갖는다.

활동능력수준 기반의 공공데이터 품질관리 성숙수준 평가 모델 (Activity Capability Level-based Maturity Evaluation Model for Public Data Quality Management)

  • 김선호;이진우;이창수
    • 정보화정책
    • /
    • 제24권1호
    • /
    • pp.30-47
    • /
    • 2017
  • 정부는 공공데이터의 품질관리 수준을 평가하기 위해 국제표준을 기반으로 공공데이터 품질관리 조직 성숙도 모델을 개발하였다. 그러나 현장에 적용하기에는 평가항목이 너무 많다는 지적에 따라 평가지표 수를 축소한 새로운 모델을 보완 개발하였다. 이를 위하여 프로세스를 통합 및 조정하여 프로세스 수를 축소하였으며 프로세스능력수준이 아닌 새로운 활동능력수준 기반의 평가 방식을 제안하였다. 또한, 공공데이터 품질관리 성숙수준을 다섯 개의 레벨로 표현하는 방식과 1~5 사이의 실수로 표현하는 방식을 제안하였다. 그리고 새로 제안한 모델의 특성을 기존의 조직 성숙도 모델과 비교 분석하였다.

빅데이터 품질이 기업의 경영성과에 미치는 영향에 관한 연구 (A study on the Effect of Big Data Quality on Corporate Management Performance)

  • 이충형;김영준
    • 한국융합학회논문지
    • /
    • 제12권8호
    • /
    • pp.245-256
    • /
    • 2021
  • 4차산업혁명시대에 정보통신기술의 비약적인 발전, 고객구매 성향의 다양함, 복잡함은 산업 전체적으로 데이터의 양적 중가를 가져와 '빅데이터' 시대를 맞이하게 되었다. 빅데이터 시대는 데이터를 분석, 활용하여 기업의 전략적 의사결정에 활용하는 것이 기업의 핵심 역량으로 자리 잡게 되었다. 하지만 현재 빅데이터 연구들은 기술적 이슈와 미래 잠재 가치 중심이었다. 반면 기업이 보유한 내.외부 고객 빅데이터의 품질 및 활용 수준관리에 대한 연구와 논의는 부족하였다. 본 연구에서는 기업의 내.외부 빅데이터 품질관리 정보시스템 측면와 품질경영 측면으로 인식하여 영향요인을 도출하였다. 또한 빅데이터 품질관리, 빅데이터 활용 및 수준관리가 기업의 업무 효율화와 기업 경영성과에 유의한 영향을 미치는지 204명의 임직원 설문을 통해 조사하였고, 가설을 설정하여 검증하였다. 연구결과 경영층의 지원, 개인 혁신성, 경영환경변화, 빅데이터 품질활용 지표관리, 빅데이터 거버넌스 체계 마련이 기업 경영성과에 유의한 영향을 미쳤다.

GPS 데이터 품질관리 프로그램의 개발 (Developement of GPS Data Quality Control Program)

  • 윤홍식;이동하;이영균;조재명
    • 한국측량학회지
    • /
    • 제24권1호
    • /
    • pp.9-18
    • /
    • 2006
  • 본 연구는 GPS 데이터 해석 시 정밀도를 높이고 현장에서 관측시간 내 GPS 측량의 적절성 및 재측 여부 등을 직접 결정할 수 있도록 GPS 데이터 품질관리 프로그램을 개발하는 것에 그 목적이 있다. 본 연구에서 개발된 GPS_QC 프로그램은 관측시간 내 위성의 기하학적 배치(DOP)와 다중경로 오차량, 전리층 지연량 및 사이클 슬립 등의 품질관리 인자(quality control parameters)를 RINEX 형식의 GPS 관측데이터로부터 직접 계산이 가능하도록 설계되었으며, 이러한 품질관리 인자는 시계열 형태와 그래프로 제공된다. GPS_QC 프로그램은 일반 사용자들이 다루기 어려웠던 기존의 복잡한 GPS 데이터 품질 확인을 간편하게 수행할 수 있도록 함으로써 실제 현장에서 잘못된 GPS 관측에 따른 재측여부 등을 직접 결정할 수 있게 함으로써 시간적 경제적 손실을 절감시키고, GPS 위치해석 시 정밀도를 높일 수 있을 것으로 판단된다.

유통 상품의 데이터 품질 관리를 위한 데이터 표준화에 대한 연구 (An Empirical Study on Quality Improvement by Data Standardization for Distributed Goods)

  • 송장섭;류성렬
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권9호
    • /
    • pp.101-109
    • /
    • 2013
  • 데이터 품질 관리는 매우 중요하다. 본 연구는 효율적인 기업 데이터의 품질 관리를 위한 데이터 표준화 설계를 유통 상품 사례로 구축 방안을 제시하고 그 효과를 검증 하였다. 데이터 표준화 설계 방안으로 데이터 표준화 체계와 데이터 사전을 설계 하였다. 데이터 표준화 체계 설계를 위하여 데이터를 분류, 속성, 식별하였으며, 데이터 사전 설계를 위하여 데이터 사전 설계 프로세스와 단어 용어 도메인 코드사전을 구축하고, 데이터 표준화 설계 방안을 제시하였다. 제시한 데이터 표준화 방안의 효율성을 정량적, 정성적 방법으로 검증한 결과데이터표준화로 인한 데이터 품질은 24% 및 데이터 사전의 속성 설계인 일관성에 대한 데이터의 구조적 품질은 7% 향상되고, 유효함을 입증하였다.

Embedded SW의 품질 측정 프로세스 관리 방법에 관한 연구 (Quality Measurement Process Management Using Defect Data of Embedded SW)

  • 박복남
    • 한국IT서비스학회:학술대회논문집
    • /
    • 한국IT서비스학회 2003년도 추계학술대회
    • /
    • pp.713-721
    • /
    • 2003
  • Embedded 소프트웨어의 품길 측정 프로세스 관리는 Embedded 시스템의 적시성과 품질 만족을 위해서도 필요하다. 그러나, Embedded 소프트웨어의 결함에 대하여 사전 분석하거나 예측 없이 개발 프로세스 상에서 결함을 관리하는 것은 위험이 따른다. 본 연구에서는 Embedded 소프트웨어에서 품질 측정 프로세스 관리를 위해 소프트웨어의 정량적 속성 중에 가장 중요한 요소 중에 하나인 결함을 중심으로 본 연구가 진행되었다. Embedded 소프트웨어에 가장 적합한 프로세스를 정의하고 개선하고자 하는 과정에서, 프로세스 관리를 효과적으로 수행하기 위해 Embedded 소프트웨어의 특성과 결함 특성을 이해하고, 이를 근간으로 결함 속성을 정의하고 결함을 통한 품질 측정 프로세스 관리를 할 수 있도록, 결함 데이터를 이용하여 프로세스를 관리하는데 기여하고자 한다. 따라서, 본 연구에서는 결함 데이터 분석을 위해 필요한 속성을 파악하고, 테스트 단계를 중심으로 결함 데이터의 활용과 결함데이터를 이용한 프로세스 관리 방법을 제안하여, 이를 통해 Embedded 소프트웨어 프로세스를 관리하는 분들에게 효과적인 활용이 될 수 있도록 한다.

  • PDF

실시간 지진데이터 품질향상을 위한 연구 (A Study on the Quality Improvement of Real-Time Earthquake Data)

  • 윤진섭;류세환;정지은;박지민
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.306-309
    • /
    • 2022
  • 최근 우리나라에서도 지진 발생빈도가 급격히 증가하면서 지진에 대한 관심도가 높아지고 있다. 지진발생 시 대응과 복구도 중요하지만, 관리 취약점을 사전에 찾아내어 예방 및 사전 대비 활동을 수행하는 것이 필요하다. 한국수자원공사에서는 지진으로부터 안전한 시설관리를 위해 지진가속도계측기를 운영하여 실시간 지진데이터를 수집하고 있으며, 대외기관에서 지진데이터를 활용할 수 있도록 데이터를 전송하고 있다. 운영 중인 지진감시시스템의 관리 취약점을 사전에 줄이고자 지진데이터의 수집지연시간을 최소화하고, 빅데이터를 활용한 지진데이터의 실시간 품질분석 체계·기반 구축으로 고품질의 데이터 생산이 가능하다. 이에 따라 댐 안전관리 및 고품질의 지진데이터를 확보하여 대외기관에 신속한 데이터를 제공함으로써 지진재해로부터 국민의 생명과 재산을 보호할 수 있을 것으로 기대된다.

  • PDF

정보 품질 성숙도 모델에 관한 연구 (Case Study for Information Quality Maturity Model)

  • 김창재;최용락;류성열
    • 정보처리학회논문지D
    • /
    • 제13D권4호
    • /
    • pp.557-564
    • /
    • 2006
  • 정보는 효과적으로 활용되어 이윤 창출에 기여하고, 신속하고 올바른 경영 판단을 지원하며, 재사용이 가능해야 하는 중요한 자원이다. 최근의 정보 시스템들은 사용자들의 다양한 요구를 반영하여 기업의 경쟁력을 높이고, 급변하는 환경 변화에 적응하기 위해 점차 대형화, 복잡화 되고 있으며 정보 품질의 중요성도 점차 강조 되고 있는 추세이다. 사용자들이 원하는 정보 제공에 있어 가장 큰 문제점은 저 품질의 데이터를 기반으로 하는 낮은 품질의 정보 제공에 있다. 낮은 정보 품질에 의해 기업 경영이 이루어질 경우 기업의 전략 수립, 전략 수행, 고객과 경쟁 기업에 대한 경영 집중력 분산 등 기업의 경영에 있어 경쟁력이 떨어 질 수밖에 없다. 낮은 품질의 정보는 부정확한 데이터를 개선하거나 조정하기 위한 시간 및 비용을 증가 시키고, 특정 현황에 대한 정확한 정보를 제공 받기가 어려워진다. 이러한 문제점들을 해결하기 위해서는 데이터에 대한 명확한 이해, 데이터 관리 체계 확립, 그리고 체계적인 데이터 관리 수행 등을 통하여 고품질의 데이터를 획득 할 수 있게 해야 한다. 현재까지 정보 품질과 관련된 연구 및 방법론은 부분적으로 진전이 있으나, 정보 품질 관리 전반에 대한 체계적인 방법론은 존재하지 않는 실정이다. 따라서 본 논문에서는 정보 품질 관리를 위한 프로세스들을 도출하고 정보 품질과 관련된 평가 요소를 도출하여 이를 정보 품질 보증 프로세스 단계인 CMM(Capacity Maturity Mode]) 5단계를 참조하여 제시한다. 본 논문은 정보 품질 개선 관리 프로세스 정립을 통해 기업의 정보 품질 관련 전략을 수립 하고, 경쟁력 있는 기업 또는 조직 활동에 이바지 하며, 품질 좋은 정보 활용에 따른 경쟁력 있는 운영에 이바지 하고자한다.

비정형데이터의 AI학습을 위한 영상/이미지 데이터 품질 향상 방법 (Method for improving video/image data quality for AI learning of unstructured data)

  • 김승희;류동주
    • 융합보안논문지
    • /
    • 제23권2호
    • /
    • pp.55-66
    • /
    • 2023
  • 최근 전세계적으로 사회 모든 분야에서 인공지능 학습용 데이터에 관한 선행연구를 기반으로, 인공지능 학습용 데이터의 가치를 높이고 고품질 데이터를 확보하고자 하는 움직임이 늘고 있다. 따라서, 고품질 데이터를 확보하기 위한 구축사업에서는 품질관리가 매우 중요하다. 이에, 본 논문에서는 인공지능 학습용 데이터를 구축할 시 고품질데이터 확보를 위한 품질관리와 그에 따른 구축공정별 개선방안을 제시하였다. 특히, 인공지능 학습을 위해 구축되는 비정형데이터는 데이터 품질의 80% 이상이 구축과정에서 결정된다. 본 논문에서는 비정형데이터 이미지/영상데이터에 대한 품질검사를 통해 구축단계에서의 획득, data cleaning, labeling 모델에서 발생된 검사절차 및 문제 요소를 해결함으로써 고품질 데이터 확보 방안을 제시하였으며, 제시한 방안을 토대로 인공지능 학습용 데이터 구축에 참여하는 연구단체와 사업자들에게 데이터의 품질편차를 극복하기 위한 대안이 될 것으로 기대된다.